AWS傳出延續與高通合作採用Qualcomm AI200晶片,旨在提供更具經濟效益的推論服務
當AI的需求從背後的AI模型訓練轉向大規模的推論落地,雲端服務商也著手尋求更具經濟效益的推論解決方案;根據Wells Fargo富國銀行集團的調查研究,亞馬遜AWS有望進一步與高通強化合作,並成為高通AI200晶片的大客戶,希冀透過採用Qualcomm AI200降低推論成本提高利潤。
比AI100 Ultra更具成本效益的AI200
$QCOM Wells Fargo:
— Sean (@sean_________) June 12, 2026
“Based on company comments / our analysis, we see AWS as the potential lead hyperscale ASIC partner” https://t.co/KSwMdKjoG6 pic.twitter.com/gW12N649cs
Qualcomm AI200是高通新一代的推論加速晶片,著重支援語言模型推論,單一晶片搭配高達768GB的記憶體,使其成為推論應用的利器;根據富國銀行分析,AI200的每gigawatt部署成本約35億美金,並可帶來每股2.5美金的收益,不過仍取決在高通能為每個機架提供的AI200加速器的數量。
原本就是高通AI方案的客戶但有望成AI200主要客戶

亞馬遜AWS原本就已經導入高通的Qualcomm AI100 Ultra,不過隨著新一代AI模型更迭,加上當前雲端服務已經邁入推論服務的新戰場,AWS正尋求可降低推論成本設法提升利潤的新方案,根據高通執行長Cristian Amon先前已透露將有大型雲端服務商作為Qualcomm AI200的大客戶,使得富國銀行認為高通大客戶即是AWS。
AI工廠新時代
隨著AI推論需求的激增,雲端服務商也在尋求全新的計價方式與提升利潤的方式,其中採用更具效益的推論設備就是最主要的手段,也是如NVIDIA選擇入主Groq並把Groq納入Vera Rubin平台的原因;富國銀行指稱AWS相當積極尋求高效率的推論晶片,尤其當前EC2的AI100 Ultra相對其它雲服務商業者的每小時FLOPS的成本較高。
由於高通預計在2026年6月底的紐約投資者日公布更多AI平台計畫,也許屆時就會看到高通正式宣布Qualcomm AI200的合作夥伴。除了已經確定會導入高通方案的沙烏地阿拉伯的HUMAIN以及富國銀行預測的AWS以外,另一個傳出將採用Qualcomm AI200的客戶則是字節跳動。