普通视图

发现新文章,点击刷新页面。
昨天以前首页

AWS傳出延續與高通合作採用Qualcomm AI200晶片,旨在提供更具經濟效益的推論服務

作者 Chevelle.fu
2026年6月15日 13:49

當AI的需求從背後的AI模型訓練轉向大規模的推論落地,雲端服務商也著手尋求更具經濟效益的推論解決方案;根據Wells Fargo富國銀行集團的調查研究,亞馬遜AWS有望進一步與高通強化合作,並成為高通AI200晶片的大客戶,希冀透過採用Qualcomm AI200降低推論成本提高利潤。

比AI100 Ultra更具成本效益的AI200

$QCOM Wells Fargo:

“Based on company comments / our analysis, we see AWS as the potential lead hyperscale ASIC partner” https://t.co/KSwMdKjoG6 pic.twitter.com/gW12N649cs

— Sean (@sean_________) June 12, 2026

Qualcomm AI200是高通新一代的推論加速晶片,著重支援語言模型推論,單一晶片搭配高達768GB的記憶體,使其成為推論應用的利器;根據富國銀行分析,AI200的每gigawatt部署成本約35億美金,並可帶來每股2.5美金的收益,不過仍取決在高通能為每個機架提供的AI200加速器的數量。

原本就是高通AI方案的客戶但有望成AI200主要客戶

▲高通預計在2026年內推出Qualcomm AI200,是一款配有768GB的推論加速器產品

亞馬遜AWS原本就已經導入高通的Qualcomm AI100 Ultra,不過隨著新一代AI模型更迭,加上當前雲端服務已經邁入推論服務的新戰場,AWS正尋求可降低推論成本設法提升利潤的新方案,根據高通執行長Cristian Amon先前已透露將有大型雲端服務商作為Qualcomm AI200的大客戶,使得富國銀行認為高通大客戶即是AWS。

AI工廠新時代

隨著AI推論需求的激增,雲端服務商也在尋求全新的計價方式與提升利潤的方式,其中採用更具效益的推論設備就是最主要的手段,也是如NVIDIA選擇入主Groq並把Groq納入Vera Rubin平台的原因;富國銀行指稱AWS相當積極尋求高效率的推論晶片,尤其當前EC2的AI100 Ultra相對其它雲服務商業者的每小時FLOPS的成本較高。

由於高通預計在2026年6月底的紐約投資者日公布更多AI平台計畫,也許屆時就會看到高通正式宣布Qualcomm AI200的合作夥伴。除了已經確定會導入高通方案的沙烏地阿拉伯的HUMAIN以及富國銀行預測的AWS以外,另一個傳出將採用Qualcomm AI200的客戶則是字節跳動。

❌
❌