阅读视图

发现新文章,点击刷新页面。

駭客不需駭入系統,只要讓你的 AI 客服讀一封信:趨勢科技 TrendAI 揭三大攻擊型態升級

駭客不需駭入系統,只要讓你的 AI 客服讀一封信:趨勢科技 TrendAI 揭三大攻擊型態升級

隨著 AI 技術演進,企業希望盡快導入 AI 驅動創新,卻也面臨風險控管的兩難。趨勢科技旗下 TrendAI 調查,74% 的台灣受訪企業決策者坦言,過去曾在高層要求或市場競爭壓力下,被迫核准在企業導入可能帶來資安風險的 AI 方案;同時只有不到一半的企業認為內部團隊能辨識惡意或異常的 AI 行為,顯示台灣企業正面臨「盲目導入 AI」的高度風險。

不過,究竟企業當前面對的是什麼樣的資安風險、該如何應對?TrendAI 勾勒出三大威脅升級的具體樣態,提醒企業留意。

威脅升級一:假資訊與詐騙內容的大規模生產

TrendAI 威脅研究總監 Ryan Flores 指出,自從 2022 年底 ChatGPT 問世以來,垃圾郵件數量大幅增加了 1,000%,且預計到今年底,網路上的 90% 內容將由 AI 生成。他表示,駭客利用 AI 發動的攻擊也將變得更低成本,更具可擴展性。

TrendAI 實測,只需花費一週與不到 20 塊美金的 AI 影片生成訂閱費,不需親手撰寫程式碼,就能利用無程式碼(No-code)工具串接,在電商平台上創造出完美的「假賣家、假商品、假買家評論影片」,如此一來便可能輕鬆實現大規模詐騙。

威脅升級二:身分偽造進化,企業招募與信任機制面臨新挑戰

TrendAI 也觀察到,已有北韓駭客利用竊取而來的 LinkedIn、GitHub 等公開資料,搭配大型語言模型與深偽技術,偽裝成遠距 IT 工作者應聘。一旦錄取成為內部員工,其就會進行資料竊取、部署勒索軟體,或盜取資產。「一旦他們成為員工,基本上就成為內部威脅,所以可以進行橫向移動。」Flores 說。

駭客也會架設「假公司」發布職缺,要求求職者下載包含惡意軟體的面試測試包,反向盜取求職者的資產與身份,甚至劫持真實帳號。

威脅升級三:AI 原生攻擊工具與 AI 系統濫用,突破傳統限制

值得關注的是,隨著大型語言模型運算能力躍進,TrendAI 觀察到駭客攻擊手法已突破傳統技術限制,例如近期 LameHug 等惡意工具,便刻意偽裝成圖像生成應用,實際上是內嵌 LLM 運算能力,讓攻擊者只需透過提示指令下達意圖,模型就可以自動編譯並執行惡意指令。TrendAI 強調,這樣的攻擊能使單一軟體無縫跨越 Windows、Mac 與 Linux 多重作業系統的限制而發動攻擊。

Flores 表示,這種威脅的恐怖之處在於,未來的惡意軟體可能不再有固定程式碼,只要用「提示詞(Prompts)」就能由 AI 針對不同作業系統自動調整攻擊語法。

Flores 也提到,企業內部的 AI 系統例如智能客服、自助查詢或自動化流程平台,也可能成為「提示詞注入(Prompt Injection)」的跳板,成為新威脅。駭客只需在發給客服的信件中隱藏特殊指令,當企業的 AI 讀取該信件時,就會被誘騙去執行超出預期的動作,整個攻擊過程不需要駭入系統或寫入任何程式碼。

TrendAI 呼籲企業建立治理框架,善用整合能力工具

由上述威脅樣態可見,傳統防禦機制已能被生成式 AI 輕易破解。但 Flores 呼籲,儘管 AI 技術屢遭駭客濫用,AI 仍是驅動產業變革的時代創新,而面對 AI 時代的威脅,建立完善的安全機制與治理框架將成為企業相當重要的議題。他建議,企業應採用智慧的資安事件管理(Security Information and Event Management,SIEM),得以將碎片化數據資料轉化為一致語言,並有效分析串聯跨系統資訊,加速判斷與決策效率。

舉例來說,面對暴增的威脅日誌,可利用 AI 擅長「翻譯」的特性,將不同設備與系統的日誌格式統一並進行關聯分析,幫助資安人員從海量數據中找出最高風險的事件,在規模上提供幫助。

TrendAI 台灣暨香港區總經理洪偉淦在接受媒體訪問時,補充了企業導入 AI 代理時必須思考的兩個關鍵原則。第一是慎選大型語言模型,因為現在有許多開源或號稱免費的語言模型,但背後可能隱含未知資安風險,因此需要審慎評估。第二是權限控管,企業在設計 AI 系統時,就必須設定極為明確的框架與權限範圍,以防 AI 遭駭客利用。

洪偉淦指出,「我們觀察多數台灣企業的資安架構仍停留在過去以工具與規則為核心的模式。而在 AI 時代的競爭關鍵,不在於誰擁有最完整的資安工具,而在於誰能最快理解風險、做出決策」。

*首圖來源:《TechOrange》拍攝。

英特爾挖角高通 24 年老將下一步:PC 不再只是電腦,而是實體 AI 入口

英特爾挖角高通 24 年老將下一步:PC 不再只是電腦,而是實體 AI 入口

英特爾在本週宣布,延攬在高通任職逾 24 年的資深高階主管 Alex Katouzian 出任執行副總裁暨客戶端運算與實體 AI 事業群總經理,直接向執行長陳立武(Lip-Bu Tan)彙報,並預計於 5 月正式到職。

這項人事任命的意義,遠不止於補齊高階職缺,更象徵英特爾將傳統 PC 業務與快速興起的實體 AI 領域整合為一,押注 AI 應用重心從雲端訓練轉向終端推論的趨勢。

從 PC 到實體 AI,英特爾正在重新想像運算邏輯

Katouzian 在高通最近的職銜為行動、運算與延展實境事業群執行副總裁暨總經理,正是推動高通以 Snapdragon X 系列處理器切入 PC 市場的關鍵人物之一。這款晶片於 2024 年作為微軟 Copilot+ PC 品牌電腦的首發晶片登場,是高通向英特爾與 AMD 長期主導的 PC 市場發動的正面挑戰。

根據英特爾說法,Katouzian 接下來的首要任務,是將既有的客戶端運算業務,與涵蓋機器人、自主設備與各類 AI 裝置的實體 AI 系統整合發展。

陳立武指出,「AI 正在邊緣端創造前所未有的機會,並推動客戶端運算與實體 AI 系統發生重大轉變。」他認為,Katouzian 是帶領英特爾重新定義 PC 以外運算模式、銜接實體 AI 下一波成長的重要人選。

這代表英特爾的戰略已不再局限於 PC 市場本身,而是將 PC 視為整個 AI 生態的一部分,延伸至機器人、自動化設備與邊緣推論場景。

在組織架構上,原本直接向陳立武彙報的客戶端運算事業群負責人 Jim Johnson,以及矽晶與平台工程事業群負責人 Mike Hurley,將改為向 Katouzian 彙報。Johnson 是擁有 40 年資歷的英特爾老將,於去年 9 月獲陳立武任命領導客戶端運算事業群;Hurley 則是長期工程主管,同樣是陳立武上任後的重要部署。

同日,英特爾也宣布由 Pushkar Ranade 正式出任技術長,結束過去數月的代理任期。Ranade 的職責涵蓋推動技術策略、監督與馬斯克旗下 xAI 合作的 Terafab 等特殊技術專案,以及量子運算、神經型態運算、光子學與新型材料等前沿領域的發展。

PC 角色轉型,從終端設備到 AI 節點

Katouzian 的職掌範圍反映出英特爾對邊緣推論商機的戰略判斷。《CRN》報導,陳立武在內部備忘錄中指出,英特爾已經重新站回 AI 競賽的核心,並在邊緣運算與實體 AI 系統領域看到大量新機會。

英特爾目前已在這個方向有所布局,包括推出 Intel Robotics AI Suite,旨在為現有 x86 機器人部署新增能力,且無需進行高成本的系統翻修。Katouzian 本人也在聲明中表示,英特爾正在為 AI 驅動的轉型奠定基礎,涵蓋 AI PC 領先地位的鞏固、邊緣 AI 推論的規模化,以及實體 AI 系統未來的加速發展。

通路商看見「解決方案的解決方案」商機

對於這項人事變動,英特爾的系統整合合作夥伴反應正面。總部位於南達科他州北蘇城、曾獲英特爾北美夥伴獎的 Sterling Computers 技術長 Christopher Cyr 告訴《CRN》,延攬 Katouzian 的決策符合邏輯,因為英特爾正加大力度降低晶片功耗,而這正是高通長期具有競爭優勢的領域,在推論運算成為 AI 商機主戰場的趨勢下尤為重要。

Cyr 進一步指出,實體 AI 為通路夥伴帶來的商機規模可觀,「這是一個解決方案的解決方案,」他說:「你需要軟體、你需要晶片組,還要考量所在的產業,無論是製造業還是物流業,我認為夥伴有大量機會。」這番話點出了 AI 商機的結構性轉變:對通路商與系統整合商而言,AI 已不再是單一硬體產品的採購,而是涵蓋晶片、軟體與垂直產業應用的整體解決方案市場。

*本文開放合作夥伴轉載,資料來源:《CRN》《Reuters》Intel,首圖來源:Intel,左為 Alex Katouzian、右為 Pushkar Ranade。

Google 內測 Remy、Meta 開發 Hatch:OpenClaw 爆紅後,科技巨頭下一戰已悄然開打

Google 內測 Remy、Meta 開發 Hatch:OpenClaw 爆紅後,科技巨頭下一戰已悄然開打

OpenClaw 今年爆紅後,「幫人直接做事」的 AI 代理已快速成為矽谷的下一個主戰場, NVIDIA 執行長黃仁勳日前更指出「每家公司都需要有 OpenClaw 策略」。根據外媒消息,Google 和 Meta 就正在開發類似於 OpenClaw 的 AI 代理工具。這兩家科技巨頭的動向,指向同一個方向:AI 競爭的重心,正從回答問題的聊天機器人,升級為主動替使用者完成任務的個人代理。

Google 內測「Remy」,定位為全天候個人代理

據《Business Insider》取得的一份 Google 內部文件,以及兩位熟悉此事的人士透露,Google 正在一個僅供員工使用的 Gemini 應用版本中測試名為「Remy」的 AI 代理。文件中對 Remy 的描述為:「Remy 是你在工作、學校與日常生活中全天候的個人代理,由 Gemini 驅動。它將 Gemini 應用提升為一個真正的助理,能夠代替你採取行動,而不只是回答問題或生成內容。」

文件進一步指出,Remy 與 Gmail、Chrome、Calendar 等 Google 旗下服務深度整合,能夠主動監控使用者關注的事項、處理複雜任務,並隨時間學習使用者的偏好。《Business Insider》指出在某方面,Remy 與 OpenClaw 類似,功能在定位上明顯比 Google 目前已推出的「Agent Mode」等工具更為進階。Google 發言人婉拒對此置評,也尚未透露 Remy 的公開上線時程。Google 將於本月稍後舉行 I/O 開發者大會,外界預計 AI 代理將是展示重點之一。

Meta 開發「Hatch」,先用 Anthropic 模型訓練

Meta 方面,據《The Information》報導,Meta 正在開發一款代號「Hatch」的 AI 代理,目標是在 6 月底前完成內部測試。知情人士透露,Hatch 的設計靈感源自 OpenClaw,目前以 Anthropic 的 Claude Opus 4.6 與 Claude Sonnet 4.6 模型驅動,正式上線後將改由 Meta 自家最新模型 Muse Spark 提供支援。為了訓練 Hatch,Meta 已建立包含 DoorDash、Etsy、Reddit、Yelp 與 Outlook 等真實網站的模擬環境進行測試。

Meta 執行長 Mark Zuckerberg 在上週的財報電話會議中表示,OpenClaw 對大多數使用者而言仍過於複雜,Meta 想解決的問題是:「如何打造一個更精緻、更易用的版本,讓所有基礎設施都已就位,讓一切直接能用?」他也補充,市場上雖已有多款代理工具,但「沒有多少是我願意介紹給我媽媽用的」。

《金融時報》援引知情人士透露,Meta 的目標是打造一款高度個人化的 AI 助理,允許使用者自行選擇是否與助理共享健康與財務等敏感資料。不過,其中一位知情人士也坦言,消費者是否願意信任 Meta 處理這類資訊,目前仍是未知數,直言雙方存在「巨大的信任赤字」。

OpenClaw 是催化劑,下一戰是個人 AI 代理的入口之爭

OpenClaw 並非第一款 AI 代理工具,但它的爆紅已成為這場競賽的市場催化劑。今年 2 月,OpenClaw 轉為基金會架構運作、由 OpenAI 提供資金支持,其創辦人 Peter Steinberger 則加入 OpenAI。Meta 與 Google 隨後相繼傳出內部研發類似工具的消息,顯示整個產業已將「個人 AI 代理」視為下一個必爭的使用者入口。

Wing Venture Capital 合夥人、Meta 前產品經理 Tanay Jaipuria 指出,OpenClaw 正在「激發人們的想像力」,但作為開源專案,它不太可能成為大眾市場產品。「Meta 正試圖打造那個能觸及 10 億用戶的版本,他們當然擁有這樣的分發能力,並且可以大力借助它。」他同時指出,若要以自家模型 Muse Spark 為基礎打造出有價值的產品,內部技術本身需要「至少具備競爭力」。

值得關注的是,Meta 去年 12 月以 20 億美元收購中國 AI 代理新創 Manus,但中國國家發展和改革委員會隨後要求 Meta 撤銷這筆交易,使這條外部補強的路線受阻。另一邊,Meta 在內部也已部署了名為「MyClaw」的員工用 AI 代理,但近期因員工遵循代理的錯誤建議,導致部分敏感公司與用戶資料遭未授權員工存取,已引發一起重大安全警報事件。

*本文開放合作夥伴轉載,資料來源:《Business Insider》《Financial Times》《The Information》,首圖來源:Unsplash

化敵為友的百萬瓦級交易:拆解 Anthropic 承租 SpaceX Colossus 1 背後的算力焦慮

化敵為友的百萬瓦級交易:拆解 Anthropic 承租 SpaceX Colossus 1 背後的算力焦慮

AI 在程式開發領域(AI coding)引發的熱潮,正以驚人的速度消耗全球算力資源,迫使 AI 新創加速擴張實體基礎設施。

Anthropic 在舊金山舉行的開發者大會上宣布,已與 SpaceX 達成協議,取得其位於美國田納西州曼菲斯的 Colossus 1 資料中心全部算力資源。根據協議,Anthropic 將獲得超過 22 萬顆 NVIDIA GPU 所對應的逾 300 MW 運算容量,並預計在一個月內到位。這筆交易的直接導火線,是 Anthropic 旗下 AI 程式碼生成工具 Claude Code 的需求急速暴增。

Claude Code 需求爆量,算力告急

根據 Anthropic 自身數據,目前平均每位開發者每週使用 Claude Code 的時間已達至少 20 小時,讓 Anthropic 的基礎設施承壓至極限。上個月,該公司坦承 Claude 的需求已導致「基礎設施不可避免的緊張」,影響到使用者的服務可靠性與效能,在尖峰時段尤為明顯。

為此,Anthropic 近期密集簽署算力協議。除這次 SpaceX 交易外,Anthropic 已承諾在未來十年向 Amazon 技術投入逾 1,000 億美元,並據《The Information》報導,另對 Google 的 AI 雲端服務與 TPU 晶片承諾高達 2,000 億美元的採購。此外,Anthropic 也與微軟及 NVIDIA 簽訂了提供 300 億美元 Azure 雲端容量的協議。該報導也指出,Anthropic 與 OpenAI 的合約,目前已佔 Amazon、微軟、Google 等主要雲端供應商合計逾 2 兆美元積壓訂單的半數以上。

借助 SpaceX 協議帶來的額外算力,Anthropic 進一步宣布將旗下付費方案的 Claude Code 速率限制提升一倍,取消 Pro 與 Max 方案的尖峰時段使用上限,並大幅提高開發者對 Claude Opus 模型 API 的每分鐘請求上限。

馬斯克從批評者變合作夥伴

這筆交易的達成,也代表馬斯克對 Anthropic 態度的大轉彎。今年 2 月,馬斯克曾在 X 平台上多次抨擊 Anthropic,指其 Claude 模型帶有偏見,並稱 Anthropic「必然走向與其名稱相反的結局」、「憎恨西方文明」。然而週三,馬斯克在 X 發文表示,他上週花了大量時間與 Anthropic 高層成員深入交流,了解他們如何確保 Claude 對人類有益,並對此印象深刻,「我遇到的每個人都非常能幹,非常在乎做正確的事。沒有人觸發我的惡意偵測器。」

馬斯克說明,SpaceX 已將自身的 AI 訓練工作移往 Colossus 2,因此得以將 Colossus 1 的算力租給 Anthropic。他也表示,只要其他 AI 公司同樣致力於對人類有益的發展,他願意以「公平條款與定價」提供算力,就如同 SpaceX 為競爭對手發射衛星一樣。

《Financial Times》指出,馬斯克創立的 xAI 公司與 OpenAI 和 Anthropic 是競爭關係,建立了前沿模型並已迅速建成資料中心,但由於 Grok 使用量仍落後 ChatGPT 與 Claude,導致馬斯克開始將多餘算力出租給其他 AI 公司,包括 Anthropic 與 Cursor。

Colossus 1 由 SpaceX 旗下的 xAI 建造,由租用前 Electrolux 廠址、耗時 122 天完工,配備涵蓋 H100、H200 至最新 GB200 系列的 NVIDIA GPU。不過,驅動該設施的天然氣渦輪機引發的空氣汙染問題,持續招致當地居民抗議。

「Dreaming」功能登場,AI coding 邁向持久性代理

除算力擴充外,Anthropic 在開發者大會上還以研究預覽版形式發布了名為「Dreaming」的新功能。這項功能設計用於協助 AI 系統在工作階段之間回顧已完成的工作、辨識模式,並更新儲存使用者偏好與相關情境的檔案,使 AI 代理能在不同工作階段之間延續記憶與學習。

Anthropic Claude Code 負責人 Boris Cherny 在大會主舞台展示了開發者可如何設定「例行程序」,讓 AI 程式設計師自動排程並主動執行任務。他描述這套工作邏輯的轉變:「預設不再是『我要提示 Claude Code』,預設現在是『讓 Claude 去提示 Claude Code』。」這說明,AI coding 正從單次生成的工具,進化為具備長期記憶與自主工作流程的持久性代理。Cherny 在主題演講結尾表示:「這種能力已經就位,剩下的差距是我們以多快的速度付諸實踐。」

討論太空資料中心,AI 基建競賽進入新維度

更瘋狂的是,Anthropic 和 SpaceX 已開始探討在太空建設資料中心的可能性。Anthropic 在公告中表示,對與 SpaceX 合作開發 GW 等級的軌道 AI 算力容量「表達了興趣」。背後原因其實很現實:AI 已開始面臨能源與電力瓶頸。

SpaceX 方面也在聲明中指出,訓練與運行下一代 AI 系統所需的算力,「正在超越地面電力、土地與冷卻系統在關鍵時間節點內所能提供的上限」。Flexential 資料中心執行長 Ryan Mallory 評論:「連嚴肅的公司都在討論太空算力容量這件事,已足以說明市場在多積極地尋找電力與規模。」

這場 Anthropic 與 SpaceXAI 的合作,其實揭露了一件更深層的事:AI coding 已不再只是功能,而是新的基礎設施戰爭。當 Claude Code、OpenAI Codex 與各類 agent 工具開始長時間自主執行任務,AI 的算力消耗模式也徹底改變。這筆交易,或許正是 AI 產業算力需求曲線走向下一階段的最早預告。

【推薦閱讀】

從 HBM4 到 Apple 供應鏈備援:三星獲利狂飆 48 倍,AI 正重新定價半導體產業

全球供應版圖重組!12 吋矽晶圓成關鍵戰場,中國力拚 70% 國產供應

Google 內測 Remy、Meta 開發 Hatch:OpenClaw 爆紅後,科技巨頭下一戰已悄然開打

*本文開放合作夥伴轉載,資料來源:《Reuters》《CNBC》《WIRED》Anthropic《Financial Times》《Business Insider》,首圖來源:Anthropic

Anthropic Mythos 太會找漏洞:Firefox 修補數暴增 13 倍,工程師坦言還沒有自動化解方

Anthropic Mythos 太會找漏洞:Firefox 修補數暴增 13 倍,工程師坦言還沒有自動化解方

今年 4 月,Anthropic 發布新 AI 模型 Mythos,但因擔心能力過於強大,可能遭到惡意人士濫用,目前僅開放約 40 家合作企業測試。Anthropic 執行長 Dario Amodei 本週更警告,Mythos 已在各類軟體中發現數萬個潛在漏洞,而產業可能只剩下 6 至 12 個月的修補窗口期。

在已獲授權測試的合作夥伴中,Mozilla Firefox 安全團隊公開了其與 Anthropic 的合作,提供了部分 AI 資安工具實戰紀錄,也直接揭示了 AI 技術的能耐與現實侷限。

修補漏洞從 31 個變 423 個,中間發生什麼事?

今年 2 月,Anthropic 就已將一批透過 Claude 模型在 Firefox 中發現的漏洞通報給 Mozilla。Mozilla 在修復這批問題後,以自有模糊測試基礎設施為底,建構了一套代理式漏洞掃描框架,後續並在框架中導入 Claude Mythos Preview 等模型,展開大規模掃描。

結果相當顯著,2026 年 4 月,Firefox 共修補了 423 個安全漏洞,相比 2025 年同期的 31 個,成長了 13 倍。這 423 個修補中,271 個由 Claude Mythos Preview 發現,41 個來自外部研究員通報,其餘 111 個則由其他內部方式發現,包括使用 Mythos 以外模型的代理框架,以及傳統模糊測試技術。在 271 個 Mythos 發現的漏洞中,180 個被評定為高嚴重性,80 個為中等嚴重性,11 個為低嚴重性。

Mozilla 研究員坦言,這場轉變來得出乎意料地快。「很難形容這個局面在幾個月內對我們改變了多少,」研究團隊在公開文章中寫道。他們將這一轉折歸因於兩個因素:模型能力的大幅躍升,以及他們自身在引導、擴展與堆疊模型技術上的進步。

挖出沉睡 15 至 20 年的漏洞,連沙箱都沒能倖免

在 Mythos 協助下,Mozilla 發現的漏洞不僅數量驚人,品質也大幅提升。Mozilla 表示,在此之前,AI 漏洞查找工具存在許多嚴重缺陷,導致安全團隊被大量誤報和低品質回報淹沒,但最新一代工具已經取得突破性進展。

Mozilla 公開了其中 12 個具代表性的案例,涵蓋多個不同的瀏覽器子系統。其中包括一個存在 15 年、由 HTML 元素觸發的錯誤,以及一個潛伏 20 年的 XSLT 漏洞,皆在長期模糊測試下從未被察覺。

尤其值得關注的是多個沙箱漏洞。根據《TechCrunch》,要找到這類漏洞,模型必須先為瀏覽器撰寫一個受感染的修補程式,再用這段新程式碼攻擊瀏覽器最安全的核心層,是一個需要創造力與高度精準度的多步驟任務。

為了找出這些漏洞,Mozilla 曾祭出漏洞獎勵計畫,然而,即便提出最高可獲得 2 萬美元的高額獎勵,Mozilla 工程師 Grinstead 表示,Mythos 找出的沙箱漏洞數量,仍遠超過過去人類研究人員的成果。他向《TechCrunch》表示:「我們確實曾收到這類漏洞回報,但數量遠不及這種方法所能找到的規模。」

AI 能找漏洞,但還不能自己修

儘管 Mythos 在發現漏洞上表現突出,Mozilla 團隊也指出了一個現實限制:AI 目前仍無法真正自動修復問題。

《TechCrunch》報導,Mozilla 的做法是請 AI 為每個漏洞生成修補程式碼,但這些程式碼通常無法直接部署,而是作為人類工程師的參考樣本。Grinstead 表示官方文章中討論的每一個漏洞,都是由一位工程師撰寫修補程式、一位工程師負責審查而成,「我們還沒找到可以自動化的方法。」

根據 Mozilla,在 4 月共修補的 423 個漏洞中,有逾百人參與了撰寫修補程式、審查程式碼、測試修復成果與管理發布流程等工作。這反映出目前 AI coding 與 AI agent 發展的一個重要現實:AI 很擅長大規模探索與發現問題,但在需要高度可靠性、可維護性與系統整合能力的修復階段,人類工程師仍不可或缺。

但另一更深層的問題在於,AI 找漏洞的速度,可能正在超越人類修補漏洞的能力,全球軟體產業可能將進入「漏洞供給爆炸」的新時代。而目前的工程文化、review 流程與安全團隊規模,未必跟得上這種速度。

這也意味著,AI coding 的下一場競爭,或許不再是誰能生成更多程式碼,而是誰能在 AI 發現漏洞後,更快完成修補、驗證與部署。Mythos 所揭露的,已不只是 AI coding 的新能力,而是整個軟體產業攻防節奏正在被重新改寫。

Mozilla 透過自身經驗指出,任何軟體開發團隊都可以立即使用現有的代理框架搭配現代模型來尋找漏洞,不需要等待更好的工具,並建議從簡單的提示開始,觀察後再迭代。「你會找到漏洞,而且你會為自己做好準備,以便在新模型出現時立即加以利用。」其下一步計畫是將漏洞掃描整合進 CI 系統,在程式碼提交時即時掃描,預期效果與現有的檔案式掃描相當甚至更好。

【推薦閱讀】

Anthropic 不敢全面公開的 AI:Claude Mythos 為何正在重寫網路安全規則?

Anthropic Mythos 進入大型銀行、美英加三國監管體系同步介入:為何美財長緊急召集華爾街 CEO?

駭客不需駭入系統,只要讓你的 AI 客服讀一封信:專家揭三大攻擊型態升級

*本文開放合作夥伴轉載,資料來源:《TechCrunch》Mozilla《CNBC》Anthropic,首圖來源:Anthropic

不用 HBM、不靠 3nm!台灣 Skymizer 如何用 28nm 打 AI 推論戰?

不用 HBM、不靠 3nm!台灣 Skymizer 如何用 28nm 打 AI 推論戰?

台灣 AI 晶片設計公司 Skymizer 近日曝光新一代 PCIe AI 加速卡 HTX301,宣稱可在單張卡上執行高達 7000 億參數(700B)的大型語言模型(LLM),且整體功耗僅約 240W。更值得關注的是,這套系統並未使用當前 AI 產業主流的 HBM 高頻寬記憶體,也不是採用 3nm、5nm 等先進製程,而是建立在 28nm 晶片與 LPDDR4/LPDDR5 記憶體之上。

這種反主流設計,很快引發 AI 基礎設施圈關注。因為它挑戰的不只是 NVIDIA 與 AMD,而是整個 AI 晶片產業目前的發展方向。

根據《TechRadar》報導,Skymizer 表示 HTX301 單卡配置 384GB 記憶體,可支援 Agentic AI(代理式 AI)、程式開發與企業專用 AI 工作流,並能部署於一般風冷伺服器中,無需大型資料中心等級的電力與散熱改造。

AI 晶片戰場,正從「拼 FLOPS」轉向「拼記憶體」

過去兩年,AI 晶片市場幾乎被「更大算力」主導。例如 AMD 新推出的 Instinct MI350P PCIe AI 卡,搭載 144GB HBM3E 記憶體與高達 4600 TFLOPS 運算能力;NVIDIA RTX PRO 6000 Blackwell 則採用 GDDR7 記憶體、功耗約 600W。各家 AI 晶片業者都在持續往更高功耗、更高頻寬方向推進。

但根據 Skymizer 官方資料,HTX301 的核心並非追求極限 FLOPS,而是專注在 LLM 推論效率。該公司強調,自己使用大量權重壓縮(weight compression)與 KV cache 壓縮技術,降低記憶體搬移成本,並針對 token decode 階段最佳化。

根據《wccftech》報導,在效能數字上,Skymizer 宣稱 HTX301 以 0.5 TOPS 算力搭配 100GB/s 頻寬,可達到每秒 30 個 token 的生成速度;在八核心 LPU 配置中則能在 Llama2 7B 的 prefill 階段達到每秒 240 個 token;多顆晶片串聯後,同一模型可提升至每秒 1,200 個 token,並支援最大 700B 參數規模的模型推論。

在壓縮技術上,HTX301 架構對模型權重(長期記憶)的壓縮效果比開源 llama.cpp 高出 9% 至 17.8%,KV 快取(短期記憶)的壓縮則在困惑度(perplexity)損失低於 0.06% 至 3.52% 的前提下達成。

推論與預填分離,軟硬體協同設計是核心賭注

Skymizer 的技術路線奠基於一個對 LLM 推論工作負載的明確判斷:prefill(處理輸入提示,屬於運算密集型)與 decode(逐 token 生成輸出,屬於記憶體頻寬密集型)是兩種本質上不同的計算需求,卻在主流 GPU 架構中被強制分配到同一塊晶片上,導致兩個階段在任何給定時刻都有資源被閒置浪費。

HTX301 的設計哲學是針對 decode 階段進行專門優化,由現有 GPU 負責運算密集的 prefill,HTX301 卡則專門處理記憶體頻寬密集的 decode。Skymizer 同時開發了統一軟體堆疊,涵蓋 KV 快取管理器、感知階段的排程器,以及動態配置引擎,負責在 prefill 與 decode 資源池之間協調 KV 快取狀態的跨節點傳遞,並隨工作負載即時調整兩者比例。

Skymizer 技術長 Luba Tang 表示:「針對 decode 設計的專用硬體,搭配能協調所有推論工作負載的智慧軟體堆疊,才是在規模上實現 prefill/decode 分離的方式。」

此外,HTX301 採用 Skymizer 自研的 LISA(語言指令集架構)作為底層 ISA,這套以 Transformer 推論為核心設計的指令集架構,與其邊緣端 LPU 共用相同基礎,意味著從邊緣裝置到小型資料中心,可採用統一的部署流程。

在資料主控權方面,Skymizer 指出雲端推論迫使企業在查詢規模上有所保留,對涉及機密程式碼、客戶資料或專有矽智財的場景尤為不適用。HTX301 瞄準的應用場景,包括 IC 設計公司的私有 RTL 程式碼輔助、金融機構的合規與詐欺偵測、醫療機構的臨床決策支援,以及政府與國防單位的主權 AI 部署。

數字尚待驗證,但新趨勢已經浮現

Skymizer 將在 Computex 2026 正式展示 HTX301,屆時將是外界首次有機會對其宣稱的效能數字進行獨立驗證。目前業界對這類規格聲明普遍持審慎態度,相關媒體報導如《TechRadar》也指出,能否在真實工作負載下兌現每秒 240 個 token 的 Llama2 7B 效能,仍是最關鍵的待解問題。

然而,HTX301 所代表的技術路線本身已具有產業觀察價值。當 AI 推論工作負載快速成長,而通用 GPU 的功耗與成本門檻持續攀升,以 decode 優化為核心的專用推論架構是否正在形成一個獨立的競爭維度,將是 Computex 之後值得持續追蹤的問題。

Skymizer 行銷長 William Wei 表示:「推論已成為主導性的 AI 工作負載,基礎設施的設計必須反映這個現實。超大規模 LLM 需要超大規模 GPU 叢集的時代已經結束。」

【推薦閱讀】

OpenAI 與博通 180 億美元晶片融資卡關:Nexus 計畫要落地,為何還得看 Microsoft 臉色?

化敵為友的百萬瓦級交易:拆解 Anthropic 承租 SpaceX Colossus 1 背後的算力焦慮

從 HBM4 到 Apple 供應鏈備援:三星獲利狂飆 48 倍,AI 正重新定價半導體產業

*本文開放合作夥伴轉載,資料來源:《Wccftech》《TechRadar》《PR Newswire》Skymizer,首圖來源:Skymizer

Google 首次攔截 AI 零日攻擊,駭客武器化漏洞的高速戰役正式開打

Google 首次攔截 AI 零日攻擊,駭客武器化漏洞的高速戰役正式開打

多年來,AI 是否會幫助駭客更快找到漏洞、生成攻擊程式,一直是資安圈最擔心的問題之一。但如今,這個風險不再只是理論,而是正式進入實戰階段。Google 威脅情報小組(Google Threat Intelligence Group)發布最新報告指出,他們首次發現並阻止了一起駭客利用 AI 發現並武器化零日漏洞的網路攻擊事件。

零日漏洞是連軟體開發商本身都尚未知曉的安全漏洞。過去這類漏洞極為稀有且威力強大,甚至能在地下駭客交易市場上賣出數百萬美元高價。Google 雖然沒有透露是哪一個組織發動攻擊,但指出中國與北韓相關的駭客,對於如何使用 AI 來發現這類漏洞展現高度興趣。

一個 Python 腳本、一個 2FA 繞過漏洞,差點釀成大規模攻擊

根據 Google 報告,攻擊者為「知名網路犯罪威脅行為者」,目標是一款廣泛使用的開源網頁式系統管理工具。攻擊者發現了該工具雙重驗證(2FA)機制中的一個高階語意邏輯漏洞:開發者在程式碼中硬性建立了一個信任假設,使攻擊者得以在取得有效帳號憑證的前提下繞過 2FA。

攻擊者隨後以 Python 腳本撰寫了漏洞利用程式(exploit),準備發動大規模利用行動,但在造成損害前已被 Google 阻斷。Google 表示已即時通知相關軟體開發商與執法機關,並協助完成修補。

Google 如何判斷是 AI 做的?

Google 研究人員判斷此次攻擊有 AI 介入,主要依據是 exploit 程式碼本身的多個異常特徵,包括出現「幻覺式 CVSS 評分」、過度詳盡的說明性文字(educational docstrings)、結構化的教科書式格式,以及人類工程師在正常情況下不會加入的多餘說明內容。

美國國家安全局前網路安全主任 Rob Joyce 在公開發表前受邀審閱這份報告,他表示 AI 生成的程式碼不會自我揭露,但 Google 所找到的這些線索,「是目前最接近犯罪現場指紋的東西」。Google 威脅情報小組首席分析師 John Hultquist 告訴《紐約時報》,Google 另掌握其他佐證駭客程式碼是由 AI 編寫的指標,但拒絕討論這些證據。

Google 未公開受影響的工具名稱、攻擊者身分,以及攻擊者所使用的 AI 模型為何,但明確表示不認為是 Google 自家的 Gemini 或 Anthropic 的 Claude Mythos。

攻擊者比間諜更有動機用 AI 加速

Hultquist 在接受外媒採訪時表示,「這其實只是未來局勢的一個預演。我們相信,目前看到的恐怕只是冰山一角,實際問題可能比想像中還要更大,而這只是第一個真正浮上檯面的具體案例。」

Google 這次案例之所以重要,在於犯罪集團其實不需要完美的漏洞掃描能力,他們只需要「夠快」,快到能在漏洞公開與修補完成之前搶先發動攻擊即可。Hultquist 表示,相較於行動緩慢、以長期潛伏為主的國家級間諜組織,犯罪集團更能從 AI 的高速能力中獲益。「你和他們之間正在展開一場競賽,你必須在他們獲取勒索你或發動勒索軟體所需的任何資料之前阻止他們。」

Google 的更廣泛追蹤報告也顯示,AI 輔助攻擊已不限於零日漏洞,而是滲透進整個攻擊作業流程。根據《implicator.ai》,與中國有關聯的威脅行為者已使用專家角色扮演提示對 TP-Link 韌體與特定檔案傳輸協定實作進行滲透測試;北韓相關組織 APT45 則向 AI 模型送出大量提示,用以分析 CVE 漏洞資料庫並建立概念驗證型漏洞利用程式。此外,Google 也觀察到威脅行為者正在使用包含逾 8.5 萬筆中國漏洞賞金平台案例的 GitHub 儲存庫訓練與測試 AI 模型。報告同時指出,攻擊者也開始以 AI 系統本身為目標,針對賦予 AI 系統實際行動能力的自主技能模組與第三方資料連接器發動攻擊。

《implicator.ai》強調,零日漏洞競賽不再只比誰先發現漏洞,而要比拼誰能將發現的漏洞轉化成可重複使用的攻擊能力。

從 Mythos 到 Google 報告:AI 漏洞競賽正式開始

Google 此消息發布的時間點格外敏感。Anthropic 上個月剛宣布推出 Mythos 模型,並以功能過強、擔憂遭惡意利用為由,僅開放給約 40 家受信任的合作企業與政府機構測試。Anthropic 當時指出,Mythos 已在每個主要作業系統與每個主要瀏覽器中發現數千個零日漏洞,其中許多已存在數十年。

《紐約時報》表示,Google 此次公布的零日漏洞案例,可能進一步強化國際社會對「限制最新 AI 模型釋出方式」的呼聲,希望能先讓專業人士完成安全修補,再擴大開放使用。《紐約時報》上週報導指出,美國川普政府正評估相關方案,其中甚至包括建立正式的政府審查機制,用來評估新 AI 模型是否適合公開發布。

部分專家認為,從長期來看,AI 最終將有助於提升資安水準,因為它能協助開發近乎完美的程式碼。不過在短期內,政府與企業仍需合作,降低 AI 對現有網路環境可能帶來的衝擊。Hultquist 就表示:「最前沿的模型,將讓我們打造出史上最安全的程式碼,這對資安而言絕對是一件好事。但問題在於,我們才剛開始這個過程,同時還必須面對一整個早已存在、充滿歷史遺留程式碼的世界。」

【推薦閱讀】

Anthropic Mythos 太會找漏洞:Firefox 修補數暴增 13 倍,工程師坦言還沒有自動化解方

駭客不需駭入系統,只要讓你的 AI 客服讀一封信:趨勢科技 TrendAI 揭三大攻擊型態升級

一張圖就能讓機器狗失控:VicOne 執行長鄭奕立揭 AI 機器人的 5 大資安攻擊面與 3 步驟解方 

*本文開放合作夥伴轉載,資料來源:《CNBC》《The New York Times》《Reuters》Google Cloud《The Verge》《implicator.ai》《AP》,首圖來源:Unsplash

Google 搶先 Apple 發表 Gemini Intelligence,揭開 AI 代理作業層大戰序幕

Google 搶先 Apple 發表 Gemini Intelligence,揭開 AI 代理作業層大戰序幕

就在 Apple 預計於 WWDC 大會重新展示 AI 功能 Apple Intelligence 的前幾週,Google 率先出手。Google 在「Android Show」活動中宣布一系列 Android 系統重大更新,並以「Gemini Intelligence」為核心主軸,將 Gemini 能力深度整合進 Android 作業系統,涵蓋跨應用程式執行、Chrome 瀏覽器、Android 車載系統,以及筆記型電腦平台。

負責 Google Android 生態系統的 Sameer Samat 在接受《CNBC》採訪時表示:「我們正在從作業系統過渡到智慧系統。」他同時也指出,「這是我們與科技互動方式的根本性轉變,作業系統的每個層面都要隨之改變。」

Gemini 不再只回答問題,而是替你完成任務

Gemini Intelligence 的核心突破,在於 AI 不再停留在對話框內回應指令,而是能夠主動理解手機螢幕上的情境,並跨越應用程式邊界執行多步驟任務。

Google 舉出的具體場景包括:從 Gmail 中找出課程書單並自動加入購物車、長按電源鍵後請 Gemini 將備忘錄中的採買清單直接轉為外送平台的訂單、拍下旅遊手冊後要求 Gemini 在 Expedia 上搜尋適合六人的類似行程。Samat 也以烤肉派對為例說明,使用者可以要求 Gemini 查看賓客名單、規劃菜單,並將食材加入 Instacart 購物清單,待使用者最終確認後才送出訂單。

針對外界對 AI 代理自主行動的隱憂,Samat 強調 Gemini 在完成交易前都會先回報使用者,確保人類始終參與決策流程。意即 Gemini 只在收到指令後才會行動,任務完成後即停止,並由使用者進行最後確認。Gemini Intelligence 將於今年夏季稍晚首先登陸三星 Galaxy 和 Google Pixel 手機。

從 6 月底起,Chrome 瀏覽器也將導入 Gemini,支援網頁摘要、跨站比較資訊,以及自動代為完成線上預約,包括看診預約與停車位預訂。智慧自動填入功能也同步升級,可從 Google Drive 等已連結應用程式中擷取駕照、護照號碼等資訊,自動填寫複雜表格。

Rambler、自訂小工具與 Material 3,介面全面重構

除了任務自動化,Google 也針對日常輸入體驗推出名為「Rambler」的語音轉文字新功能。這項功能透過 Gemini 的多語言模型,過濾掉口語中的自我修正、重複字詞與「呃」、「那個」等語氣詞,將自然說話的內容整理為流暢文字,並支援單一訊息中切換語言。語音檔案僅用於即時轉錄,不會被儲存或保留。

另一項新功能「Create My Widget」讓使用者透過自然語言指令生成客製化的桌面小工具,例如要求系統每週推薦三道高蛋白備餐食譜,或建立只顯示風速與降雨機率的天氣小工具,無需任何程式設計技能。《TechRadar》形容,這已經類似將「vibe coding」概念融入手機 UI。

介面設計層面,Gemini Intelligence 同步帶來以 Material 3 Expressive 為基礎的全新設計語言,目標是在 Gemini 於背景執行更多任務的同時,讓系統整體感受更為沉浸、專注,減少視覺干擾。

Samat 告訴《Bloomberg》:「多年來,我們一直在『微管理(micromanaging)』電腦,把目標拆解成無數次點擊與操作。但我認為,AI 帶來的新介面將改變這件事。使用者只需要說出目標,接下來該怎麼執行,應該交由電腦自己完成。」

Android Auto 迎來十年最大升級,Googlebook 筆電秋季登場

Android Auto 也在這次更新中獲得全面翻新。搭載 Gemini Intelligence 的車載系統新增了更流暢的動態效果、更鮮明的字型與色彩,以及可在停車時播放影片、行進中自動切換為純音訊的播放模式。Google Maps 同步推出號稱十年來最大幅度的更新,導入建築物、橋梁與地形的 3D 沉浸式導航視圖,並在路線上疊加車道引導、交通號誌與路標等資訊。Android Auto 目前已搭載於逾 2.5 億輛汽車中。

Google 同時宣布將推出全新筆記型電腦品類「Googlebook」,預計於秋季上市,由 Acer、Asus、Dell、HP 與 Lenovo 等製造商生產,整合 Chrome 瀏覽器、Android 應用程式與 Gemini Intelligence 功能,機蓋設有與 2015 年原版 Chromebook Pixel 相呼應的發光條設計。

App 時代正在終結?AI 代理層競爭已然開始

Google 的這波更新,在更宏觀的產業脈絡下具有明確的意涵。《CNET》報導,知名分析師郭明錤上個月在分析 OpenAI 手機計畫的報告中指出,使用者並非想使用一堆應用程式,而是想透過手機完成任務、滿足需求。這從根本上改變了人們對智慧型手機的認知。

隨著 OpenAI 傳出正在開發專屬的 AI 手機,以及各種 AI 瀏覽器持續挑戰傳統入口市場,科技巨頭們的競爭焦點已經從應用程式生態系,轉移至 AI 代理作業層(AI agent OS layer)的爭奪戰。這場從底層發起的變革,正預告著手機產業可能即將告別傳統的 App 時代。

在此背景下,Google 透過將 Gemini 深度融合進 Android 與硬體生態中,不僅是為了應對 Apple 在隱私與硬體整合上的傳統優勢,更是為了在下一代以 AI 為絕對核心的人機互動典範中,緊緊握住最關鍵的使用者入口。

不過,Google 的新 AI 是否能讓手機的日常操作比現在更流暢,最終仍取決於 Gemini 在現實場景中的執行可靠度。但從 Google 的宣示方向來看,手機作業系統的競爭維度,已不只是硬體規格或 App 生態,而是誰能更深、更穩定地將 AI 代理能力嵌入使用者的核心工作流程。

【推薦閱讀】

Google 首次攔截 AI 零日攻擊,駭客武器化漏洞的高速戰役正式開打

OpenAI 成立 Deployment Company:引進 150 名前線部署專家,瞄準企業 AI 落地難題

軟體開發成本趨近於零,企業護城河還剩什麼?陶韻智:下一個競爭關鍵是獲客、價值主張與 AI 管理力

*本文開放合作夥伴轉載,資料來源:《CNBC》《Bloomberg》The Keyword《TechRadar》《CNET》,首圖來源:The Keyword

擊敗 Mythos:微軟發表 AI 資安代理系統 MDASH,漏洞研究進入多代理時代

擊敗 Mythos:微軟發表 AI 資安代理系統 MDASH,漏洞研究進入多代理時代

AI 資安戰升溫,繼 Anthropic 發表 Claude Mythos、OpenAI 發起 Daybreak 資安計畫,如今微軟也推出了代號 MDASH 的全新 AI 驅動漏洞發現系統。MDASH 在衡量 AI 漏洞任務能力的 CyberGym 基準測試中拿下 88.45% 成績,超越 Anthropic Mythos Preview 的 83.1%,以及 OpenAI GPT-5.5 的 81.8%。

圖片來源:CyberGym

MDASH 在做什麼?微軟把漏洞研究拆成 AI 流水線

然而,值得注意的不只是排行榜的變動,而是微軟的做法。MDASH 是一套由超過 100 個 AI 代理組成的資安掃描系統,其運作方式是透過分階段流程協同作業。首先,由不同 AI 代理負責掃描程式碼中的潛在漏洞;接著,另一組代理會針對這些結果進行「辯論」,判斷漏洞是否真實存在、是否可被利用;最後,再由最終階段生成概念驗證(PoC)攻擊,確認漏洞確實成立。

相較之下,Anthropic 的 Mythos 是單一模型搭配代理框架運作。OpenAI 的 GPT-5.5,以及目前排行榜上的其他系統,也大多採用單模型架構。這顯示,微軟認為未來的 AI 資安優勢不只在模型本身,而在編排系統。

微軟代理安全副總裁 Taesoo Kim 在官方部落格就表示:「模型是一個輸入,系統才是產品。」他也指出,MDASH 的長期優勢在於模型外圍的代理系統,而非任何單一模型本身。因為這套架構刻意設計為不依賴單一模型,也就是當新模型推出時,只需更改設定並重新進行 A/B 測試,既有的掃描配置、外掛程式與驗證 AI 代理均可延續使用。

揭露 16 個 Windows 新漏洞,4 個重大遠端執行漏洞

MDASH 的實戰能力已經在微軟自家的產品線上獲得證實。微軟揭露,MDASH 已經成功在 Windows 網路與驗證堆疊中找出 16 個從未被發現的漏洞,其中包含 4 個遠端程式碼執行(RCE)漏洞,並已全數納入五月份的 Patch Tuesday 例行更新中修補。

微軟指出,這些漏洞正好展現了多代理系統相對於單一模型系統的核心優勢:tcpip.sys 漏洞涉及跨非線性控制流程的物件存活期推理,以及三條獨立的並發釋放路徑;IKEEXT 漏洞則橫跨六個原始碼檔案,只有在對照同一程式碼庫中另一處正確處理的程式碼時才能看出異常。這兩種情況都要求代理系統具備跨檔案的模式比對與多步驟可達性分析能力,而非單一提示所能完成。

微軟表示,MDASH 目前已由內部工程團隊使用,並預計 6 月開始有限私人預覽,同時預告未來 Patch Tuesday(每月例行安全更新)的規模將隨 AI 加速漏洞發現而持續擴大。

從 Mythos 到 MDASH,AI 資安軍備競賽升溫

Microsoft 發表 MDASH 的時間點落在 AI 資安競爭升溫之際。Anthropic 先前推出 Mythos Preview,強調其具備強大漏洞挖掘能力,但因擔心遭濫用,僅透過 Project Glasswing 開放少數合作夥伴測試。OpenAI 也推出 GPT-5.5-Cyber,採 trusted access 方式提供給資安防禦方。

這場競賽也不只發生在美國。《Bloomberg》報導,法國 AI 新創 Mistral 正與歐洲銀行討論推出自家 AI 資安模型,作為無法取得 Mythos 存取權的替代方案。Mistral 執行長 Arthur Mensch 直言:「我們必須掌握這項技術。」他並指出,不能讓法國軍方原始碼依賴 Mythos 掃描,否則會形成難以逆轉的依賴。

不過,Greyhound Research 首席分析師 Sanchit Vir Gogia 也提醒,CyberGym 等基準測試只能作為參考,不能直接等同企業真實環境價值。他告訴《CSO》:「CyberGym 是一個訊號,不是採購決策。」他認為真正的問題在於,企業是否具備足夠治理流程,把 AI 找到的漏洞轉化成實際修補。

微軟的 MDASH 之所以值得關注,正在於它把 AI 資安從「模型能力」推向「系統編排」。在 Mythos、GPT-5.5-Cyber 與 Mistral 等模型競爭之外,漏洞研究已正式進入多代理協作時代。

【推薦閱讀】

Anthropic 不敢全面公開的 AI:Claude Mythos 為何正在重寫網路安全規則?

聯手 Intel、Cisco 等巨頭!OpenAI 推出 Daybreak,打造橫跨軟體供應鏈的資安防線

Anthropic Mythos 太會找漏洞:Firefox 修補數暴增 13 倍,工程師坦言還沒有自動化解方

*本文開放合作夥伴轉載,資料來源:《CSO》《GeekWire》Microsoft 1Microsoft 2《SiliconANGLE》《Bloomberg》,首圖來源:Unsplash

Vibe Coding 跨入實體世界:從寫軟體到造硬體原型,Lovable、Anthropic 相繼卡位

Vibe Coding 跨入實體世界:從寫軟體到造硬體原型,Lovable、Anthropic 相繼卡位

當 Vibe coding 席捲軟體開發圈,讓非工程背景的使用者得以透過自然語言生成網站與應用程式,一批新創如今正試圖把這套模式延伸到硬體開發。

近期,AI 寫程式新創 Lovable 投資了丹麥硬體新創 Atech,而被稱為「硬體版 Cursor」的 Schematik,則獲得 Anthropic 生態支持與 Lightspeed 投資。這些新工具的共同點,是希望讓使用者不只生成軟體,而是直接透過自然語言打造硬體原型(prototype)、IoT 裝置,甚至未來的人形機器人。

Lovable 投資 Atech:AI 開始降低硬體開發門檻

根據《TechCrunch》報導,Lovable 近期參與丹麥硬體新創 Atech 的 80 萬美元 Pre-Seed 輪融資,投資方還包括 a16z 旗下 scout 基金、Sequoia Scout Fund 與 Nordic Makers。

使用者可以先向 Atech 購買對應專案的入門套件,再透過網站上的 AI 對話介面描述想製作的裝置,系統便會生成對應程式碼與控制邏輯,協助完成可運作的原型。

Atech 客戶體驗負責人 Gustav Hugod 向《TechCrunch》表示,用戶群跨度極廣,從「4 歲小孩製作玩具車」,到需要精密電壓感測的氫能工廠都有。

Atech 工具試圖解決的,是硬體開發長期存在的高門檻問題。因為相較於軟體開發,硬體原型往往需要電路知識、MCU 與感測器控制、PCB 設計、電源管理、韌體開發與相容性測試,而這些能力高度依賴資深工程師與 EDA 設計流程。但 Atech 認為,隨著 AI 降低軟體開發門檻,硬體世界也會出現類似變化,「在一個民主化的世界裡,硬體必須讓所有人都能接觸。」

Schematik 竄起、Anthropic 也想參與

另一個受到矚目的案例,則是被外媒稱為「硬體版 Cursor」的 Schematik。根據《WIRED》報導,Schematik 創辦人 Samuel Beek 最初只是想自己做一個電動門鎖,但他依照 ChatGPT 提供的接線方式操作後,最終燒掉家中所有保險絲。

原因在於,LLM 雖然能生成接線與控制邏輯,但不一定真正理解電子工程中乾接點與濕接點的差異,最終導致電路配置錯誤。這場差點「炸掉家裡」的經驗,反而成為 Schematik 的起點。

Beek 後來改用 Anthropic Claude,並進一步開發出 Schematik,希望讓 AI 不只會生成程式,而是真正理解硬體設計。

Schematik 的使用方式,幾乎就是硬體版 Vibe coding。使用者只需描述想做的裝置,系統便會推薦:感測器、線材、零件、控制模組、購買連結、接線方式,甚至一步一步引導組裝流程。當 Beek 在社群平台 X 上分享這個概念後,很快引發 maker 社群關注。有人用它做 MP3 播放器,也有人製作類似電子寵物的 Claude coding companion。Schematik 目前已獲創投公司 Lightspeed Venture Partners 投資 460 萬美元。

Vibe coding 正從數位工作流走向 Physical AI

更值得注意的是,Anthropic 工程師 Felix Rieseberg 近期在社群平台上分享,Claude 已新增 Bluetooth API,允許開發者打造能與 Claude 互動的硬體裝置。這代表 Anthropic 也開始把 Physical AI 的開發者生態納入戰略佈局。

不過,當 AI 開始控制硬體,風險也與純軟體世界不同。Vibe coding 在軟體領域已累積了安全疑慮的前車之鑑:AI 生成的程式碼可能暗藏嚴重漏洞,到了硬體領域,風險可能更為直接,Beek 本人就是最好的示範。

Beek 對此採取了明確的技術邊界策略:Schematik 目前僅支援 3V 至 5V 的低電壓架構,足以驅動物聯網裝置或音樂播放器等小型產品,但刻意限制在安全範圍內。他表示,電子電路有一個相對可驗證的特質:「對語言或圖像來說,大型語言模型對什麼是對的、什麼是錯的相當主觀。電子學的好處是它是純粹的物理定律,所以你實際上可以進行驗證。」

過去兩年,AI coding 主要解決的是網站生成、App 開發、SaaS Workflow、API Orchestration 等數位工作流,但現在開始觸及感測器、IoT、MCU 等實體世界系統。隨著 Lovable、Anthropic 相繼投入資源,下一波 AI 應用競賽的賽場,可能不再只是誰能更快生成一個網站,而是誰能更安全、更準確地把想法轉化為一個真實可運作的裝置。

【推薦閱讀】

韓國搶做「機器人大腦」: 新創 RLWRLD 如何把真實工作場景,變成 Physical AI 訓練資料?

中國機器人再進化!從人形到四足自由切換,宇樹科技發表 GD01 可載人越野、推倒磚牆

直接進入 Rivian 產線練兵:新創 Mind Robotics 估值破 34 億美元,靠數據打造懂現場的 AI 機器人

*本文開放合作夥伴轉載,資料來源:《TechCrunch》《Wired》,首圖來源:AI 工具生成

AI 代理戰場轉移:超越模型智商軍備賽,Anthropic 卡位企業代理執行層

AI 代理戰場轉移:超越模型智商軍備賽,Anthropic 卡位企業代理執行層

過去兩年,企業 AI 的競爭框架幾乎由模型能力主導:OpenAI、Anthropic、Google 之間的模型大戰,加上來自開源陣營的挑戰者。但根據《VentureBeat》最新的企業代理編排調查數據,下一場戰爭不是哪個模型回答問題最準,而是誰能掌握 AI 代理在企業內部的工作流程,並向安全團隊證明自己沒有踰越授權的那一層基礎設施。

AI 代理開始「蔓延」,企業 AI 戰場已然轉移

這股轉變的驅力來自企業端面臨的現實挑戰。《華爾街日報》報導,隨著降低 AI 代理建置門檻的工具普及,企業內部正出現所謂的「AI 代理蔓延(AI agent sprawl)」問題。Gartner 預測,未來兩年內,全球《財星》500 大企業平均將運行逾 15 萬個 AI 代理,但目前只有 13% 的企業認為自身的代理治理機制已足夠。

根據報導,美國醫療服務公司 DaVita 的員工已創建逾 1 萬個 AI 代理,數據分析公司 FICO 的 3,500 名員工每天創建數十個新 AI 代理。叫車平台 Lyft 正在構建統一的 IT 管控平台集中管理所有代理,DevSecOps 平台 GitLab 的現有治理架構則試圖「守住防線」,避免蔓延失控。

當 AI 代理開始執行具有實際影響力的任務,《VentureBeat》調查顯示,安全與權限管理在代理平台選擇標準中均排名第一,1 月為 39.3%、2 月為 37.1%。對代理執行的掌控度從 17.9% 升至 22.9%,而跨模型與工具的彈性則從 35.7% 降至 25.7%,顯示市場正從重視選擇空間轉向重視治理能力。

Anthropic 首次進榜,但意義大於數字本身

這場控制層之爭,正是 Anthropic 近期戰略佈局的核心。除了持續升級 Claude 模型,其也不斷推出 Managed Agents(託管代理)、Model Context Protocol(模型上下文協定,簡稱 MCP)、多代理協作(orchestration)與記憶(memory)等關鍵功能。

值得留意的是,一旦企業的工作流程、工具授權、憑證管理、稽核日誌、記憶機制、沙箱執行與營運監控,都落入某個供應商的環境中,要換平台就不再像換模型那麼簡單,而更接近更換基礎設施。這顯示 Anthropic 的野心遠不只是一家提供底層模型的供應商,它更企圖掌握企業 AI 代理的執行環境。

根據《VentureBeat》的企業代理編排追蹤器數據,Microsoft Copilot Studio 與 Azure AI Studio 以 38.6% 的平台採用率領先,OpenAI 的 Assistants 與 Responses API 以 25.7% 位居第二。Anthropic 在 1 月時的佔比為零,2 月首次出現在追蹤器中,以 5.7% 進榜。

《VentureBeat》分析,微軟之所以能夠領先,在於 Copilot Studio 和 Azure AI Studio 建立在許多企業早已採用的基礎架構,以及既有採購與 IT 管理體系之上。OpenAI 位居第二不令人意外,因為其工具很早就讓開發者能基於 OpenAI 模型打造代理式系統。

Anthropic 雖然是代理協作層的新進者,但《VentureBeat》數據顯示,越來越多企業認為 Claude 更適合高風險、高要求的工作場景,例如重視安全性、指令遵循能力、長上下文與治理能力的任務。在這種情況下,Anthropic 可能不需要立即挑戰 Microsoft 的企業平台地位,而是先成為那些已經信任 Claude、並將其用於敏感或複雜任務企業的代理執行層(agent runtime)。

AI 代理管理趨勢:身份識別、跨供應商協作

不過,Teleport 共同創辦人 Ev Kontsevoy 告訴《VentureBeat》,業界目前仍過度強調編排本身,而非身分識別:「沒有身分識別的編排只會倍增混亂。沒有身分識別,你不知道 AI 代理能存取什麼、實際做了什麼,或當它的行為超出政策時如何撤銷其存取權。」他強調,統一的身份層是部署 AI 代理到基礎設施中的先決條件。

NetApp 產品長 Syam Nair 則強調資料管理的核心地位:「有效的 AI 代理管理需要持續更新對資料及其詮釋資料的理解。這種可視性讓組織能夠定義並執行明確的政策,確保資料只被正確的代理、為正確的目的使用。」

下一波競爭,也可能將從單一供應商平台之爭,轉向跨供應商 AI 代理協作。AI 代理協調平台新創 BAND 執行長暨共同創辦人 Arick Goomanovsky 觀察,企業內部其實已同時運行各種不同類型的 AI 代理,但這些系統彼此之間通常無法自然協作。他認為,市場真正缺少的,不只是單一模型供應商內部的協調能力,而是一層能跨不同供應商運作的「協作層」,讓來自 Microsoft、OpenAI、Anthropic,甚至企業內部自建代理的系統,共同組成一個可協同工作的 AI 勞動力。

【推薦閱讀】

傳簡訊就能操控的 AI 代理 Poke 爆紅!擺脫 OpenClaw 技術門檻,甚至免下載安裝

BCG 如何打造 AI 銷售代理:不只學成功,更「反向訓練」找出致勝關鍵

擊敗 Mythos:微軟發表 AI 資安代理系統 MDASH,漏洞研究進入多代理時代

*本文開放合作夥伴轉載,資料來源:《VentureBeat》《The Wall Street Journal》《Reuters》,首圖來源:AI 工具生成

停止錯誤 AI 專案才是企業欠缺的能力:MIT 揭落地規模化的三大關鍵領導角色

停止錯誤 AI 專案才是企業欠缺的能力:MIT 揭落地規模化的三大關鍵領導角色

企業對 AI 的投資持續擴大,但多數專案仍難轉化為可衡量的商業成果,背後問題往往不在於模型能力或技術選型,而在於組織架構本身。麻省理工學院資訊系統研究中心(MIT CISR)今年稍早發布的研究《引領數位創新》發現,能持續推動數位創新並實現規模化的企業,背後通常不是依靠單一 CIO、AI 團隊或「英雄式領導者」,而是建立一套由三種領導角色共同協作的治理系統。

單一英雄主管的時代已過

該研究作者 MIT CISR 研究員 Nils Fonstad、Martin Mocker 與 Jukka Salonen 指出,多數企業的數位創新之所以陷入困境,往往源於三個共同的壞習慣。

第一是將創新預算一次性全額投入,卻缺乏後續驗證機制。第二是各個 AI 專案過度獨立運作,缺乏共用平台與治理協調,導致團隊不斷重複開發。第三,則是企業把 AI 策略的責任過度集中在單一 AI 團隊或中央創新部門手中,反而形成新的組織瓶頸。

Fonstad 表示:「傳統方法在環境相對穩定時還能奏效,但在今日動態的環境中,假設任何單一領導者或單位能夠獨撐大局,根本不切實際。你真正需要的是一整個領導者網絡。」而 MIT 發現成功的數位創新企業,往往建立三種互補的領導角色,各自承擔明確責任,並共同採取「假設驅動、測試與學習」的方法推動數位創新。

領導角色 1:創新專案負責人

創新專案負責人(Initiative leaders)負責開發並營運具體的數位產品或服務,目標是讓每項創新專案對組織的策略目標有所貢獻。他們以階段性方式推進創新,持續收集關於可欲性(desirability,用戶需求是否被解決)、技術可行性(feasibility,是否能穩定規模化)與商業價值(viability,是否符合策略目標)的實證,並只有在數據支持繼續投資時才爭取下一階段資源。

該研究發現,最成功的企業通常為每個專案配置兩位共同負責人:一位來自 IT 或數位部門、聚焦技術可行性,另一位來自業務端、負責確保可欲性且評估商業可行性。

西班牙能源公司 Repsol 就採用了這種模式。該公司建立五階段資金與創新流程,並要求每個 AI 專案都必須持續提交可欲性、可行性與商業可行性的證據。五年間,Repsol 共推動 505 個數位創新專案,其中超過 76% 成功規模化落地,並帶動公司營運現金流提升 20%。

領導角色 2:共享資源負責人

MIT 認為,AI 時代另一個關鍵角色,是共享資源負責人(shared resource leaders)。這類功能性專家可能來自雲端運算、AI、資安、用戶體驗等數位領域,也可能來自人力資源、法務、風控等非數位領域,負責管理各專家團隊,協助各專案克服擴展規模時遭遇的共同障礙。

他們的工作不是直接做產品,而是為跨專案建構可重複使用的資源,包括平台、人才與標準,同時避免組織在長期運作中累積過度複雜且高風險的系統拼湊局面。

這類角色在 AI 時代就像企業內部的「AI 平台團隊」,諸如 AI 護欄、共享記憶層、治理框架、模型管理、可重複使用的 AI 代理,以及資料和 AI Hub,都屬於共享資源負責人的治理範圍。

MIT 特別提到,Repsol 建立了專門的 Data Analytics and AI Hub,把 AI、資料與分析能力集中管理,並提供各 AI 專案共用,結果超過 60% 成功專案都使用了該 Hub 的共享能力。

這種模式也開始與當前企業 AI 市場趨勢高度重疊。從 Microsoft Copilot Studio、Google Gemini Enterprise,到 Anthropic MCP 與 AI 代理編排平台,越來越多 AI 業者開始卡位企業 AI 的共享基礎設施與治理層。

領導角色 3:專案組合負責人

MIT 認為,AI 時代真正稀缺的資源已經不是想法,而是 GPU、token 預算、資料存取權限、系統整合量能以及管理大量 AI 工作流的能力。因此,企業需要「專案組合負責人」(portfolio leaders),除了負責投資 AI,也要持續重新配置 AI 資源。

該研究指出,成功的企業通常會定期更新策略優先順序、重新排序 AI 專案、停止低價值專案,把人才與預算轉向更有潛力的項目。

舉例來說,西班牙金融機構 BBVA 就建立了名為 Single Development Agenda(SDA)的流程,每季重新檢視超過 2,000 個 AI 或數位專案。研究指出,該機構平均每季約有 10% 專案被停止,資源重新分配到更重要的 AI 專案上。

AI 時代,治理架構比模型選型更關鍵

MIT 的研究結論對正在快速導入 AI agent、生成式 AI 與自動化工具的企業具有直接意義。研究建議除了培養這三種類型的領導者之外,還需將這些領導角色連結至明確的策略成果,投入資源培養各角色的技能與信心,並確保三種角色的工作始終與組織的策略目標保持同步,讓資源優先流向真正重要的方向。

Fonstad 指出:「為了能夠自發地快速回應新機會與威脅,你不能以救火模式應對。你必須能夠退一步,反思學習過程,而這需要紀律。」

MIT 認為,這種動態資源配置能力,將成為 AI 時代企業競爭力核心。因為當 AI 代理與自動化工具讓實驗成本大幅下降後,企業真正缺少的可能不是創新能力,而是停止錯誤 AI 專案的能力。

【推薦閱讀】

AI 代理戰場轉移:超越模型智商軍備賽,Anthropic 卡位企業代理執行層

AI「員工化」的代價:為什麼像對待人一樣管理 AI,反而會重挫組織信任?

近 40% 員工把敏感資訊丟進未授權 AI:Shadow AI 如何讓企業失去資料、權限與 Agent 行為掌控?

*本文開放合作夥伴轉載,資料來源:MIT ManagementMIT CISR,首圖來源:Unsplash

Google 想複製 NVIDIA+CoreWeave 模式,傳與黑石集團成立新 AI 雲端公司

Google 想複製 NVIDIA+CoreWeave 模式,傳與黑石集團成立新 AI 雲端公司

《華爾街日報》引述知情人士報導,Google 與私募巨頭黑石集團(Blackstone)正規劃成立一家新的 AI 雲端公司,主打 Google 自研 TPU 與 AI 雲端服務,目標直指 CoreWeave 等近年快速崛起的 AI 新雲端(neocloud)業者。根據報導,黑石集團將投入 50 億美元股權資金,若加上槓桿融資,整體投資規模可能上看 250 億美元。

《華爾街日報》指出,這不只是一次資料中心投資案,更是 Google 至今規模最大的一次 TPU 商業化嘗試,代表 Google 正試圖把原本主要供內部使用的 TPU,正式推向外部市場,進一步加劇與 NVIDIA 的競爭。

500 MW、2027 年上線,TPU 大規模推向外部市場

根據《金融時報》與《Bloomberg》報導,新公司將由 Google 資深主管 Benjamin Treynor Sloss 擔任 CEO,並預計在 2027 年前部署 500 MW 算力容量,未來還會持續擴張。500 MW 的用電規模,相當於一個中型城市的電力需求。

Google 將向新公司提供硬體、軟體與雲端相關服務。Google 上個月剛推出專為 AI 推論優化的新處理器,以及聚焦模型訓練的新一代晶片,顯示其在自研晶片路線上持續加碼。Google Cloud 執行長 Thomas Kurian 告訴《Reuters》,這項合作將「協助滿足 TPU 的快速增長需求」,並為企業提供「更多存取加速運算能力的選項」。

在目前 AI 運算市場,主要以 CoreWeave 為代表的新雲端業者依賴 NVIDIA GPU 提供算力服務,並獲得 NVIDIA 的投資與算力合約支持。《華爾街日報》指出,NVIDIA 透過投資 CoreWeave、Nebius 等新興雲端業者來擴大其 GPU 的覆蓋範圍,Google 與黑石的合作模式與這一策略相互呼應。值得注意的是,Google 本身同時也是 NVIDIA GPU 的大型採購方,雙方關係兼具競合色彩。

Kurian 此前對《金融時報》表示,全球排名前十的 AI 實驗室中有九家使用 TPU,Anthropic 是其中最大的客戶之一。Google 上個月也宣布對 Anthropic 投資最高 400 億美元,作為一項 2,000 億美元協議的一部分,將在未來五年內採購約 5 GW 的算力容量。

黑石如何成為 AI 基礎設施最大的財務推手

對黑石集團而言,此次合作是其大規模押注 AI 基礎設施戰略的延續。黑石管理資產規模超過 1.3 兆美元,並表示自己是全球最大的資料中心供應商。該公司 2021 年收購資料中心營運商 QTS Realty Trust,2024 年再度收購澳洲運算服務商 AirTrunk。黑石集團董事長暨執行長 Stephen Schwarzman 近期表示,該公司在資料中心領域的資產規模已逾 1,500 億美元,含在建項目,另有 1,600 億美元的潛在新專案待開發。

黑石集團近期成立了名為 Blackstone N1(BXN1)的新部門,集中管理旗下 AI 相關投資,並任命主導 CoreWeave 投資案的 Jas Khaira 擔任全球負責人。與 Google 的合資公司是 BXN1 的第二項投資,第一項則是本月稍早與 Anthropic 等業者共同設立的 15 億美元合資企業,主攻企業 AI 工具銷售。黑石旗下投資組合中同時包含 CoreWeave、Anthropic 與 OpenAI 等多家 AI 相關企業。

黑石集團總裁 Jon Gray 告訴《Reuters》,新合作關係反映了市場對 AI 基礎設施需求持續升溫,也突顯大規模資本投入的必要性。報導指出,預計到 2026 年,大型科技巨頭在 AI 基礎設施上的支出將超過 7,000 億美元。

【推薦閱讀】

【Google 第 8 代 TPU 來了】訓練與推論分流、效能比上代快 3 倍,支撐為 AI 代理而生的技術堆疊

Google TPU 為什麼贏不了 NVIDIA?陳良基:真正差距在對台灣供應鏈的掌握度

Google 傳找 Marvell 開發推論晶片:TPU 供應鏈重組,Broadcom 不再是唯一核心

*本文開放合作夥伴轉載,資料來源:《The Wall Street Journal》《Reuters》《Financial Times》《Bloomberg》,首圖來源:Unsplash

當 NVIDIA 全力衝 AI,為何美國國家實驗室開始測試非 GPU 晶片?

當 NVIDIA 全力衝 AI,為何美國國家實驗室開始測試非 GPU 晶片?

當全球半導體產業競相追逐 AI 熱潮時,傳統科學運算領域正悄悄展開一場硬體架構的底層革命。十多年來,美國國家實驗室高度仰賴 NVIDIA 與 AMD 等主流半導體業者的晶片來執行複雜的數學問題與超級電腦運算,如今美國 Sandia 國家實驗室卻開始測試 NextSilicon 等新創公司的晶片,探索 GPU 之外的新型運算架構。

這波硬體轉向的關鍵,在於科學模擬極度依賴的雙精度浮點運算(FP64)能力。Sandia 國家實驗室肩負著模擬核武物理反應等需要極高精確度運算的國家安全任務,而這類高精度模擬與一般 AI 訓練的需求截然不同。AI 訓練與推論並不需要 FP64 的精度,更依賴低精度運算來追求速度與效能。

AI 熱潮開始擠壓 HPC 的 FP64 資源

《Reuters》報導,隨著 AI 市場規模急速擴大,NVIDIA 與 AMD 等企業將重心轉向 AI 推論與訓練市場,加上晶片短缺,傳統 HPC 所需的 FP64 資源開始面臨被稀釋的窘境,迫使研究人員必須重新尋找替代晶片架構。

《The Register》指出,NVIDIA 即將推出的 Rubin GPU 雖然擁有高達 50 petaFLOPS 的 FP4 AI 算力,但原生 FP64 效能反而下降到 33 teraFLOPS,甚至低於近 4 年前的 H100。雖然 NVIDIA 嘗試透過 Ozaki scheme 等「模擬 FP64」技術維持 HPC 能力,但該報導評論其在大量向量運算、計算流體力學(CFD)等工作負載上,較不具優勢。

面對外界疑慮,NVIDIA 超級電腦產品資深總監 Daniel Ernst 向《Reuters》表示,公司仍致力於科學運算,目標是打造能同時處理真實科學應用與 AI 工作的均衡晶片。AMD 則採取了分化策略,在 AI 導向的 MI455X 之外,另行推出專為 HPC 設計的 MI430X,搭載專用於科學運算的運算晶片,據《The Register》報導,其峰值 FP64 效能可達 200 teraFLOPS,預計部署於美國能源部的 Discovery 與歐洲的 Alice Recoque 超級電腦。

正是在這樣的背景下,Sandia 國家實驗室決定透過其 Vanguard 計畫,測試來自以色列新創 NextSilicon 的晶片。Vanguard 是 Sandia 評估新興運算架構的核心機制,要求候選系統在真實任務工作負載下通過嚴格驗收,才有資格進入更大規模的部署評估。而 NextSilicon 本週宣布,以 NextSilicon Maverick-2 晶片為核心的「Spectra」超級電腦,已通過所有系統驗收要求,意味著這款晶片已具備進一步導入美國政府系統的資格。

NextSilicon 的資料流架構:讓硬體動態適應工作負載

NextSilicon 晶片和 GPU 最大不同之處,在於其採用資料流架構(dataflow architecture),而非傳統 CPU、GPU 使用的馮紐曼架構。傳統 GPU 本質上仍高度依賴大量資料搬移與記憶體交換,但 NextSilicon 的設計則試圖讓資料流與運算執行同步進行。

據《The Register》報導,其晶片內部由兩個運算晶粒組成,每個晶粒包含以圖形結構互連的算術邏輯單元陣列,每個單元在執行時期被動態配置執行特定運算。資料一下一個運算單元,就會立即開始運算,不需反覆等待資料在記憶體與運算單元間搬移。這代表硬體本身會動態適應工作負載,而不是讓軟體受限於固定的 GPU 架構。

為克服資料流架構難以程式化的歷史挑戰,NextSilicon 還開發了一套編譯器,宣稱可直接執行現有的 C、Python、Fortran 與 CUDA 程式碼庫,透過在 CPU 上初次執行工作負載、捕捉運算圖、再映射至晶片並最佳化的方式,降低用戶的遷移門檻。

NextSilicon 表示,單顆 Maverick-2 可在 HPCG 測試中達到約 600 gigaFLOPS 的 FP64 效能,效能與主流 GPU 相當,同時功耗僅為後者的一半。

資料流架構並不是新概念,《The Register》指出,Groq、Cerebras、SambaNova 等業者也採用類似設計,但這些方案都鎖定 AI 推論或訓練市場,NextSilicon 是少數明確瞄準 HPC 領域的資料流架構業者之一。

《Reuters》報導,Sandia 過去與晶片公司的合作,也曾推動多項技術走向主流。例如十多年前,液冷技術仍被視為相當前衛時,Sandia 就開始推動 Intel、AMD 與 NVIDIA 投入相關研發,如今已成為資料中心常見設計。

負責測試新型運算架構的 Sandia 資深科學家 James Laros 表示,與 NextSilicon 這類較小型業者合作,目的在於確保即使大型晶片業者持續將重心轉向 AI,Sandia 仍能取得符合科學運算需求的晶片架構。

【推薦閱讀】

Google 想複製 NVIDIA+CoreWeave 模式,傳與黑石集團成立新 AI 雲端公司

中國 AI 硬體供應鏈拉警報:光通訊、PCB、功率晶片全面吃緊,AI 基建熱潮迎來「成長痛」

不用 HBM、不靠 3nm!台灣 Skymizer 如何用 28nm 打 AI 推論戰?

*本文開放合作夥伴轉載,資料來源:《Reuters》《The Register》NextSilicon,首圖來源:NextSilicon

Google I/O 2026 最大訊號:AI 競爭從模型能力轉向 Agent 經濟學

Google I/O 2026 最大訊號:AI 競爭從模型能力轉向 Agent 經濟學

Google 年度開發者大會 I/O 2026 登場,Google 執行長 Sundar Pichai、Google DeepMind 執行長 Demis Hassabis 等多位主管輪番展示模型、世界模擬器、開發平台、個人 AI 代理、改版後的搜尋,以及代理式商務架構。其中最值得關注的訊號,不是 Gemini 模型又打破了哪些基準測試紀錄,而是 Google 正在把 AI 競爭,從模型能力競賽推向「Agent 經濟學」。

今年大會上,Google 在發表最新模型 Gemini 3.5 時,沒有先端出最強模型 Gemini 3.5 Pro,而是讓更快、更便宜的 Gemini 3.5 Flash 正式上線。這樣的排序耐人尋味,因為當 AI Agent 時代來臨,Agent 開始長時間運作、呼叫工具、執行多步驟任務,企業將更關心每一次推理要消耗多少 token、速度夠不夠快,以及能否支撐大規模自動化工作流。

Google 主推 Flash,AI 競爭開始轉向成本效率

根據《TechCrunch》報導,Gemini 3.5 Flash 是 Google 目前針對 coding 與代理式任務進行深度最佳化的模型。Google DeepMind 技術長 Koray Kavukcuoglu 表示,3.5 Flash 是具備低延遲與高品質的組合,在寫程式、代理任務與多模態推理等多項測試基準,甚至優於先前的 Gemini 3.1 Pro。

不過《VentureBeat》也指出,Sundar Pichai 在說明 Gemini 3.5 Flash 時,並未主張它是最強模型,而是強調它接近前沿模型約 90% 的效能,速度更快,價格約為三分之一到二分之一。根據其說法,Flash 比其他前沿模型快 4 倍,而在 Google 的代理式開發平台 Antigravity 中,經最佳化版本甚至可快到 12 倍。

Pichai 更強調,每天在 Google 雲端處理約 1 兆 tokens 的企業,若將 80% 工作負載轉向 Flash 與前沿模型混合架構,每年可能節省超過 10 億美元。「你大概已經聽過不少 CIO 的案例,有些企業才到 5 月,就已經把整年的 token 預算燒光了。」他強調,這款模型不只是技術突破,更像是一條「財務生命線」,目的是幫助那些在大規模部署 AI 過程中,正面臨成本失控壓力的企業。

Antigravity 2.0:AI coding 變成代理指揮中心

Gemini 3.5 Flash 的另一個重點,是與 Antigravity 2.0 深度整合。Google 在 I/O 上推出新版 Antigravity,將它定位為以 Agent 代理為核心的開發平台,意思是超越程式碼編輯器,可以同時管理多個 AI Agents。

在展示中,Google 讓多個 Agents 分工完成不同元件,再組合成一個可運作的作業系統。Google 表示,Flash 是與 Antigravity 共同開發,因此特別適合長時間 coding pipeline、工具使用與多代理執行。這代表 AI coding 正從幫工程師補程式碼,走向讓 AI Agents 自己規劃與執行軟體專案。

Google 產品主管 Tulsee Doshi 向《TechCrunch》表示,未來 Gemini 3.5 Pro 與 Flash 將會搭配運作。Pro 更像是編排者與規劃者,負責高階推理與任務規劃;Flash 則可作為大量子代理,負責更高頻率、更低成本的執行任務。這其實就是 Agent 經濟學的核心:不是每個任務都需要最強模型,而是要把不同層級的模型,放在最符合成本與效能的位置。

Spark 與 Search:Google 想把代理放進日常入口

Google 這次不只推出模型,也把 Agent 推進消費者產品。根據《The Next Web》報導,Google 發表 Gemini Spark,一款可 24 小時運作的個人 AI Agent。它運行在 Google Cloud 專屬虛擬機器上,即使使用者關掉筆電,該代理仍能在背景執行任務。

Spark 可透過專屬 Gmail 信箱接收任務,並整合 Gmail、Docs、Sheets、Workspace 與 Chrome。使用者可以像寄信給同事一樣,把任務交給 Spark 處理。Google 也計畫透過 Android Halo 顯示 Agent 即時狀態,讓手機成為持續監控 AI Agent 工作進度的儀表板。

Google 搜尋也開始走向 AI 代理化。《Tech Times》指出,Google 將 AI Mode 的預設模型升級到 Gemini 3.5,使搜尋框可接受多模態輸入,並加入資訊代理(Information Agents),讓 AI 在背景監控資訊或其他網路變化,再推送整理後的結果。這代表 Google 搜尋不再只是回應查詢,也開始變成持續運作的資訊代理。

從 Universal Cart 到 Agent Payments,Google 還想掌握代理商務

Google 同時也將 Agent 推進電商與支付層。《The Next Web》報導,Google 在 I/O 發表 Universal Cart,讓使用者可從 Search、Gemini、YouTube、Gmail 等不同入口加入商品,集中在同一個持續存在的購物車中。這個購物車不只是暫存商品,還能監控價格、提醒缺貨補貨、比較歷史價格,甚至檢查商品相容性。例如在 3C 購物場景中,使用者組裝電腦時,Universal Cart 可提醒 CPU 與主機板不相容,並建議替代品。

背後支撐的是 Universal Commerce Protocol(UCP)與 Agent Payments Protocol(AP2)。AP2 允許 AI Agent 在使用者設定限制後代表使用者付款,透過加密簽署的數位合約建立可稽核紀錄。Google 也將 AP2 捐給 FIDO Alliance,試圖把它推向產業標準。這代表 Google 不只是想做 AI 助理,還想成為代理商務的基礎設施供應商。

從 Gemini 3.5 Flash、Antigravity、Gemini Spark,到 Universal Cart、UCP 與 AP2,Google I/O 2026 訴說的是:Google 想把 AI 從聊天機器人,變成一套可運作在搜尋、開發、商務、Workspace、Android 與雲端上的 AI 代理基礎設施。

這或許是為什麼 Gemini 3.5 Pro 尚未推出,Google 卻先主打 Flash。在 AI Agent 時代,最強模型仍然重要,但它不一定是最常被使用的模型。真正支撐 AI 商業化的,可能是便宜、快速、可靠、可長時間執行的模型,再加上能管理 Agents、支付、工具、記憶與工作流的基礎設施。

【推薦閱讀】

網路流量規則將改寫!Google 搜尋框 25 年來最大變革:轉型 AI 對話入口

Google 想複製 NVIDIA+CoreWeave 模式,傳與黑石集團成立新 AI 雲端公司

當 NVIDIA 全力衝 AI,為何美國國家實驗室開始測試非 GPU 晶片?

*本文開放合作夥伴轉載,資料來源:《Tech Times》《TechCrunch》The Keyword《VentureBeat》1《VentureBeat》2《TNW》1《TNW》2,首圖來源:Google

結盟 ASML、切入工業模擬:Mistral AI 如何卡位新一波 AI 戰場

結盟 ASML、切入工業模擬:Mistral AI 如何卡位新一波 AI 戰場

AI 巨頭持續佈局實體 AI(Physical AI)領域,《Reuters》報導,法國 AI 新創 Mistral AI 近日表示,已收購奧地利實體 AI 新創 Emmi AI。雖然雙方未透露具體交易金額,但這項併購案釋出了強烈訊號:Mistral 的發展重心正從聊天機器人與通用大型語言模型,積極擴展至工業 AI(Industrial AI)與實體 AI 領域。

專攻物理模擬,Emmi AI 是歐洲最受矚目的 AI 新創之一

Emmi AI 於奧地利林茲創立,核心技術是開發能處理複雜物理現象的 AI 模型,涵蓋氣流、熱傳導與材料應力等工業工程中的關鍵模擬場景,已應用於能源、汽車、半導體與航太等產業。這家新創在 2025 年完成奧地利史上最大規模的新創募資輪,金額達 1,500 萬歐元,旗下擁有逾 30 名研究員與工程師。

據 Emmi AI 官方聲明,收購完成後,Emmi 的共同創辦人及全體研究與工程團隊將於 2026 年 5 月加入 Mistral 的科學與應用 AI 部門。

Mistral AI 不只想做歐洲版 OpenAI

成立於 2023 年的 Mistral,一直被視為歐洲最重要的 AI 公司之一。過去市場對它的定位多是「歐洲版 OpenAI」,並且主打開源與歐洲主權 AI。近一年,Mistral 的方向開始更加深入。根據《CNBC》報導,Mistral 去年底便推出可部署於機器人、無人機與邊緣裝置的小型模型 Ministral 3,並強調未來 AI 不只是更大,而是將更快、更便宜、更適合部署於真實世界設備。

Mistral AI 向《Reuters》表示,這次與 Emmi AI 的交易將進一步強化其深耕歐洲企業客戶的核心策略,特別是切入工程設計與製造相關任務。Mistral 認為,這些領域長期以來其實被 AI 產業低估。

Mistral 共同創辦人暨首席科學長 Guillaume Lample 在聲明中表示,該公司希望打造首個以 Physical AI 為核心的完整 AI 技術堆疊,以提供即時模擬與更高階的數位孿生能力,突破過去數十年工業研發中的技術瓶頸。

Mistral 目前最具代表性的工業 AI 案例之一,就是與 ASML 的合作。根據《Reuters》報導,ASML 已在 EUV 微影設備中導入 Mistral 的 AI 視覺模型,用來檢測蝕刻缺陷,將原本需要數小時的診斷流程,縮短至約 8 分鐘。ASML 財務長 Roger Dassen 在今年 4 月股東會中表示,這代表公司可減少高價設備停機時間,並降低昂貴矽晶圓浪費。該公司客戶還包括 Stellantis、Veolia 與無人機製造商 Helsing。

工業 AI 如何成為 AI 新戰場

事實上,工業 AI 正在歐洲「再工業化」進程中扮演越來越重要的角色。《Reuters》報導,去年 10 月,歐盟委員會已將製造業列為 AI 關鍵產業之一,作為降低歐盟對美國與中國技術依賴策略的一部分。Mistral 也強調,歐洲累積超過百年的製造業經驗,本身就是發展工業 AI 的重要優勢。

《The Next Web》分析,Mistral 今年已發起兩起併購,路線都非常清楚:其 2 月收購雲端基礎設施公司 Koyeb,5 月收購物理模擬專業公司 Emmi AI,兩者都屬於 Mistral 有機會在歐洲建立競爭護城河的能力領域,並與 OpenAI、Anthropic 和 Google 主導的通用前沿模型競爭區隔開來。

與此同時,Physics AI 的競爭格局正在快速成形。《The Next Web》指出,以色列世界模型新創 Decart 的 Oasis 平台、NVIDIA 的 Omniverse,以及 Siemens 的 Xcelerator,都在以日益鮮明的產品定位爭奪同一批工業客戶,而一批源自學術界的實體 AI 新創也正以越來越高的估值完成募資。

該報導指出,Mistral 收購一家位於歐盟成員國的物理建模公司,將是歐洲 AI 政策觀察人士值得關注的一個訊號。這正是「主權 AI」倡導者長期呼籲的歐盟內部能力整合,也顯示 Mistral AI 正試圖在歐洲工業 AI 生態中建立更深的控制力。

【推薦閱讀】

Vibe Coding 跨入實體世界:從寫軟體到造硬體原型,Lovable、Anthropic 相繼卡位

人形機器人量產戰升溫!為何 Sanctuary AI 執行長預言家庭普及還要 3 到 7 年?

從影像像素到全身協調:Figure AI 機器人達成 24 小時零故障自主分貨,展現類「真人」直覺

*本文開放合作夥伴轉載,資料來源:《Reuters》Emmi AI《The Next Web》《CNBC》,首圖來源:Emmi AI

東南亞超級 App 如何落地台灣?Grab 產品長來台說明 AI 佈局,正面回應資料隱私疑慮

東南亞超級 App 如何落地台灣?Grab 產品長來台說明 AI 佈局,正面回應資料隱私疑慮

東南亞超級應用程式 Grab 收購 foodpanda 台灣業務的交易案,目前仍在公平交易委員會審查當中。不過,在市場高度關注這場外送平台大洗牌之際,Grab 產品長 Philipp Kandal 本週接受台灣媒體訪問,除了正面回應外界針對資料安全的疑慮,也具體說明 Grab 的 AI 技術、服務與其他同業有何不同,以及進入台灣市場的產品佈局方向。

資料存新加坡,與華為合作不含台灣

自收購案宣布以來,Grab Maps 與華為地圖數據合作的疑慮引發輿論關注,Kandal 在訪談中直接說明立場。他表示,Grab 主要合作的雲端服務供應商為 AWS(Amazon Web Services),資料儲存於新加坡,不會經過中國。

Grab 同步發出官方聲明,釐清 Grab Maps 與華為 Petal Maps 的合作僅限於新加坡、馬來西亞、印尼、泰國、菲律賓、緬甸及柬埔寨等八個東南亞市場,不涉及任何用戶資料,台灣並不包含在該合作協議中,且承諾將永久持續維持此作法。該聲明強調,無論從合約或技術層面,華為均無法透過與 Grab 的合作關係存取任何台灣地圖資料。

至於外界所指涉的阿里雲,Grab 也表示並未用於儲存 Grab App 的相關數據。Kandal 強調,若台灣業務獲核准,Grab 將完全符合台灣《個人資料保護法》的要求,目前也正積極接觸在地專業顧問進行合規審查。

強調以 AI 為核心的服務設計

在技術服務方面,Kandal 表示市場上每天都有科技公司在談 AI,但 Grab 不同的地方在於以 AI 為核心的做事方式,目標是在商家、外送夥伴與消費者的日常生活中扮演真正有用的角色。他說明的 AI 實際應用與服務,可分為三個面向。

在商家面向,Grab 推出「商家 AI 助理」,能讀取店家實際的交易數據,提供客製化商業情資。店家可直接透過聊天方式提問如何提升下週銷量,AI 會根據同區域的匿名數據,建議舉辦團購或增加特定熱銷品項等作法。Kandal 指出,在東南亞使用此功能的活躍店家每月總交易額(GMV)平均提升了 15%。Grab 更於上個月推出「虛擬商店管家」,可直接串接店面既有監視器,即時追蹤排隊人潮、衛生狀況與開店準時率,讓多門市業主遠端掌握概況。

在外送員面向,Kandal 重點介紹三項技術。其一是「即時分配」,透過 AI 精算備餐時間、派單時間與到達時間的「黃金窗口」,讓外送員抵達時餐點恰好完成,減少無效等待。其二是「最終路段導航」,系統以大型語言模型(LLM)解析消費者在訂單備註中留下的取餐細節,例如「從側門進、放在藍色大門前」,轉換為外送員可用的導航資訊,搭配室內地圖定位,縮短最後一哩路的時間損耗。其三是「大訂單的拆分」,面對過於龐大的辦公室團購訂單,AI 能自動判斷重量與體積,主動將訂單拆分派送,避免外送員到場後才發現無法承載的窘境。

在消費者面向,Grab 的 AI 助理已是代理式 AI(Agentic AI)的實際應用。用戶能以自然語言輸入複合式需求,例如「明天結婚周年紀念、素食、義式料理、每人預算 150 元」,AI 在理解用戶的過往習慣與偏好後,直接完成餐廳搜尋、推薦理由說明與座位預訂的流程。另一應用場景是生鮮採購,用戶只需上傳手寫購物清單的照片,AI 便可自動辨識所有品項,找出同時備有全部食材的店家,並自動建立可直接結帳的購物車。

Kandal 說明,Grab 平台目前已有超過 1,000 個 AI 模型在正式環境中運行,涵蓋外部夥伴模型與內部訓練模型兩大類,前者合作夥伴包含 Anthropic、OpenAI、Google、AWS,後者會針對所需要的一些具體情境來去訓練小型模型。

談及代理式 AI,Kandal 表示已涵蓋內部團隊開發與外部服務對象。在內部研發方面,Grab 運用代理式 AI 來快速打造解決方案、開發產品,甚至讓 AI 代為執行使用者訪談。在消費者端,代理式 AI 化身為主動的個人助理,例如在取得用戶行事曆權限後,若得知用戶即將搭機出差,便會自動幫忙預約前往機場的叫車服務。在外送夥伴端,代理式 AI 會幫忙分析並建議一天中最佳的送餐時段與接單熱區,協助外送員優化行程安排以極大化收入。在商家端,虛擬商店管家就是代理式 AI 的應用之一。

台灣:Grab 跨出東南亞的第一座試驗場

在台灣市場的在地化策略上,Kandal 強調 Grab 進入每個市場不是直接移植東南亞成品,而是以實地考察為基礎打造在地版本。

他以越南海灘送餐為例,由於當地缺乏明確地址,越南團隊便將沙灘椅逐一編號作為外送地標,與政府合作推行,最終讓當地攤販同步受益。他表示,若進入台灣,可能會測試團體訂餐與最終路段導航等功能,但最終決定仍將建立於在地需求的基礎上。

Grab 的 foodpanda 台灣收購案目前仍在補件審查階段,若最終獲核准,Grab 計畫於 2026 年下半年完成交割,2027 年上半年完成 foodpanda 用戶全面遷移至 Grab App。對 Grab 而言,台灣不只是第九個市場,更是其超級 App 模式能否走出東南亞的第一座驗證場域。

*首圖來源:《TechOrange》拍攝

OpenAI、Google、NVIDIA 同週宣布擴大新加坡合作,部署能力正成為 AI 新戰場

OpenAI、Google、NVIDIA 同週宣布擴大新加坡合作,部署能力正成為 AI 新戰場

當全球 AI 討論仍圍繞模型能力、算力規模與資本支出時,新加坡正在用另一種方式切入競局。今年亞洲科技峰會(ATxSummit)期間,OpenAI、Google 與 NVIDIA 幾乎同步宣布擴大在新加坡的合作與投資。表面上看起來是三筆獨立合作案,但如果放在一起觀察,背後透露出的訊號或許不是誰模型更強,而是大型 AI 業者開始重新定義「市場」的概念。

過去,AI 市場意味著賣出更多模型與雲端服務;如今,更重要的是找到能共同完成導入、驗證、治理與擴散的合作國家。而新加坡,正試圖成為這樣的角色。

OpenAI 首座海外應用 AI 實驗室,輸出部署能力

其中,最受關注的是 OpenAI 宣布啟動「OpenAI for Singapore」,並承諾投入超過 3 億新幣(約 2.34 億美元),同時在新加坡設立首座美國境外應用 AI 實驗室(Applied AI Lab)。

這不是傳統意義上的研究中心,根據 OpenAI 規劃,新實驗室未來數年將雇用超過 200 名員工,核心角色之一是「前線部署工程師(Forward-Deployed Engineers)」,這是直接深入企業與機構,把前沿模型轉化成實際可運作系統的職位,目的是幫助在地合作夥伴增強商業競爭力。

這項工作的首波重點場景,包含公共服務、金融、醫療、教育與數位基礎設施,同時推動 AI 創業加速器、中高齡工程人才培訓,以及中小企業導入。從 OpenAI 的描述來看,它想輸出的不只是模型,而是一套把模型真正放進組織運作的方法。

Google 把重心放在教育、醫療與 Agent 治理

相比 OpenAI 強調 AI 應用,Google 與新加坡的合作更偏向建立長期導入能力。Google 與新加坡政府簽署新一輪「國家 AI 夥伴關係」,聚焦以 AI 解決社會挑戰、建立具備 AI 能力的人才隊伍、推動企業創新,以及建構安全 AI 生態系。

在具體合作內容上,Google 將協助政府研究人員使用代理式 AI 工具從事科學研究,並與教育部合作培訓教育工作者。醫療領域方面,Google 將探索其「全球 AI 共同臨床醫師研究計畫」在新加坡的合作可能,研究 AI 如何擴大醫師的診療量能,以及 AI agent(AI 代理)如何協助病患。

此外,Google 與新加坡政府聯合發布了一份關於 AI Agent 安全部署的白皮書,延續雙方自 2025 年 8 月 AI Agent 沙盒啟動以來的合作脈絡。

NVIDIA 設立首個新加坡研究中心,聚焦 Physical AI

NVIDIA 則宣布在新加坡設立研究中心,這是其在新加坡的首個研究機構,也是其在亞太地區的第二個研究據點。研究中心將聚焦於實體 AI 的發展,以及提高 AI 基礎設施的效率,並與大學研究人員、產業夥伴及政府機構協作。

同日,新加坡政府宣布將於今年稍後啟動一個專為私人企業設計的實體 AI 驗證場,協助業者共同設計、部署、測試與驗證具商業可行性的 AI 機器人技術。Certis、DHL、Grab 與 QuikBot 預計是首批使用者。新加坡政府同時宣布將與 Slamtec、Unitree 等 AI 機器人業者合作,透過新設立的智慧機器人中心進行場景驗證,測試內容包含食品與包裹配送、清潔及保全巡邏等服務,補充現有人力缺口。

新加坡想扮演的角色:不是 AI 強國,是 AI 導入國

這三筆合作案共同描繪出新加坡正在打造的能力,是一條從人才培育、企業導入、場域驗證到治理規則的完整體系。根據《Reuters》報導,新加坡已承諾在 2025 年至 2030 年間投入超過 10 億新幣發展公共 AI 能力,也正在研究替 AI 產品建立類似食品標示的「AI 營養標籤」,說明用途與限制,同時建立測試與認證機制。

新加坡數位發展及新聞部長 Josephine Teo 更在 ATxSummit 期間向《Reuters》透露,新加坡目標協助 1 萬家企業導入 AI,並擴大在製造、醫療與金融領域的應用,並指出新加坡半導體設備製造業佔全球供應的 20%,是建立 AI 樞紐的重要基礎。這代表新加坡不只想吸引 AI 公司,更希望成為全球 AI 業者進入亞洲市場時,優先驗證與規模化部署的節點。

【推薦閱讀】

Mistral AI 執行長警告:歐洲只剩兩年建立 AI 主權,補不上算力恐成美國 AI「附庸」

停止錯誤 AI 專案才是企業欠缺的能力:MIT 揭落地規模化的三大關鍵領導角色

AI 代理戰場轉移:超越模型智商軍備賽,Anthropic 卡位企業代理執行層

*本文開放合作夥伴轉載,資料來源:《CNBC》1OpenAI《CNBC》2《Reuters》,首圖來源:Unsplash

不想被雲端綁死?拆解 Cohere 新開源 AI 模型如何瞄準企業主權 AI 需求

不想被雲端綁死?拆解 Cohere 新開源 AI 模型如何瞄準企業主權 AI 需求

過去,AI 市場競爭多半圍繞誰的模型參數更多、推理能力更強,但越來越多企業開始發現,困難的往往是讓 AI 安全接入內部資料、控制推理成本、避免供應商綁定,以及真正進入既有流程。加拿大 AI 新創 Cohere 最新發表的 AI 模型 Command A+,某種程度正是對這問題的回應。

Command A+ 是 Cohere 首個採用 Apache 2.0 授權的旗艦級開源模型,主打私有部署(private deployment)、原生引用(native citations)、Agent 工作流程,以及低成本推理能力。相較過去許多「開放權重」但仍限制商業用途的開源模型,Command A+ 允許企業自行下載、部署、微調與商業化使用。企業不必綁定單一雲端供應商,也能將模型放進私有雲、機房,甚至完全離線環境中運行。

Cohere 押注主權 AI:讓企業自己掌握模型、資料與成本

Cohere 將這次發表定位為主權 AI 的重要進展,其觀察到,隨著開源 AI 的發展越來越集中在少數國家,特別是中國,對營運關鍵系統的企業與政府而言,透明度、安全性、供應商依賴,以及長期技術主權等問題正受到更多關注。

在技術方面,Command A+ 採用 Sparse Mixture-of-Experts(MoE)架構,總參數達 2,180 億,但實際推理時只啟用約 250 億參數。這代表模型能維持大型模型能力,同時降低推理時所需運算資源。

Cohere 也針對量化(quantization)做了大量優化。Cohere 稱,Command A+ 提供 BF16、FP8 與 W4A4 等版本,其中 W4A4 採近乎無損壓縮方式,使模型可在單張 NVIDIA B200 GPU,或兩張 H100 GPU 上執行,同時降低延遲與成本。對企業來說,這代表部署門檻下降:過去需要大型 GPU 叢集才能執行的工作,如今可能在既有資料中心環境完成。

不只是開源,Command A+ 想解的是企業治理問題

除了硬體效率,Command A+ 另一重要能力攸關企業治理。根據《VentureBeat》,Command A+ 內建原生引用能力,讓模型在調用資料庫、搜尋系統或外部工具後,不只生成答案,也會標示內容對應的來源資料。對金融、醫療、法律等高監管產業來說,這種可追溯能力,可能比模型分數更接近正式部署需求,因為它降低了 AI 幻覺難以驗證的風險。

同時,Command A+ 也強調 Agent 工作流程。根據 Cohere 官方資料,模型原生支援工具調用、多步驟推理、RAG(檢索增強生成)與多模態文件處理,可直接連接 API、資料庫與企業工作系統。

開源模型進入企業競爭,重點從效能轉向導入能力

《Startup Fortune》指出,Command A+ 的發布反映了 2026 年中企業 AI 市場的真實狀態:隨著 Mistral、阿里巴巴 Qwen 3 等開源模型持續強化,部署靈活性對企業採購決策的重要性,已逐漸接近模型效能本身。

該分析認為,企業 AI 的下一階段競爭,不再只靠更大的上下文窗口或更快的 token 生成速度,而是取決於誰能在安全性、部署掌控力與實際企業流程的可用性上提出有力的論證。Cohere 以 Command A+ 押注的,正是想要高效能但不願意把資料主控權交出去的企業客戶。

【推薦閱讀】

Google I/O 2026 最大訊號:AI 競爭從模型能力轉向 Agent 經濟學

停止錯誤 AI 專案才是企業欠缺的能力:MIT 揭落地規模化的三大關鍵領導角色

AI 是時代的核彈,許多企業卻還當沖天炮在用?陶韻智:下一場競爭關鍵,是把 AI 納入數位勞動力

*本文開放合作夥伴轉載,資料來源:《VentureBeat》《Business Wire》Cohere《Startup Fortune》,首圖來源:Cohere

❌