阅读视图

发现新文章,点击刷新页面。

【資本慣性造成的戰略盲點】機器人市場規模是軟體的 30 倍,但資本投入差距 18 倍

【資本慣性造成的戰略盲點】機器人市場規模是軟體的 30 倍,但資本投入差距 18 倍

過去五年,全球有 745 家軟體公司拿到超過 3,000 萬美元的融資,同一時間獲得同等規模資金的機器人公司只有 42 家,差距將近 18 倍。但機器人對應的基礎市場規模,其實是軟體的 30 倍。

投資缺口與市場錯配

根據創投企業 Bessemer Venture Partners 的報告指出,多數分析師預測機器人產業在未來十年會成長 50 倍,Bessemer 合夥人 Jeremy Levine 更判斷,未來十到二十年地球上的機器人數量會成長十萬倍。

高盛集團在短短一年內,就把自己對 2035 年機器人市場規模的預測上修了六倍,Bessemer 認為即使是這種大幅上調過的數字,在節奏與量級上都還是低估了真實需求。人口結構的老化、製造業勞動力短缺、危險工作環境的替代工具,這些都是市場現實的剛性需求。

現在:GPT-2.5 時刻

Bessemer 把目前產業階段定位在「GPT-2.5 時刻」,也就是基礎模型已經展現出真實能力,實驗室展示與實際部署之間卻還有明顯落差。

2026 年 2 月發表的 EgoScale 論文也首次證實,機器人效能會隨著訓練資料規模可預測地提升,但真正屬於機器人的「ChatGPT 時刻」還沒到,Bessemer 判斷即將發生,只是這個時刻不會透過聊天框展示。

中國主導人形機器人,西方的戰略困境

2025 年全球出貨的人形機器人有將近 90% 來自中國,這個比例在一個還在發展初期的產業裡已經算是壓倒性。根據報告,總部設在中國的人形機器人公司有 161 家,遠遠超過美國。

不過需要先釐清一件事,人形機器人只是整體機器人產業的一個子集,之所以被單獨拉出來談,是因為它目前是資本市場最追捧、媒體曝光度最高的類別。

中國在這個子領域的主導,對西方來說不只是商業競爭問題,更是戰略問題。Bessemer 在報告裡直接指出,各國已經無法忽視一個結論,機器人正在從根本上改變現代戰爭的形態——民用供應鏈的集中度越高,軍事應用的依賴風險就越難切割,這套邏輯與過去半導體、衛星產業面對的情境一致。

而中國 AI 模型與美國的差距平均只落後七個月左右,這個差距每年都在縮短。

從投資數據可以看到資本市場已經提前反應。2025 年國防機器人公司的 A 輪融資後估值中位數達到 1.05 億美元,非國防同儕只有 5,000 萬美元,這個落差從 2021 年起逐年擴大。

Bessemer 的判斷是,機器人產業的第一批 500 億美元級別 IPO,會從國防類公司出來,而不是來自消費端的人形機器人;因為國防採購週期長但可預測、合約金額大、續約率高,買方同時擁有預算與急迫性,這些條件在商業市場裡都尚未同時成立。

資本慣性造就低估,先進場者才能撐過爬坡期

而資料是機器人效能提升的核心,但網路上機器人資料比文字稀缺好幾個數量級。全球機器人操作資料總量估計約 30 萬小時,相較之下網路影片約 10 億小時、文字約 300 兆 token。

Bessemer 估計,未來兩年整個產業的機器人資料成本會超過 30 億美元,而這無法靠爬蟲或向資料中介購買解決,必須一個任務、一個環境逐步生成。

結果會是規模更大、部署更多、資金更充裕的公司,能更快累積真實資料,形成自我強化的飛輪;這與 Waymo 和 Tesla 在自動駕駛領域,靠里程數與用戶資料建立起來的基石是同一套邏輯。

而世界模型與模擬學習提供了兩條降低依賴的替代路徑,但都不是免費的。

Meta 的 V-JEPA 2 用超過一百萬小時的網路影片訓練,只需再加 62 小時機器人專屬資料,就能在真實機械臂上達到 65% 至 80% 的抓放成功率,不過 NVIDIA 的 Cosmos 世界模型訓練就用了一萬顆 H100 GPU 跑三個月,可以說這種規模本身就是成本的賭注。

價值捕獲集中在全垂直整合玩家

價值捕獲的結構也與 LLM 不同。在語言模型產業,基礎模型公司透過 API 把能力抽象化,兩個人的團隊第一天就能用上 GPT-4。機器人做不到這種分層,部署需要特定領域的資料收集、環境微調、硬體整合、現場運維基礎設施,任務太多樣、環境太難預測,通用模型短期內根本無法直接上場。

結論是近期價值會集中在全垂直整合的玩家,他們同時掌握硬體、軟體、資料管線與客戶關係,類比的位置就像 LLM 領域的基礎模型公司。

Bessemer 預測最終贏家會少於 50 家,原因是人才集中度。美國過去五年融資超過 3,000 萬美元的機器人公司當中,43% 的創辦人擁有博士學位,其中 48% 來自 Stanford、MIT、Berkeley、CMU 這四所學校,56% 的公司至少有一位博士共同創辦人。這不是一個廣泛的人才生態,而是極窄的管道輸出極少量頂尖人才。

機器人產業的投資不足源自於資本慣性

最後,可以說機器人產業的投資不足,不是因為市場潛力存疑,而是因為資本慣性。軟體公司的回報週期短、現金流模式清楚、估值方法有共識,資本自然往這個方向流動。機器人需要長時間累積真實部署資料才能驗證效能,這與季度財報節奏有衝突,導致市場大幅低估了這個領域的長期價值。

而中國在人形機器人的主導地位如果持續,影響不會侷限在單一市場。民用機器人的供應鏈集中度會直接外溢到軍事應用場景,西方國防發展會更危險。

【推薦閱讀】

【機器人上前線】烏克蘭機器人攻下壕溝、中國 AI 沙盤推演台北街頭的群眾控制
◆ 【不是從零開始】為何自動駕駛走過的漫長彎路,成了機器人產業珍貴的競爭資產?
跑贏世界紀錄卻進不了工廠?拆解中國人形機器人狂飆背後的商用落地瓶頸

*本文開放合作夥伴轉載,參考資料:《Forbes》《Bessemer》,圖片來源:Nano Banana2 生成

(責任編輯:鄒家彥)

不寫程式也能吃到 AI 紅利:資料中心電工年薪可達 30 萬,不輸軟體工程師

不寫程式也能吃到 AI 紅利:資料中心電工年薪可達 30 萬,不輸軟體工程師

2026 年第一季,科技業在三個月內裁掉超過 7.3 萬人,部分統計甚至達到 7.85 萬。Oracle 一口氣砍掉一萬個職位,同時還在加碼 AI 投資;Meta 宣布五月前再裁約 8,000 人;Amazon 透過 AI 縮減企業層級的人力;Block 執行長 Jack Dorsey 把員工人數砍了將近一半,理由是智慧工具改變了遊戲規則。

這些公司給出的理由幾乎一致:AI 帶來的效率提升讓組織不再需要那麼多人。將近一半的裁員案例都被歸因於 AI。

AI 裁員潮的另一面:資料中心建設創造百萬技術職缺

同一時間,另一個領域的人才需求正在爆炸。支撐這場 AI 革命的,是一場規模高達 7,000 億美元的資料中心建設熱潮,部分經濟學家甚至認為這是當前美國 GDP 成長的主要引擎。

Meta 在路易斯安那州興建的 Hyperion 資料中心,面積是曼哈頓中央公園的四倍。這些龐然大物不會自己長出來,它們需要電工、需要懂液冷系統的工程師、需要佈光纖的技術人員、需要 HVAC 暖通空調的專家。

且薪資水準也說明了一切。一般技術員年薪中位數約 7.1 萬美元,資深電工輕鬆超過十萬,而擁有資料中心專業知識,特別是液冷與光纖佈線經驗的電工年薪可達 30 萬美元,與專科醫療或金融業的初階職位相當。

人力資源企業 Broadstaff 執行長 Carrie Charles 形容,這種角色「是一種白領的技術工作」,技術含量高,但不必整天坐在桌前。

跨國人力資源諮詢公司 Randstad 分析超過五千萬則職缺後發現,自 2022 年底 ChatGPT 問世以來,機器人技術員的需求翻倍,HVAC 工程師需求成長 67%,建築相關職缺成長 30%。

美國勞工統計局預估電工每年將有 8.1 萬個新職缺,成長速度遠高於平均。Randstad 執行長 Sander van’t Noordende 表示,全球科技成長真正的瓶頸不是晶片、能源或資金,而是建造這一切所需的專業人才嚴重短缺。

白領願意轉職,企業也開始砸錢鋪人才管道

值得注意的是,工作者也早已在省思自身的職涯路線。求職平台 FlexJobs 在 2025 年的調查顯示,若薪資與穩定性相當,62% 的白領願意轉入技術職;Z 世代當中,每四人就有一人正認真考慮這條路。

當 Anthropic 執行長 Dario Amodei 預測,AI 可能在五年內消滅一半的初階白領職位,以及美國科技創業家 Andrew Yang 警告,美國白領工作者中有 20% 到 50% 將面臨衝擊時,「換跑道」從一種選項變成一種必要。

另一頭,企業也開始有動作。貝萊德投入一億美元培訓水管工、電工與 HVAC 技術員,執行長 Larry Fink 公開表示 AI 創造的是技術工人的工作。美國第二大家居裝飾用品零售商 Lowe’s 砸下 2.5 億美元投入同樣的領域。Meta 與不動產公司 CBRE 合作推出 LevelUp 計畫,要培訓數千名技術員來建造 Meta 的資料中心。

這些投資的規模本身都代表,問題不是缺人這件事被低估,是企業已經在為長期的人才管道下注。

對科技從業者而言,這條路並非從零開始。寫程式所需的邏輯思維可以遷移到設備診斷,問題解決能力本就是技術職的核心,而多數技術職並不要求四年制學位,學徒制訓練體系完整。真正的門檻往往在心理層面:文科學位的學貸壓力、對「藍領」工作的偏見、害怕從六位數薪資的辦公桌走到現場會傷害自尊。

網路上當然不乏嘲諷的聲音,質疑被裁的工程師難道真要去當水電工。但拋開這些情緒化反應,數字本身已經很清楚,資料中心專業電工的薪資並不亞於原本的白領崗位。

不只是取代,是一場更複雜的職場重組

不過,把這場變化簡化為「AI 取代白領、技職崛起」的故事過於簡易。Scale AI 執行長 Jason Droege 直指,業界普遍存在「AI 漂洗」現象,許多公司把本來就要進行的常規裁員包裝成 AI 驅動的效率提升,OpenAI 的 Sam Altman 也承認部分裁員是借 AI 之名行人力縮編之實。

也就是說,並非所有失業的白領都真的被演算法取代了,但無論真實原因為何,市場上正在尋找下一站的人才已為數不少。

從職位層級來看,AI 的衝擊並不平均。初階白領首當其衝,撰寫初稿、整理資料、初步分析這類工作正是大型語言模型最擅長的領域。資深職位短期內仍難以取代,因為涉及判斷、責任與跨部門協調。

但這不代表資深員工就高枕無憂,相反地,他們正在承擔被裁掉的初階員工原本的工作量。

更值得思考的是,技術職人才短缺若持續惡化,將反過來限制 AI 擴張的速度。Broadstaff 的研究指出,人才短缺已經影響資料中心的施工進度、商轉時程與長期維運穩定性。

這種市場價值錯配的現象不會消失,它正在改寫接下來十年的職涯地圖。被裁的工程師與分析師面前出現的,不是單純的「降級轉職」,而是一個薪資、需求、長期穩定性都優於許多傳統白領職位的選項。但是要承認這一點,需要放下某些根深柢固的階層觀念,而市場已經用真金白銀給出了答案,遠比任何分析報告都更直接地說明了未來的方向。

【推薦閱讀】

◆ 不賣軟體給律師,Lawhive 如何以 AI 重構流程讓律師收入最高達傳統 2.8 倍?
博士、律師、棋王都來了!Mercor 用 AI 招募高技能人才來訓練 AI
律師事務所還得辦「AI 黑客松」?AI 正全面改變律師的工作方式

*本文開放合作夥伴轉載,參考資料:《WPN》《Fortune》,圖片來源:Unsplash

(責任編輯:鄒家彥)

追求零幻覺可能是錯誤目標,AI 幻覺問題從無解變成「可管理的技術挑戰」

追求零幻覺可能是錯誤目標,AI 幻覺問題從無解變成「可管理的技術挑戰」

大型語言模型自進入商業應用以來,「幻覺」始終是揮之不去的陰影。不過從 2021 年至今,這個問題的核心已經產生顯著變化。

理解當前 LLM 幻覺率的真實數據、技術應對策略的成熟度,以及創意與穩定性之間難以調和的問題,是企業在判斷是否導入前得需理解的關鍵發展。

幻覺問題的現況與高風險場景

過去五年間,整體 LLM 幻覺率從 2021 年的 38% 降至 2026 年的 8.2%,頂尖模型如 GPT-4o 與 Gemini 2.0,在特定基準測試中甚至能將錯誤率壓低到 0.7% 至 1.9% 之間。這個數據看似樂觀,但細究不同任務類型卻會有相當大的落差。

在 Omni-MATH 數學基準測試上,平均準確率僅 38.61%;GPQA 資料分析任務的準確率為 52.2%;MMLU-Pro 在教學或特定主題的精確查詢上更只有 0.67 分。

換言之,總體幻覺率的下降,並未平均分布於所有應用場景,數學運算、資料分析與專業建議等需要精確輸出的任務,仍是重災區。

史丹佛大學的研究發現,主要 LLM 在法律查詢上的幻覺率介於 58% 至 88% 之間;引用文獻的捏造率甚至高達 94%。這類錯誤之所以危險,正是因為模型不會表達不確定,而是用同樣流暢、權威的語氣呈現虛構資訊。

對於受高度監管的領域而言,這種錯誤模式幾乎是不可接受的。生成醫療案例摘要模型幻覺率可達 64.1%;法律 AI 工具即便在最佳狀態下,仍有 17% 至 34% 的錯誤輸出。金融與醫療對錯誤的容忍度極低,即使是頂尖模型 1% 至 2% 的錯誤率,在實務上仍可能引發合規風險、財務損失與法律責任。

真正解決幻覺:優化提示工程就可以達到一定效果?

面對幻覺問題,業界已發展諸多應對方案,其中以檢索增強生成(RAG)最為核心。RAG 透過外部驗證文件錨定模型輸出,將生成內容綁定於可查證的來源,根據各領域的實測,可將幻覺率減少 30% 至 70%。結合即時網路搜尋的設計,更能避免訓練資料截止日期所造成的過時問題;混合式檢索(關鍵字加語意搜尋)則進一步將準確度提升約 20%。

另外,驗證鏈(Chain-of-Verification)在生成最終答案前,先讓模型自行規劃驗證問題;還有 OpenAI 的「Let’s Verify Step by Step」研究指出,針對推理過程每一步給予回饋的「過程監督」,效果優於僅針對最終結果的「結果監督」,模型能更精確學習錯誤發生的位置。

自我一致性投票機制(Self-consistency)則是另一種思路。它讓模型針對同一個問題獨立生成多條推理路徑,每條路徑可能得出不同答案,最後採納出現次數最多的那個作為最終輸出。背後的邏輯是:正確答案通常能透過不同的推理過程抵達,而錯誤答案往往因隨機性而呈現分歧,因此「多數決」能有效過濾掉偶發性的幻覺。

上述驗證鏈、過程監督與自我一致性投票,本質上都屬於提示工程的範疇,它們不修改模型本身,而是透過設計查詢與互動方式來引導模型產生更準確的輸出。

研究顯示,僅透過提示工程的調整,即可將 GPT-4o 的錯誤率從 53% 降至 23%,效果不容小覷。

然而,提示工程單獨使用時效果脆弱,容易受到問題類型、模型版本與上下文長度的影響而失準,必須與檢索增強、微調等其他層次的技術組合,才能發揮穩定的防護效益。

抑制幻覺將同步削弱模型在創意上的表現

值得深思的是,幻覺與創造力共享同一套生成機制。模型之所以能寫出新穎的故事、提出意想不到的類比,正是因為它能在訓練資料的統計模式之外進行外推。

完全抑制幻覺,意味著也將同步削弱模型在創意寫作、腦力激盪與假設推理等任務上的表現。創意寫作任務中刻意產生的「幻覺」比例超過 70%,這並非缺陷,而是設計上的取捨。

正因為如此,目前業界的主流方向並非追求單一解法,而是採取混合架構,將檢索、推理與訓練等技術組合堆疊,讓彼此的弱點互相補位。檢索層由 RAG 負責,作用是「事實錨定」,以及前述的驗證鏈、過程監督與自我一致性投票,作用是「管理模型的推理路徑」,確保模型不會在邏輯推導中走偏,最後則是訓練與運行時層透過抗雜訊微調與 MARL 等中介軟體,從模型內部與執行環境兩端建立防護,作用是保障在前述流程失效時提供最後一道過濾。

三者協同運作的邏輯在於,RAG 解決「資料來源是否正確」、提示工程解決「推理過程是否嚴謹」、微調與中介軟體解決「模型本身是否容易出錯」,分別對應幻覺成因的不同層面,才能在多樣化的任務情境中發揮穩定效益。

對企業而言,這意味著導入策略必須從「追求零錯誤」轉向「設定可接受閾值」。應根據場景的風險等級、錯誤的可逆性與決策的影響範圍,制定差異化的防護層級。

幻覺問題不會消失,但已在可控範圍內

LLM 幻覺問題在過去五年間已從「無解的根本缺陷」轉變為「可管理的技術挑戰」,但這並不意味著問題本身已被解決。整體幻覺率下降至 8.2% 是顯著進步,頂尖模型在受控任務中達到個位數錯誤率也令人鼓舞,然而真實世界的複雜場景,尤其是法律、醫療與多步驟推理仍可能呈現雙位數甚至過半數的錯誤比例。

對企業決策者而言,三個關鍵思考方向值得持續關注。其一,技術必須與業務情境對齊,基準測試上的優異表現不等於特定領域的可用性,導入前的場景化評估不可省略。

其二,防護必須採取堆疊策略,沒有任何單一技術能獨力解決幻覺問題,RAG、提示工程、微調與驗證機制需要協同部署。

其三,組織治理與技術同等重要,導入 AI 治理框架的組織能將幻覺相關風險降低,這提醒我們,工具的可靠性最終取決於使用工具的流程與人員。

【推薦閱讀】

◆ 不賣軟體給律師,Lawhive 如何以 AI 重構流程讓律師收入最高達傳統 2.8 倍?
博士、律師、棋王都來了!Mercor 用 AI 招募高技能人才來訓練 AI
律師事務所還得辦「AI 黑客松」?AI 正全面改變律師的工作方式

*本文開放合作夥伴轉載,參考資料:《WPN》《SQ Magazine》,圖片來源:Unsplash

(責任編輯:鄒家彥)

【AI 時代業務警示】銷售自動化的悖論:為什麼全自動化反而侵蝕業務根基?

【AI 時代業務警示】銷售自動化的悖論:為什麼全自動化反而侵蝕業務根基?

當 AI 能自動寫開發信、找潛在客戶、甚至跑完整段對話流程,很多業務團隊就開始把它當成萬能外包,讓機器負責開發銷售,人去負責收單。

但業績並沒有因此源源不絕,而問題不在 AI 不夠強。

全自動化銷售會產生哪些風險?

銷售本質上是考驗業務員隨機應變的能力,資深業務知道何時該推進、何時該後退、何時客戶是真感興趣還是出於禮貌。AI 在這方面還有不少的限制,包括機器學習模型擅長從歷史資料識別模式,但銷售發生在當下此時此刻,其中的變數太多。

舉例來說,或許上個月對你產品有興趣的客戶,這個月可能正面臨預算凍結或部門重組。預設的自動化機器缺乏情境感知能力,仍會按照業務 SOP 邏輯繼續發信,想當然客戶買單的機率就更低。

另外,當收件者察覺自己面對的不是真人,他們會把信件標記為垃圾郵件,並對品牌產生負面聯想,且這個傷害會隨時間累積。當自動化活動持續產生低互動與垃圾舉報,域名聲譽便開始下滑,最後就導致真的要傳遞重要訊息的信件,完全進不了客戶的收件匣。

最棘手的是時間差。多數企業要等到開信率明顯衰退、回覆停滯、客戶抱怨從未收到信時才察覺問題,而此時域名聲譽已需要數個月才能修復。

更糟的是,企業投入資源啟用新域名、重建基礎設施、重跑流程的同時,自動化工具仍會在後台持續產出當初造成問題的內容。

人機分工才是正解:技術跑規模,人類管決策

破解之道不是棄用 AI,而是建立「技術賦能、人類主導」的架構。許多自動化工具擅長規模的機械性任務,包括域名輪換、送達率監控、資料驗證、名單管理;人類則掌控決策與所有直接接觸客戶的環節,包括開發對象的篩選、訊息客製化、文案撰寫,以及活動執行的每個階段。

真正理解目標客群的人所撰寫的訊息,轉換表現不僅顯著優於 AI 生成的版本,更關鍵的是,人工介入提供了預警機制;當問題還未擴散到大量收件者前,人類就能察覺異常並介入修正,這是純自動化系統無法提供的保護。

三個不可妥協的原則

除此之外,要讓自動化真正發揮利益槓桿而非反噬業績,有幾項原則不可妥協。首先必須誠實區分哪些任務真正受惠於自動化,哪些需要人類判斷,並在關鍵決策點建立人工審核機制,確保自動化執行前有人類把關。

其次是監控指標的選擇。多數企業只盯著營收數字,等到收入受損才介入往往為時已晚。真正應該優先監控的是預警型指標,包含垃圾信舉報率、域名聲譽分數、互動趨勢變化等,這些訊號在營收受損之前數週甚至數月就會出現,提供寶貴的修正窗口。

最後也最關鍵的,是釐清技術與業務的主從關係。技術工具的存在是為了服務業務目標,而非反過來讓業務流程配合工具的限制。對於標榜「完全取代人工」的解決方案,應該保持懷疑。

真正成熟的工具會清楚說明它能做什麼、不能做什麼,並把關鍵決策權留給使用者;而過度承諾的方案,往往把複雜的判斷簡化成幾個按鈕,最後留給企業的是受損的域名聲譽、流失的潛在客戶。

總結來看,銷售自動化的真正價值不在於做更多事,而在於把精力投注在正確的地方。

AI 並沒有取代銷售,它只是暴露了傳統銷售模式的低效。當企業願意承認 AI 的能力邊界,把它放在它擅長的位置,把人類放在需要判斷、與客戶情感連結的環節,自動化才會變成真正的競爭優勢。

【推薦閱讀】

◆ 不賣軟體給律師,Lawhive 如何以 AI 重構流程讓律師收入最高達傳統 2.8 倍?
博士、律師、棋王都來了!Mercor 用 AI 招募高技能人才來訓練 AI
律師事務所還得辦「AI 黑客松」?AI 正全面改變律師的工作方式

*本文開放合作夥伴轉載,參考資料:《Techradar》《Forbes》,圖片來源:Unsplash

(責任編輯:鄒家彥)

【劍橋團隊潛入地下論壇】「AI 超級駭客」威脅被過度渲染,真正安全隱患是科技業裁員潮

【劍橋團隊潛入地下論壇】「AI 超級駭客」威脅被過度渲染,真正安全隱患是科技業裁員潮

過去三年,從資安公司、各國政府到 AI 實驗室,幾乎都用同一套劇本警告大家:生成式 AI 將催生新一代「超級駭客」,網路犯罪即將進入失控的階段。然而劍橋大學、愛丁堡大學與蘇格蘭的斯特拉斯克萊德大學的研究團隊近期發表了一篇論文,研究團隊實際到地下論壇蹲點,得出的結論幾乎完全與主流所想相反。

這份名為《Stand-Alone Complex or Vibercrime?》的論文發現,那些被預期會使用 AI 大幅強化自己犯罪技能的網路犯罪者,實際上多半只是拿 ChatGPT 來量產垃圾部落格、製作詐騙用的生成內容,距離我們想像的「超級駭客」還相當遙遠。

研究團隊親自蹲點調查,「AI 末日論」不存在?

研究團隊從劍橋網路犯罪中心的 CrimeBB 資料庫中,分析了 ChatGPT 上線後地下論壇的 97,895 則討論串,搭配主題模型分析、研究團隊親自閱讀超過 3,200 則貼文,並蹲點在地下論壇長期觀察。結果顯示,高達 97.3% 的討論串被歸類為「其他」,也就是根本與利用 AI 進行犯罪無關,真正涉及 vibe coding 工具的僅占 1.9%。

研究者直言,這份結果對「AI 末日論」的信仰者來說相當現實。

WormGPT、FraudGPT 這類在 2023 年被媒體大幅報導的「黑暗 AI」產品,當時被描繪成專為犯罪者打造、毫無道德限制的攻擊工具,外界普遍擔心它們會成為駭客大規模武器化的起點。然而當研究團隊真的潛入地下論壇追蹤這些產品的實際使用情況,看到的景象與媒體敘事幾乎是兩回事。

且論壇中與這些工具有關的貼文,絕大多數並不是在交流如何用它發動攻擊、撰寫惡意程式或執行詐騙;相反地,最常見的內容是使用者排隊索取免費試用權限、彼此猜測這套工具到底能做什麼、抱怨付費後發現功能根本跑不動,或是質疑開發者是不是在騙錢。

更關鍵的是來自開發者本人的自白。其中一款被廣泛報導的黑暗 AI 服務,在專案收攤前,開發者直接對論壇成員承認,這個產品本質上就是一場行銷操作,它根本不是什麼專為犯罪打造的特殊技術,也沒有獨家的攻擊能力。「說到底,它不過是一個沒有限制的 ChatGPT,任何人用網路上常見的越獄技巧,都能達到同樣甚至更好的效果。」

連駭客都不太敢仰賴 AI?

那麼 AI 究竟在哪些犯罪場景真的派上用場?答案落在食物鏈最底層的低技術、高產量領域。

SEO 詐騙者用大型語言模型量產部落格垃圾文,以追逐萎縮中的廣告收益;愛情詐騙業者把語音克隆與影像生成用在詐騙上;還有不少投機者則大量產出 AI 撰寫的電子書,每本賣 20 美元。

其中比較嚴重的是非法裸照生成服務,已形成明碼標價的市場,譬如營運者會公開叫賣:「我能把任何女生變裸照……一張 1 美元、十張 8 美元、五十張 40 美元、九十張 75 美元。」這些都不是什麼高深的網路犯罪,而是過去二十年網路上一直都有的低毛利、高產量老套路,只是換了更好用的工具。

AI 編程工具在駭客圈的真實用法

在程式碼撰寫的層面,這份論文也正面回應了 Anthropic 在 2025 年 8 月發布、後續被各大媒體廣泛引用的「vibe hacking」事件報告。該報告指稱有犯罪者利用 Claude Code 對 17 個組織發動勒索行動,被視為 AI 親手協助執行網路攻擊的標誌性案例。然而劍橋團隊比對自身蒐集的論壇資料後指出,在整個地下犯罪生態中,並沒有出現類似的模式擴散,這比較像是少數個案,而非已經成形的趨勢。

研究觀察到的真實情況是,AI 編程助手在駭客圈的用法,與一般軟體工程師其實沒有什麼差別,能從這類工具獲得實質效益的,本來就是已經具備一定程式設計能力的人。至於技術門檻較低的人則偏好直接套用網路上流通的現成腳本,因為這些腳本拿來就能跑、不需要理解原理。

換句話說,AI 並沒有像外界擔心的那樣,把「不會寫程式的人」一夜之間變成「能寫攻擊工具的人」,它拉近的技能差距其實相當有限。

更值得注意的是,駭客社群本身對 AI 生成的程式碼也抱持高度懷疑。研究者引用論壇中一位使用者的警告:「使用 AI 寫程式會讓你的技能以非常快的速度退化。如果你的目標只是量產 SaaS 詐騙、不在乎程式品質、安全性或效能,那麼用 vibe coding 是行得通的,拿來做釣魚攻擊大概也可以。」

也就是說,AI 寫出來的程式碼適合用在那些低品質場景,但對於需要穩定運作、規避偵測、長期維護的駭客攻擊工具來說,駭客都不太敢仰賴 AI。

科技業大裁員的威脅大過「超級駭客」的存在

最後,該研究還認為,生成式 AI 對網路犯罪生態最關鍵的衝擊,不是讓現有罪犯變得更強,而是科技業的大規模裁員、經濟衰退與冷淡的就業市場,可能把一批真正有實力的合法開發者推向地下社群,去尋找速成致富、詐騙與網路犯罪的機會。

這個視角把 AI 風險的討論從技術層面拉回到社會層面。長期以來,產官學界傾向把網路犯罪的 AI 化視為一場模型能力與防禦機制的競賽,但劍橋團隊研究卻指出,決定地下社群人才規模的,可能不是開發技巧進步多少,而是合法就業市場還有多少空間可以吸納這些開發者。

這意味著目前市場因應策略也該重新校準,與其把所有資源投入防堵尚未成形的「超級駭客」威脅,不如同步關注科技業裁員潮、技術人才失業率與再就業管道,因為這些看似與資安無關的指標,恐怕才是未來犯罪生態變化的真正前導訊號。

【推薦閱讀】

◆ 擊敗 Mythos:微軟發表 AI 資安代理系統 MDASH,漏洞研究進入多代理時代
Google 首次攔截 AI 零日攻擊,駭客武器化漏洞的高速戰役正式開打
Anthropic Mythos 太會找漏洞:Firefox 修補數暴增 13 倍,工程師坦言還沒有自動化解方

*本文開放合作夥伴轉載,參考資料:《Decrypt》Cornell University,圖片來源:Unsplash

(責任編輯:鄒家彥)

150 家公司搶一個還沒成形的市場,中國人形機器人產業的供需失衡有多嚴重?

150 家公司搶一個還沒成形的市場,中國人形機器人產業的供需失衡有多嚴重?

中國人形機器人產業的生產端與需求端,正在往兩個完全不同的方向走。目前中國有超過 150 家企業投入這個領域,光去年全球人形機器人出貨量就有九成來自中國,而 Unitree 與 AgiBot 兩家龍頭合計估值衝上 130 億美元。

從這些數字看,產業似乎正在高速起飛,但當摩根士丹利去調查實際買方時,卻是不同的光景。

首先,只有 23% 的受訪企業對市面上的產品感到滿意——電池續航停在兩到三小時,靈巧度與感知能力不足以應付真實工作場景;而且定價更讓大規模採購成為奢望,92% 的受訪企業表示,售價必須跌破 28,000 美元才會考慮大量採購。此外,目前真正在進行評估或試點的企業,只有約一成。

技術或許逐漸到位,但市場需求還沒出現

這個落差並非短期的庫存問題,而是整個市場的供需失衡。中國國家發展和改革委員會在 2025 年底罕見對外發聲,點出產業內公司數量已突破 150 家且仍在增長,過半為新創或跨界進入者,並警告產品重複、投資冗餘、真正研發空間遭到擠壓。

北京最高層級的經濟規劃單位公開講出「泡沫風險」這四個字,更凸顯現實狀況確實不明朗。

畢竟人形機器人已被中國列進「十五五」規劃(2026-2030年)的十大優先產業之一,背後還有一兆人民幣的國家基金在支撐,等於是政府自己跳出來表態,自己扶植的這個產業已經過熱了。

還有一點更值得注意,這些機器人大廠如今生產出來的機器人,大部分根本沒賣給真正會付錢的客戶,而是留在自己公司內部,拿來訓練機器人、測試系統用。

摩根士丹利分析師指出,2026 年人形機器人企業必須證明自己商模能真正變現,但現實卻是廠商生產出來的量明顯多過真正賣出去的量。且那些好看的出貨數字裡,有一大部分其實是廠商自己使用的,包括訓練機器人、測試系統等,根本尚未轉換成真正的收入。

即便 Unitree 的人形機器人在 2025 年的營收超越四足機器人,但整體規模對照它瞄準的 70 億美元估值,還是略顯不足,而準備在香港掛牌、估值 60 億美元的 AgiBot 也一樣。

馬斯克也坦承人形機器人尚未真正派上用場

再把鏡頭拉回去年那場北京 E-Town 半程馬拉松,Honor 做的 Lightning 機器人用 50 分 26 秒拿下冠軍,比人類世界紀錄還快了將近七分鐘,超過一百台機器人同場較勁,畫面紅遍全球。獲勝團隊的工程師說,這場比賽幫他們在機器人穩定性和散熱上做出突破,未來可以用到工業場景。

但機器人專家的看法就保守多了,他們認為,在平地上連續用兩隻腳跑步,跟工廠真正需要的「手要靈巧、看得懂環境、能臨機應變」根本是兩種完全不同的能力。春晚的武術表演、CES 上一整排展示、後空翻的短影音,這些畫面吸引到資本進場,但若轉換到實際應用,真的可行嗎?

中國過去在太陽能、電動車、動力電池上都展現過「把技術變現」的能力,十年內就把這些東西做成主導全球的出口產業。問題是,人形機器人從「表演」走到「真實應用」的這段距離會有多遠?

至於美國,Boston Dynamics 的電動 Atlas 已經在 2026 年 1 月開始量產,鎖定向 Hyundai 工廠交數萬台;Figure AI 去年 9 月融資後估值衝到 390 億美元;Tesla Optimus 則已經在自家工廠執行基礎工作,馬斯克說要把價格壓到 2 到 3 萬美元,但他自己也承認還沒真正派上用場。

若單以價格上來看,中國目前還是領先,Unitree H2 和 Kepler 都瞄準 3 萬美元以下。不過五角大廈給 Foundation Future Industries 的 2,400 萬美元軍用人形機器人合約,等於劃出了一塊中國廠商進不去、但戰略價值很高的市場。

領跑條件全到位,卻無法與市場對接?

接下來的市場洗牌幾乎是必然,150 家公司正在搶奪 2025 年只賣出大約 1.4 萬台的中國市場,最後能活下來的,會是少數玩家。

而剩下的公司,或許會在燒完手上的錢之後,留下一堆工程上看起來很厲害、但除了展會以外無法在任何工業應用場域大展身手的人型機器。

如今,中國有製造基礎、有零組件供應鏈、有政府支持、有工程人才,可以說領跑全球的條件全都齊了,但它現在唯一缺的就是市場本身。

【推薦閱讀】

◆ 2.8 萬台人形機器人已登記 ID:中國正在把 AI 治理延伸到實體世界
◆ 美國人形機器人為何無法規模化上工?前 NASA 機器人部門負責人:只做單一任務,很難創造 ROI
◆ 【資本慣性造成的戰略盲點】機器人市場規模是軟體的 30 倍,但資本投入差距 18 倍

*本文開放合作夥伴轉載,參考資料:《TheNextWeb》《Morgan Stanley》,圖片來源:Unsplash

(責任編輯:鄒家彥)

❌