「機器人已進駐工廠,但目前還不夠聰明,」郭錦斌指出,儘管各產業已逐步導入機器人協作,但現階段「智力」仍顯不足,需依賴大量人力示教,同時面對 Physical AI 數據稀缺、場域適應成本高、懂 AI 的複合人才稀缺以及如何符合安全合規等現實挑戰。
為破解數據瓶頸,並讓機器人真正具備大腦,鴻海與 NVIDIA 透過數位孿生及遙操數據採集技術建構虛擬練功場。首先將實體場域掃描匯入 NVIDIA Omniverse 進行 3D 建模,並於 Isaac Sim 仿真環境中進行模擬,讓機器人在零風險環境下利用 GR00T VLA 模型進行強化學習,接著最關鍵的一步在於透過 GR00T Teleop 將人類遙控操作的經驗轉換為訓練數據,透過工程師進行「遙操」示範,教導機器人如何避開障礙物、抓取特殊形狀的物件,將人類的經驗轉換為機器的訓練數據。最後當這些機器人在虛擬環境中經歷試錯與優化後,才會透過 OTA 技術同步部署至實體的工廠設備上,協助製造業者在精密組裝換線調校上,讓原本耗時 3 個月的過程,降低至 2~3 週,提升 OEE 整體設備效率。
隨著技術逐步落地,鴻海進一步將 Physical AI 的應用歸納為三個進化等級。初級應用聚焦於「簡單且固定」的場景,例如自走車(AGV)或自動上下料系統,透過 AI 自動排程與路徑優化,穩定提升15 %~20 % 的作業效率。中階應用則是強調「簡單但具彈性」,例如手機側邊按鍵的精密組裝或是醫療手術室中的刷手機器人,此階段重點在於整合視覺感知與力回饋技術。最高等級則是「複雜且高度彈性」的應用,如人形機器人或雙臂柔性組裝機器人,不僅有多模態的理解能力與自主決策力,以適應多變的工作環境,實現真正的智慧生產。
鴻海科技集團智慧製造平台處長郭錦斌表示,Physical AI 在落地真實場域時仍面臨四大挑戰。
然而,Physical AI 在落地真實場域時仍面臨四大挑戰。首先是數據稀缺性,需要仰賴遙操技術採集訓練資料;其次是場域適應成本極高,由於各工廠或醫院都具備物理約束與安全規範,導致模型難以跨場景使用;第三是複合型人才短缺,業界缺乏精通產業知識與 AI 技術的複合型專家;最後,安全合規問題亦必須納入核心考量。
為破解上述僵局,郭錦斌表示,「需要有一個企業共用的平台,讓所有的 Physical AI 在平台上共同作業,所以我們建造了一個生成式 AI 共性架構 —— 智慧製造創世紀平台。」從定義真實產線需求,再由 Genesis 系統以標準化工具 Agent 打造客製化 AI Agent,隨後即可將 AI Agent 部署到應用場域 ,再透過營運中累積的經驗或更多不同的場景,將採集的數據 Token 化,進一步回饋至模型進行持續訓練與優化,最後形成一個應用解決方案的開發、部署、運營完整閉環。
「Physical AI 不只是一台機器人,是整個場域的智慧化升級,」郭錦斌表示,鴻海提供的這套機制讓機器人不僅會執行指令,更學會自主思考與拆解任務步驟,實現生產效率的持續進化。
「傳統產業導入 AI 或人機協力後,優化過去的生產動線與流程,就能緩解缺工帶來的營運危機,」台南市副市長趙卿惠在近日(4/28)由 TechOrange 科技報橘舉辦的「AI 智慧大工廠論壇」指出,隨著 Physical AI 的技術逐漸成熟,人形機器人、機器手臂及各類自動化服務將加速滲透至製造產業中,注入自動化生產的新動能,企業如何透過人機協作搶佔先機,已成為核心課題。
鴻海打造 Physical AI 虛擬練功場,突破數據瓶頸
「機器人已進駐工廠,但目前還不夠聰明,」鴻海科技集團智慧製造平台處長郭錦斌指出,儘管各產業已逐步導入機器人協作,但現階段「智力」仍顯不足,需依賴大量人力示教,同時面對 Physical AI 數據稀缺、場域適應成本高、懂 AI 的複合人才稀缺以及如何符合安全合規等現實挑戰。
為破解數據瓶頸,鴻海與 NVIDIA 透過數位孿生及遙操數據採集技術建構虛擬練功場。首先將實體場域掃描匯入 NVIDIA Omniverse 進行 3D 建模,並於 Isaac Sim 仿真環境中進行模擬,讓機器人在零風險環境下利用 GR00T VLA 模型進行強化學習,並透過 GR00T Teleop 將人類遙控操作的經驗轉換為訓練數據,再將成熟的模型部署至實體場域,協助製造業提升 OEE 整體設備效率以及降低設備實體測試與調教時間。
「需要有一個企業共用的平台,讓所有的 Physical AI 在平台上共同作業,所以我們建造了一個創世紀的平台,」郭錦斌進一步介紹鴻海的「智慧製造創世紀平台」如何協助企業導入 AI 的完整路徑。從定義產線需求,再由 Genesis 系統以標準化工具 Agent 打造客製化 AI Agent,隨後即可將 AI Agent 部署到應用場域,再透過營運中累積的經驗或更多不同的場景,將採集的數據 Token 化,進一步回饋至模型進行持續訓練與優化,最後形成一個應用解決方案的開發、部署、運營完整閉環, 藉此實現生產效率的持續進化。
在邁向 AI 原生工廠的變革中,達梭系統大中華區資深技術經理陳哲基以「工業世界模型如何打造 AI 原生工廠」為題,提出從自動化跨向自主化的工業願景,透過建構 3D UNIV+RSES 打造多維度的虛擬孿生。
「藉由 AI 算力協助工程師累積專業經驗的 Know-How,協助工程師達到更快速、自動化的設計目標,」陳哲基強調企業轉型的核心價值在於建構專屬知識庫,將過往繁雜的工程經驗轉化為自動化與快速設計的驅動力。在技術實作層面,達梭系統利用點雲物件檢索掃描真實環境並進行物件實例化,將識別出的機器人、管道或生產線替換為虛擬孿生模型,讓設計人員能夠直接在 3DEXPERIENCE 平台進行佈局優化,並由 AI 引導重建 3D 模型,縮短數位轉型路徑。另外,針對實體廠房佈署,達梭系統透過生成式 AI 與虛擬助手輔助,在廠房與機器人建置動線前先行完成模擬演練,確保生產線的穩定性與高效率。
「不用再花 5 年、10 年學習數位工廠如何運作,就能夠快速導入 AI 與落地驗證,」陳哲基表示,透過虛擬助手以及虛擬孿生的模式,讓企業能快速打造具備自主優化能力的智慧工廠,在可控風險下提升產能。
為突破工廠自動化的瓶頸,耐思尼透過數位孿生與 Sim-to-Real 技術,建構具身智能「感知、推理、行動」三步驟循環,這套架構讓 AI Agent 在虛擬環境中先進行大規模學習,再落地至現實中的自主巡檢、自主焊接或高空作業等設備上。 「我們希望讓 AI 走出螢幕,」陳江川表示,耐思尼的長期願景是打造通用型工廠,讓不同類型的機器人在統一 AI 框架下協作,實現從專用設備轉向通用平台的大規模智慧化生產,讓工廠無需為自動化頻繁更動環境,成為推動智慧工廠持續進化的助力。
Meta 近日正式宣布,已收購專注於開發人形機器人 AI 模型的新創公司 Assured Robot Intelligence(ARI)。 針對這項關鍵佈局,Meta 發言人透過聲明表示:「我們收購 ARI 這家位居機器人智慧前沿的公司,為的就是讓機器人能在複雜、動態的環境中,精準理解、預測並適應人類行為。」
這步棋背後的戰略意義極為清晰。在特斯拉(Tesla)、Google 與亞馬遜(Amazon)等科技巨頭紛紛重金投資人形機器人的此刻,這筆交易也宣示 Meta 的 AI 戰略正進一步延伸到機器人控制、自我學習與實體人工智慧(Physical AI)等高階應用領域,正式加入這場「實體 AI」競賽。
透過這次收購,Meta 得以大幅補強在機器人控制領域的不足。Meta 發言人特別指出,由 Lerrel Pinto 與 Xiaolong Wang 兩位頂尖學者領導的 ARI 團隊,將在模型設計、機器人控制、自我學習等前沿能力上,為 Meta 帶來深厚的專業知識。
ARI 早期投資方 AIX Ventures 合夥人 Nick Crance 也強調,ARI 的核心優勢在於機器人的「高精度靈巧度與操作」。這些核心能力攸關機器人未來能否在工業場域或家庭環境中,實際且有效地與現實世界的物體進行互動。
Meta 的野心:成為機器人界的 Android
在取得關鍵的「大腦」技術後,Meta 隨即展開內部團隊的深度整合。收購完成後,ARI 團隊將正式併入 Meta 的「超級智慧實驗室(Superintelligence Labs, MSL)」研究部門,並與去年成立、專注於人形機器人底層技術的 Meta Robotics Studio 展開密切合作。
事實上,Meta 的實體 AI 佈局早已醞釀多時。在 2025 年,Meta 已於 Reality Labs 內部成立機器人團隊,隨後又延攬新的領導者並大幅擴編 MSL 的硬體團隊。這也顯示出,Reality Labs 與 MSL 正透過 AI 硬體與機器人技術的發展,逐漸交織與整合。一份在一年前外流的內部備忘錄也曾揭露,Meta 早已有意打造包含硬體與 AI 模型在內的消費級人形機器人。
目前,Meta 的機器人團隊正積極開發自家的機器人硬體,以及驅動這些硬體的底層 AI 技術,涵蓋感測器、軟體及其他相關應用。但 Meta 的目光不只是打造單一的機器人產品,更宏大的計畫是將這些機器人技術「開放」給整個產業採用,進一步為人形機器人市場打造一個通用的「基礎平台」,就如同 Android 作業系統與高通(Qualcomm)晶片在智慧型手機產業中所扮演的角色。
從元宇宙到千億 AI 資本支出,Meta 的下一個賭注是 Physical AI
從更宏觀的戰略來看,ARI 的收購案只是 Meta 龐大 AI 藍圖的冰山一角。近年來,Meta 已將大量資源從元宇宙(Metaverse)的擴增實境計畫大舉轉移至 AI 領域。 例如,就在上個月,Meta 剛發布了名為「Muse Spark」的新型大型語言模型,並宣稱具備與 Google、OpenAI 及 Anthropic 等領先模型競爭的實力。
為什麼 Meta 願意投入如此鉅資?因為即使 Meta 最終並未在市場上推出消費型的人形機器人產品,許多 AI 專家現在仍普遍認為,通往「通用人工智慧(AGI)」的路徑,勢必需要讓 AI 模型在物理世界中進行訓練,進而透過機器人的直接互動來學習,而非只仰賴靜態的資料數據。
ARI 的收購案,加上近期亞馬遜收購另一家由 ARI 共同創辦人 Lerrel Pinto 先前所創立的新創 Fauna Robotics,反映出整個產業正在進行一場更廣泛的衝刺。 儘管目前市場對人形機器人的長期預測仍存在極大落差:高盛預估到 2035 年市場規模為 380 億美元;摩根士丹利則預測 2050 年將達 5 兆美元。不過,這種巨大的預期差距,恰好突顯市場同時具備的龐大潛力與高度不確定性。
這次 Meta 收購 ARI 的策略,目的是將 AI 模型、機器人控制、自我學習能力與硬體團隊,全面整合到 Superintelligence Labs 與 Robotics Studio 的體系之中。 假如 Meta 能成功將這些底層技術開放給產業鏈使用,那麼在人形機器人領域的佈局就不再只是一條單一產品線,而是朝向建立如同 Android 般的基礎平台前進,藉此牢牢掌握下一代運算平台的主導權。
英特爾在本週宣布,延攬在高通任職逾 24 年的資深高階主管 Alex Katouzian 出任執行副總裁暨客戶端運算與實體 AI 事業群總經理,直接向執行長陳立武(Lip-Bu Tan)彙報,並預計於 5 月正式到職。
這項人事任命的意義,遠不止於補齊高階職缺,更象徵英特爾將傳統 PC 業務與快速興起的實體 AI 領域整合為一,押注 AI 應用重心從雲端訓練轉向終端推論的趨勢。
從 PC 到實體 AI,英特爾正在重新想像運算邏輯
Katouzian 在高通最近的職銜為行動、運算與延展實境事業群執行副總裁暨總經理,正是推動高通以 Snapdragon X 系列處理器切入 PC 市場的關鍵人物之一。這款晶片於 2024 年作為微軟 Copilot+ PC 品牌電腦的首發晶片登場,是高通向英特爾與 AMD 長期主導的 PC 市場發動的正面挑戰。
根據英特爾說法,Katouzian 接下來的首要任務,是將既有的客戶端運算業務,與涵蓋機器人、自主設備與各類 AI 裝置的實體 AI 系統整合發展。
陳立武指出,「AI 正在邊緣端創造前所未有的機會,並推動客戶端運算與實體 AI 系統發生重大轉變。」他認為,Katouzian 是帶領英特爾重新定義 PC 以外運算模式、銜接實體 AI 下一波成長的重要人選。
這代表英特爾的戰略已不再局限於 PC 市場本身,而是將 PC 視為整個 AI 生態的一部分,延伸至機器人、自動化設備與邊緣推論場景。
在組織架構上,原本直接向陳立武彙報的客戶端運算事業群負責人 Jim Johnson,以及矽晶與平台工程事業群負責人 Mike Hurley,將改為向 Katouzian 彙報。Johnson 是擁有 40 年資歷的英特爾老將,於去年 9 月獲陳立武任命領導客戶端運算事業群;Hurley 則是長期工程主管,同樣是陳立武上任後的重要部署。
Katouzian 的職掌範圍反映出英特爾對邊緣推論商機的戰略判斷。《CRN》報導,陳立武在內部備忘錄中指出,英特爾已經重新站回 AI 競賽的核心,並在邊緣運算與實體 AI 系統領域看到大量新機會。
英特爾目前已在這個方向有所布局,包括推出 Intel Robotics AI Suite,旨在為現有 x86 機器人部署新增能力,且無需進行高成本的系統翻修。Katouzian 本人也在聲明中表示,英特爾正在為 AI 驅動的轉型奠定基礎,涵蓋 AI PC 領先地位的鞏固、邊緣 AI 推論的規模化,以及實體 AI 系統未來的加速發展。
通路商看見「解決方案的解決方案」商機
對於這項人事變動,英特爾的系統整合合作夥伴反應正面。總部位於南達科他州北蘇城、曾獲英特爾北美夥伴獎的 Sterling Computers 技術長 Christopher Cyr 告訴《CRN》,延攬 Katouzian 的決策符合邏輯,因為英特爾正加大力度降低晶片功耗,而這正是高通長期具有競爭優勢的領域,在推論運算成為 AI 商機主戰場的趨勢下尤為重要。
Cyr 進一步指出,實體 AI 為通路夥伴帶來的商機規模可觀,「這是一個解決方案的解決方案,」他說:「你需要軟體、你需要晶片組,還要考量所在的產業,無論是製造業還是物流業,我認為夥伴有大量機會。」這番話點出了 AI 商機的結構性轉變:對通路商與系統整合商而言,AI 已不再是單一硬體產品的採購,而是涵蓋晶片、軟體與垂直產業應用的整體解決方案市場。
「未來基本上就是 AI 對 AI,」談到未來的資安格局,VicOne 執行長鄭奕立強調,隨著生成式 AI 技術快速成熟、具身 AI(Physical AI)迎來爆發期,AI 正跨越螢幕與雲端,擁有能直接影響現實世界的身體與大腦。
面對這波從虛擬邁向物理世界的全新挑戰,VicOne 憑藉過往在全球軟體定義汽車領域累積的深厚防護經驗,積極將資安戰線從智慧車延伸至機器人、無人載具與無人機等領域,防範失控的 AI 模型對周遭人類帶來的致命風險。
AI 機器人的資安挑戰不只在模型,也在硬體極限
從底層架構來看,智慧車與機器人的軟體架構及通訊協定高度相似,但在 AI 模型的感知與控制上,卻有著顯著差異。鄭奕立解析,車用 AI 模型的主要任務是「防撞」,仰賴視覺與距離感測,本質上偏向 2D 空間的運作。然而,因為機器人有實際執行任務的需求,在做拿取物品、削水果等複雜動作時,就必須具備強大的「空間智慧(Spatial Intelligence)」,才能讓 AI 精準判斷環境的厚度、深度與距離。
更具挑戰的是硬體的先天限制。鄭奕立指出,傳統 IT 領域為了控制成本,機器人的硬體算力通常設計得「剛剛好」。這代表企業的思維不能像過去買傳統 PC 一樣,「買回來覺得需要再安裝防毒軟體」,因為機器人其實沒有多餘的容量安裝後加的防護程式。因此,鄭奕立提醒,這種硬體極限,將徹底顛覆企業「先買設備、再想資安」的傳統採購習慣。
一張圖就能讓機器狗失控:VicOne 揭 Physical AI 的五大攻擊面
VicOne 團隊也現場展示一隻內建 AI 視覺模型的機器狗。這隻機器狗在辨識到特定圖像時,原本的設定是會做出「比愛心」的動作;然而,一旦在視覺鏡頭前貼上一張特別設計的圖像進行視覺干擾後,機器狗的認知就會瞬間被扭曲,立刻失控轉為對著目標「揮拳攻擊」的模式。
VicOne 團隊現場展示一隻內建 AI 視覺模型的機器狗,並設定看到特定圖像時會做出「比愛心」的動作。
鄭奕立解釋,這並非遙控作假,而是真實打中了 AI 模型的軟肋。當機器人將捕捉到的視覺影像轉換為語言模型來理解並執行動作時,若系統底層的安全護欄(Guardrails)沒有建置完善,那麼駭客僅憑一個簡單圖像,就能輕易達成提示詞注入(Prompt Injection),進而竄改機器人的控制權。
透過這個案例,鄭奕立進一步剖析,針對機器人的資安攻擊面主要可劃分為五大維度。除了上述最核心且最危險的 AI 模型攻擊之外,還包含直接針對機械設備漏洞下手的物理硬體層面、利用視覺或干擾 GPS 訊號的感知層面、鎖定機器人為了防盜與管理而勢必需要連網的雲端與軟體應用,以及最容易成為攻擊突破口、如同入侵手機與物聯網一般脆弱的無線通訊領域。
機器人進入實體場域後,資安防線不只要防駭客也要防環境誤導
「機器人的資安防禦,其實比純數位環境更難搞定,」鄭奕立坦言,建立機器人資安防護的過程中,最大的痛點在於現實世界充滿不可控的變數。當機器人走入家庭或複雜工廠,隨便一張亂丟在旁邊的報紙廣告、或是一本童話書,只要落入機器人的視覺範圍,都可能讓 AI 模型產生非預期的認知與設定。
同時,攻防雙方也處於極度不對等的狀態。在「AI 對 AI」的時代,駭客發動攻擊的成本極低,他們可以直接利用 AI 自動去尋找目標 AI 模型的盲點,只要防禦被穿透一次,駭客的攻擊手法就能輕易被自動化與大規模複製。
當機器人走進更多場域,資安防線必須從採購前就開始
面對嚴峻的物理 AI 防禦戰,鄭奕立強烈呼籲企業:在導入機器人前,第一步是「學習如何與機器人共處」,並且「務必先訂定資安規範,再進行採購」。他強調,企業千萬不要貿然買了幾台機器人就直接丟進工廠,因為機器人的運行會直接牽涉到員工的人身安全。
對此,鄭奕立建議企業可以依循三步驟,來增強 AI 機器人的資安防護。首先是在「開發期」,於製造與訓練模型的過程中,就先確保 AI 模型本身的安全性。其次,進入「模擬期」後,利用如 NVIDIA 提供的模擬環境,在機器人實際落地前,先於虛擬世界中進行「零成本」的 AI 弱點掃描與攻擊防禦測試,提早在出廠前防堵潛在的破口。最後則是在「運行期」,考量到 AI 模型會不斷更新改版,防護機制必須持續在系統底層運作,保護 AI 模型不會遭到惡意竄改。
隨著開源模型成熟與硬體成本大幅降低,如今部分中國製造的機器狗,價格甚至已逼近一台高階智慧型手機。在可見的未來,從幫你下樓拿咖啡,到回到家幫忙煮飯、打理家務,機器人將如現今的手機一樣普及。當「一人多機」的時代到來時,具身 AI 的資安將不再是遙遠的科技名詞,而是每個人生活中不可或缺的基礎建設。
從社群、娛樂到工作協作,現代人的各種需求幾乎都能透過 App 完成,但過去這些應用程式始終離不開手機。《VentureBeat》報導,如今成立 10 年、總部位於紐約、以開源 AI 模型與應用平台聞名的 Hugging Face,為其低成本開源桌上型機器人 Reachy Mini 推出 App Store,標誌運算平台正從「手機中心」轉向「實體機器人」的新階段。
從破萬銷量到 App 生態,Reachy Mini 打造機器人開發新入口
Reachy Mini 為 Hugging Face 於 2025 年 7 月推出的開源桌上型機器人,售價 299 美元起,是該公司收購法國機器人新創公司 Pollen Robotics 後的成果之一。自去年上市以來,該機器人已累計售出約 1 萬台。Reachy Mini 提供兩種版本:Lite 有線版(299 美元)需連接外部電腦運算,以及 Wireless 無線版(449 美元)內建 Raspberry Pi CM4,可獨立運作並支援 Wi-Fi。
這款小型機器人內建攝影鏡頭、麥克風與喇叭,並可透過 Hugging Face 的 AI 代理工具 ML Intern 協助使用者快速開發客製化應用。使用者無需工程或程式背景,只需以自然語言描述需求,例如「在有人說早安時揮手」,AI 代理便可自動生成程式、測試行為並部署至機器人。現在 Hugging Face 正式推出機器人專屬 App Store,Reachy Mini App Store 已上架超過 200 個由社群打造的應用程式,所有內容均可免費下載使用。
Hugging Face 執行長 Clément Delangue 在接受《VentureBeat》訪問時指出,這項技術突破的關鍵,在於降低進入機器人開發的門檻,任何人都能在一小時內打造機器人應用。他表示,過去機器人開發之所以困難,主要原因在於高品質訓練資料稀缺。雖然大型語言模型(LLM)可透過 GitHub 等龐大程式庫學習,但專屬於機器人的程式資料規模仍然有限,導致 AI 難以理解硬體行為與控制邏輯。
Hugging Face 透過代理式工具(agentic toolkit)作為中介,讓使用者不必直接面對底層 SDK 或韌體複雜性,而是由 AI 代理負責轉譯、生成與測試程式碼。該平台同時支援多種主流 AI 模型,包括 GPT-5.5、Claude Opus 4.6、Kimmy 2.6、MiniMax GM5 與 DeepSig V4 Pro,並透過 OpenAI Realtime 與 Gemini Live 提供即時互動功能,大幅縮短傳統機器人整合所需的開發時間。
社群驅動機器人應用程式爆發,AI 降低機器人開發門檻
《Axios》說明,即使沒有實體機器人,用戶仍可透過 Reachy App 與 3D 模擬環境,在瀏覽器中設計與測試應用程式。App Store 也支援 Fork 功能,讓使用者可以複製現有應用並透過 AI 進行修改,例如要求機器人改用法語回應。
該平台完全開源,並建立於 Hugging Face Hub 與「Spaces」系統之上,使 AI 代理能更容易學習與操作硬體行為,也鼓勵社群共同開發。目前已有超過 150 名創作者參與內容開發,其中不少人過去從未接觸過機器人程式設計。《VentureBeat》舉例,一名 78 歲退休行銷主管 Joel Cohen,在沒有工程背景的情況下,透過自然語言描述打造出一款「未來思考副總裁」應用程式,能在會議中即時辨識成員、整理討論重點並提出反饋。
《Axios》提及,社群開發出多種創意應用,包括情緒打擊象棋、防拖延提醒機器人、語言學習矯正助手與 F1 賽事即時解說員等。Clément Delangue 自身也在數小時內完成一款辦公室迎賓應用程式,讓機器人可辨識訪客並即時通知相關同事。他指出:「對沒有機器人背景的人來說,這幾乎是過去不可能完成的事。」
隨著低成本開源硬體結合 AI 代理能力,機器人不再是少數工程師的專業領域,而將逐步成為可讓一般使用者透過描述來定義機器人行為的開放式平台。在已有近 1 萬台機器人進入市場、並持續擴展應用生態的情況下,Hugging Face 正將機器人從硬體產品,推向可像 App 一樣擴充行為的平台。《VentureBeat》補充:「未來的關鍵不再是如何打造機器人,而是當門檻被打開後,人們會讓機器人做什麼。」
為什麼 Genesis AI 能達成這項成果?關鍵就在於他們決定走全棧式(full-stack)路線。最初,公司的目標只是打造更好的機器人模型,但團隊很快意識到,機器人長期受限於「體現差距(embodiment gap)」,意即人類手部與傳統機器爪的形狀差異過大,導致機器人很難直接從人類的真實資料中學習。
為了解決這個硬傷,Genesis AI 不僅開發 AI 模型與模擬器,更親自打造一雙具有 20 個自由度與 20 顆馬達的「仿人機械手」。與傳統透過前臂馬達和肌腱線纜驅動的設計不同,這雙仿人機械手的馬達直接配置在手部,大小與形狀也極度接近人手,大幅縮小與真實世界條件的差距。
同時,Genesis AI 還推出配備觸覺感測電子皮膚的「資料訓練手套」,能建立手套、人手與機器手之間「1:1:1」的對應關係。因此,透過結合網路資料,以及訓練手套蒐集來的人類手部動作與觸覺、力覺訊號,Genesis AI 得以建立龐大的資料引擎。此外,團隊也開發具備超寫實物理運算的模擬系統,透過縮小模擬與現實的差距,讓 AI 模型的訓練與改善比傳統實體測試更快速。
從展示走向產業:優先鎖定汽車、電子、製藥與物流場景
在擁有強大軟硬體整合能力後,Genesis AI 正積極將 GENE-26.5 推向產業應用,並與法國、德國、義大利的潛在客戶進入進階洽談。Genesis AI 總裁 Theophile Gervet 指出,優先布局歐洲的原因在於當地擁有頂尖人才,且歐洲深厚的工業基礎本身就是 Genesis AI 的首要市場。
Genesis AI 目前鎖定汽車、電子、製藥與物流等產業,目標是解決傳統機器人難以處理的精細或變動性任務,例如電子業中極度困難的「線束整理」,因為需要將電纜整理成束並固定,這正是 Genesis AI 能大展身手的地方。
另一方面,為了持續擴充機器人的技能庫,Genesis AI 正與工業夥伴洽談,計畫讓數萬名實驗室技術員或製造業員工在日常工作中配戴感測手套,並搭配第一人稱視角影片來蒐集真實世界資料。這次的技術發表,也讓 Genesis AI 與同樣開發工業靈巧手、估值上看 60 億美元的中國新創 Linkerbot 展開直接競爭。
Genesis AI 預計很快就會公開第一款通用的機器人,正如 Zhou Xian 所強調的,他們的最終目標是「打造最有能力的機器人系統」。因此,GENE-26.5 的真正價值是將 AI 模型、仿人機械手、資料手套與模擬系統進行深度整合,並透過這套系統,讓 Genesis AI 正面突破機器人走向真實世界時最困難的「手部操作」瓶頸,並讓 Physical AI 真正具備執行複雜任務的能力,逐步實現 Zhou Xian 眼中「十年內,工廠機器人與家用機器人將不再有根本差異」的長遠願景。
過去,AI 開發多半圍繞模型、資料、算力與推論效能,但當 AI 走向機器人與實體設備,問題就不只是「模型能不能理解指令」,而是系統能不能感知環境、理解任務、控制行動,並在充滿變數的真實世界中穩定運作。
由鴻海科技集團、科技報橘、三創育成共同主辦的 333 Robots Community Meetup,於 4 月舉辦首場活動。相較於單純展示機器人 Demo,這場活動更聚焦 Physical AI 開發者的現場交流,以及他們在實作過程中面對的難題:如何讓 AI 從真實世界蒐集資料、進入模擬環境訓練,再回到實體場域驗證與修正?
從 Real to Sim to Real,看開發者必須掌握的新流程
首場 333 Robots Community Meetup 邀請 NVIDIA DLI 白金級認證講師、臺灣科技大學兼任助理教授曾吉弘進行專題演講,主題是「NVIDIA 的 Real to Sim to Real」。
Real to Sim to Real 的核心,是先從真實世界出發,蒐集場域、物件、任務流程與環境變化等資料,再將這些資訊轉換成可被模擬、可被訓練的數位環境。接著,開發者可以在模擬環境中進行大量測試、訓練與迭代,最後再把模型與策略帶回實體世界驗證。
對開發者來說,模擬的價值不只是降低訓練成本,更重要的是讓機器人能在進入真實場域之前,先經歷更多不同情境的測試。舉例來說,光線變化、物件位置偏移、空間限制、人員移動、任務順序改變,甚至是設備與現場流程限制,都可能影響機器人的判斷與控制結果。這些變因在純軟體 AI 場景中或許不明顯,卻是 Physical AI 必須處理的日常。
因此,這場演講傳遞的開發思維是:在進入真實場域之前,先建立能夠被模擬、測試與迭代的環境;回到現場之後,再把真實世界的回饋持續帶回開發流程。對想投入 Physical AI 的開發者而言,Real to Sim to Real 代表的不只是訓練方法改變,而是機器人開發流程正在從實驗室,走向更可控、可驗證、可持續修正的模式。
主題演講之外,也讓開發者面對面交換技術與經驗
除了主題演講,333 Robots Community Meetup 也特別安排交流時間,讓來自不同背景的參與者可以在現場交換經驗。現場不只有關注機器人與 AI 的開發者、工程師、新創團隊與學研夥伴,也有對 Physical AI 落地感興趣的產業實務工作者。
當機器人真的要進入工廠、服務現場或其他實體環境,問題往往不只是「技術能不能做到」,還包括任務流程是否清楚、場域資料是否足夠、系統能否與既有設備整合,以及錯誤發生後如何回饋、修正與重新訓練。這些問題很難只靠單一團隊或單一技術解決,而需要開發者、學研、新創與產業端在同一個場域中交換問題、經驗與需求。因此,333 Robots Community Meetup 的意義,不只是建立一次性的技術聚會,而是提供一個讓開發者彼此連結的社群入口。
延續 4 月 15 日的首場活動,333 Robots Community Meetup 第二場將於 5 月 20 日舉行,特別邀請到國立陽明交通大學資訊工程學系副教授陳奕廷進行專題演講,深入解析當實體 AI 正逐步成為下一波科技變革的核心驅動力時,台灣面對基礎建設尚待完善、跨領域整合人才不足,以及從系統開發到真實場域落地等關鍵挑戰的解方。同時,研究主軸為「以人為本」的實體 AI、智慧駕駛系統、輔助機器人系統與電腦視覺的陳奕廷副教授,也將分享如何透過智慧健康 Living Lab、數位孿生與跨域協作平台,建構從學習、實作到驗證的完整培育體系,並培養具備系統思維與實務落地能力的新世代人才,以回應未來社會與產業的關鍵需求。
Config 在首爾與河內設有數據生產據點,透過攝影棚與實地場景記錄人類執行各種動作,累積超過 10 萬小時的人類動作數據,規模是開源機器人資料集 AgiBot World 的 30 倍以上。Minjoon Seo 指出,相較於大型語言模型可直接利用網路文字訓練,機器人 AI 的訓練數據必須透過真實世界蒐集,不僅需要機器人設備與場地,還需要人員實際操作,因此成本遠高於純軟體 AI。
此外,多數機器人公司會先用人類數據訓練模型,再讓模型適應機器人,但 Config 選擇在訓練前先「轉換數據」,讓資料本身更符合機器人的運動與互動方式。Minjoon Seo 將其比喻為語言翻譯:「如果只用英文教材教韓文,很難真正學好。」他認為,真正需要被轉換的其實是數據,而這正是 Config 的核心技術。
東元電機於5月12日至14日,聯手美國子公司TECO-Westinghouse Motor Company(東元西屋馬達公司),首度登上北美專業舞台——美國底特律「XPONENTIAL 2026國際海陸空無人載具及自駕系統產業鏈展」。本次展會,東元發布專為高酬載無人機設計的無人機扁線動力系統與榮獲2026台灣精品金質獎的All-in-One機器人關節模組,積極佈局快速增長的商用無人機(UAV)與智慧機器人市場,憑藉子公司TECO-Westinghouse的德州在地化服務,提供客戶「從產品到售後」的完整解決方案與服務支援。
東元本次展出應用於10至100公斤級高酬載商用無人機的動力解決方案,搭載 T Power Air 12.5kW 扁線馬達與T Power Air TE250 大功率電子調速器。東元已成功將現有EV主流扁線技術導入無人機馬達動力系統,其單軸最大拉力高達76.5公斤,為重載應用(如農藥噴灑、物流運輸)提供強勁動力。相較傳統無刷直流馬達(BLDC),效率顯著提升,可延長無人機飛行時間約20%,解決續航痛點。
RLWRLD 的商業策略負責人 Hyemin Cho 指出,目前多數機器人使用的是兩到三根手指的特定任務夾具,但 RLWRLD 專注於開發能模仿人類觸覺的「五指機器手」,因為這種精細的手部操作能力,是未來機器人能否進入家庭與人類密切互動的關鍵。
RLDX-1 模型把人類 Know-how 變成 AI 大腦
RLWRLD 的發展,正處於韓國「實體人工智慧(Physical AI)」的競爭脈絡下。Physical AI 指的是搭載 AI 與感測器、能在真實環境中具備一定自主性進行感知、決策與行動的機器,已超越了傳統工廠裡只能執行重複動作的常規機器人,而 RLWRLD 的目標,正是要打造一層能應用於不同工廠與工作現場的 AI 軟體層,未來甚至計畫擴展到一般家庭中。
你曾經想像過,未來機器人不再需要透過遙控器操作,而是能聽懂指令並自主與現實世界互動嗎? NVIDIA 資深解決方案架構師吳志忠在近日由 TechOrange 科技報橘、NVIDIA、鴻海科技集團共同舉辦的「2026 AI 機器人產業論壇」中,以「An Introduction to Robot Simulation」為主題,深入介紹 NVIDIA 為加速機器人落地而打造的模擬與訓練工具。
未來的機器人將從單一功能的工具,進化為具備多模態 AI 大腦、能主動辨識環境,並自主調用底層運動模型來執行任務的智慧體平台。然而,這條進化之路並不容易。例如,現在讓機器人在完美的虛擬平面上「學會走路」並不難,但要克服「Sim-to-Real(從虛擬環境到現實)」的落差,讓機器人在稍微傾斜的地面,或受到未知推力干擾的狀況下保持穩定,仍是當前極大的技術門檻。
為強化機器人適應真實環境的能力,NVIDIA 提出一套涵蓋資料擷取、資料擴增與模型訓練的完整模擬工作流。幫助開發者將真實場景照片轉化為具備真實物理特性的 3D 虛擬訓練場,並利用強化學習與「領域隨機化(Domain Randomization)」技術,在 Omniverse 中產出龐大且充滿變數的模擬數據,藉此訓練能適應真實世界不確定性的機器人控制模型。而這一切,都必須從第一步「打造逼真的訓練環境」開始。
完成精準的底層運動控制後,NVIDIA 的願景,是讓機器人不再只是被動聽命,而是具備自主行為能力。像是以往機器人的行走、轉向都需要依靠工程師拿著遙控器輸入訊號來觸發動作,現在透過 NVIDIA 推出的 NIM 微服務架構,開發者就能為機器人裝上多模態 AI 大腦。
舉例來說,結合大語言模型(LLM)與視覺語言模型(VLM),機器人即可具備語音理解與視覺辨識能力。操作者只要直接用語音下達指令,例如告訴機器人:「看看左邊有什麼?」機器人的 AI 大腦就會即時理解語意,同時透過鏡頭辨識環境,並自動調度底層的強化學習模型,來控制雙腳與關節完成動作。
從高擬真環境建構、跨越虛實落差的領域隨機化,到多模態 Agent 的整合,NVIDIA勾勒出機器人落地前必須補上的關鍵拼圖:讓機器人先在虛擬世界大量試錯,再把更穩定、更可靠的控制能力帶進真實場域。當模擬、訓練與部署流程逐漸串接成形,機器人開發也不再只是硬體調校問題,而是走向以 AI 驅動感知、決策與自主行動的新階段。
機器人新創 Figure AI 宣稱,旗下人形機器人已完成超過 24 小時不間斷、零故障的自主包裹處理作業,並將原本僅規劃 8 小時的測試,延伸為持續運行的長時間實驗。
Figure AI 指出,目前有三台搭載 Helix-02 AI 系統的人形機器人,全天候自主處理小型包裹分揀任務,全程無需人類控制。公司透過直播公開運作過程,期間觀眾在互動中替機器人取名為 Bob、Frank 與 Gary,後續 Figure AI 也替機器人加上姓名標示作為回應。
挑戰全天候輪班工作!Figure AI 機器人自主處理包裹
Figure AI 創辦人兼執行長 Brett Adcock 在 X 上表示,團隊原本僅規劃短時間測試,但在首日零故障後決定持續運行,目前已超過 24 小時且未出現任何失敗。他指出,機器人在此期間已處理超過 2.8 萬件包裹,大量觀眾在線上持續追蹤機器人運行狀態與表現。
在技術層面,Brett Adcock 補充,系統可直接從影像像素進行即時推理。Figure AI 指出,機器人透過攝影機與 AI 推理能力辨識條碼、抓取包裹,並將條碼朝下放置於輸送帶上。整個流程由 Helix-02 驅動,該系統為內建於機器人的神經網路模型,整合視覺與觸覺感知,並具備全身關節協調控制能力,使機器人能完成行走、平衡與操作等任務,全程無需遠端操控。
此外,系統具備自動恢復機制。《Interesting Engineering》提及,當機器人卡住或遭遇未見過的情境時,系統可自動觸發重置並恢復運作,無需人工介入。Figure AI 也指出,若機器人出現軟硬體問題,可自主離開工作區進行維護,由其他機器人接手任務,以維持整體運作不中斷,展示 Helix-02 自主輪班的能力。
從掛外套到鋪被子:機器人突破處理「易變形物體」難題
《VnExpress》指出,Figure AI 先前另展示人形機器人在無人控制的狀態,於兩分鐘內完成整理臥室與鋪床的任務。在官方發布的影片中,兩台 Helix-02 人形機器人進入極簡風格的臥室,其中一台負責掛起外套,另一台則關閉筆電並收起耳機。隨後,機器人分別移動至床鋪兩側,調整枕頭位置,並合力抬起被子將其鋪平,全程透過精準的協調與頭部點頭完成任務。
Figure 在部落格文章中指出,該次展示是 AI 人形機器人在人類環境中合作的重要示範。公司表示,處理被子等容易變形的物體是最大的技術挑戰,因為這類物體缺乏固定形狀與明確抓取點,且在移動過程中會持續改變外型,機器人必須在調整抓取姿勢的同時,即時預測彼此的動作。
人形機器人展現了進階的全身運動與精細操作能力,能維持單腳平衡、協同移動家具、操作腳踏控制裝置,並在未預設動作的情況下,處理柔性與關節式物體。Figure AI 研究主管 Corey Lynch 在 X 平台上補充說明,兩台機器人間沒有任何明確的訊息傳遞,是透過視覺進行協調。影片是以正常速度呈現,且機器人是在自主運作下完成,未使用遠端遙控。
Figure AI 表示,透過對今年稍早推出的 Helix-02 模型進行新資料訓練,機器人現已能執行開門、整理衣物等更複雜的任務。目前 Figure AI 已募資超過 10 億美元,估值達 390 億美元,正與 Tesla、Agility Robotics 及 Apptronik 等企業競爭,加速人形機器人在倉儲、工廠與物流領域的商業化進程。
Sanctuary AI 執行長 James Wells 近日在溫哥華 Web Summit 受訪時表示,人形機器人進入家庭的時間點可能需約三到七年,且在他們對不同應用場景的評估中,「家庭」被視為最晚具備商業可行性的市場,此番言論引發關注。《Forbes》報導,市場上有 AI 與人形機器人新創公司 1X Technologies 的 Neo 等產品主打家庭應用,也有 Figure 等公司積極推進人形機器人的實際應用,但這些進展在 James Wells 看來更偏向市場敘事與行銷,而非已經跨越關鍵技術與商業門檻的成熟階段。
人形機器人瓶頸非移動能力,James Wells 點出物理 AI 難題
James Wells 用一組數字說明展示與部署的差距:工業場景往往需要 99.999% 的可重複性,但多數基礎模型目前只有 80% 表現。換句話說,機器人也許能做很多不同任務,卻還不夠穩定;若放進家庭場景,可能每五次就摔破一次杯子。James Wells 補充,Sanctuary AI 在評估機器人部署環境時,從單位經濟效益、環境複雜度、客戶成熟度與安全容忍度等多個維度進行排序,家庭場景幾乎在所有指標上都落在最後一名。這也是人形機器人距離大規模家用落地仍有距離的核心原因。
在技術瓶頸方面,James Wells 強調,人形機器人的關鍵限制並不在於移動能力,而是「手部的靈巧性與可靠性」。他指出,物理 AI 真正的難題是能否在大量不同任務中進行穩定、精細的操作,而不是單純完成行走或搬運。他表示,多數他所接觸的專家認為,雙足行走雖然在技術展示上更具吸引力,但在實際商業應用中價值有限,反而是操作能力決定了機器人能否進入真實生產或服務流程。