從桌邊到資料中心,直擊麗臺在 COMPUTEX 2026 怎麼滿足代理式 AI 落地新顯學
企業導入 AI 的熱潮正在進入新階段!過去兩年談 AI 幾乎等於談上雲,因為雲端最快、最省事。但這一兩年風向正在快速變化,越來越多企業發現真正敏感的資料不能往外送,最即時的應用等雲端來回也似乎慢了一點,於是越來越多人開始重視「把算力放回自己辦公室」。

Photo Credit: The News Lens Brand Studio
麗臺科技電腦事業處總經理周世偉解釋,當代理式 AI 真的開始落地企業後,除了考量 token 需求量,同時也必須仔細思考資安、時效性以及最重要的經濟性。他也指出,當算力需求提升時,雲端服務可能面臨較多資源調配上的限制,這正是越來越多企業開始評估本地部署的關鍵原因之一。
代理式 AI 從演示走進落地實現
周世偉首先提到 AI 模型就像一個大腦,而代理式 AI 的本質是讓 AI 模型代理企業執行多步驟的任務。雲端服務商提供的大型語言模型確實非常實用,但當企業要把代理式 AI 變成日常營運的核心,就必須思考資料治理、機密性。此外周世偉也揭示,當算力需求大規模上升時,雲端服務在資源調配上可能受到限制,導致服務的穩定性與可預期性降低;相較之下,本地落地部署讓企業得以自行掌控推論速度、模型版本與輸出一致性,打造更穩定、可預測的執行環境。
落地 AI 與雲端 AI 並非互斥的選項,它們會在企業未來的基礎建設中並行存在、互補運作。產業界已經有共識,當推論的比重變大,落地的需求也會跟著放大。
麗臺已協助許多企業落地應用,以三大產業類別為例,政府單位的資料因為個資保護不能上雲端,模型來源的治理也需要符合公部門的安全規範,其次是醫療場景,病患資料與醫療影像的特殊性,使本地部署成為必要選項。第三類是台灣科技業、製造業。周世偉觀察,AI 不只是工程師在使用,財務、市場、研發部門都已經納入工作流程。當製造業生產製程、瑕疵分析、設備優化等涉及核心競爭力的資料進入 AI 工作流,企業需要確保這些資料始終留在自己的網路範圍內;而台灣製造業已經從「探索 AI 能做什麼」進入「把 AI 整合進自己流程」的階段,同時已出現了不少本地化部署的需求量。
麗臺推出全方位解決方案 支援各種算力光譜
對應這些不同規模、不同場景的需求,麗臺這次在 COMPUTEX 端出的是一整條從工廠邊緣到資料中心的完整方案。每一層都有對應的產品,企業可以依自己的規模、同時使用人數、應用場景,以及要部署模型的大小,選擇對的配置。

Photo Credit: The News Lens Brand Studio
展場中最引人駐足的,是一台旗艦級桌邊 AI 超級電腦,搭載 NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip,把 NVIDIA Grace™ CPU 與 NVIDIA Blackwell Ultra GPU 透過 NVIDIA NVLink™-C2C 融合在同一顆封裝裡,提供高達 748 GB 一致性記憶體與最高 20 petaFLOPS 的 FP4 AI 算力,能在桌邊環境執行高達一兆參數的大型模型。整機採用封閉式水冷散熱設計,在維持高效能輸出的同時確保穩定性。對需要把資料中心級算力放進辦公室又希望兼顧資料主權的客戶,這台旗艦工作站把過去只能在資料中心承載的工作負載帶到開發者的桌邊。
對於中小型企業,麗臺推出涵蓋 NVIDIA 認證系統™ 的全系列 AI 工作站與伺服器,提供從單 GPU 到八 GPU 的彈性配置。 其中,WinFast WS950 AI 工作站搭載兩張 NVIDIA RTX PRO™ 6000 Blackwell Workstation Edition GPU,提供共 192 GB GDDR7 記憶體, 是兼顧效能、本地部署與成本的平台選項。若是要滿足更小型的需求,NVIDIA DGX Spark™ Founders Edition 是 NVIDIA 為個人開發者與小型研發團隊設計的 AI 超級電腦,搭載 NVIDIA Grace Blackwell 架構,提供最高 1 petaFLOP 的 FP4 精度 AI 效能與 128 GB 統一系統記憶體,非常適合運行 NVIDIA Nemotron™ 3 Ultra 及 NVIDIA NemoClaw™ 等AI 代理程式。

Photo Credit: The News Lens Brand Studio
除了完整的硬體算力布局,麗臺也透過自研的 AIDMS(AI Development Management System)補上企業導入地端 AI 時最關鍵的管理環節。隨著企業 AI 應用從單一模型測試,走向多部門、多模型與 AI Agent 協同運作,過去分散管理 GPU 設備、手動部署模型、各系統各自整合的方式,已難以支撐大規模應用需求。
AIDMS 將多 GPU 設備管理、資料準備、模型選擇、模型部署與日常維運整合至同一套 AI 開發管理流程,協助企業更有效率地掌握地端 AI 資源。平台底層可監控 CPU、RAM、GPU 等資源使用狀態,讓 IT 團隊即時掌握各項 AI 服務的運算負載。當特定 LLM 服務被分配過多或過少資源時,也能依照實際使用情況進行彈性調整,提升硬體資源利用率,避免算力閒置或服務效能不足。
透過集中化管理介面與開放式 API 架構,AIDMS 可串接 AI Agent 與企業既有 IT 環境,讓企業無需大幅改動原有基礎建設,即可逐步建置可管理、可監控、可擴充的地端 AI 平台。
對企業而言,AIDMS 的價值不只是簡化部署流程,更是讓 AI 從實驗室測試走向日常營運。當代理式 AI 開始承擔更多企業任務,算力調度、模型管理、系統串接、資源監控與維運治理都將成為落地關鍵。麗臺希望透過 AIDMS,協助企業降低自建 AI 的技術門檻,加速將 AI 應用導入實際流程,讓地端 AI 真正成為可持續運作的企業基礎設施。

Photo Credit: The News Lens Brand Studio

Photo Credit: The News Lens Brand Studio
在實體AI(Physical AI)與數位孿生這個正在快速成長的領域,麗臺則是可以協助部署 NVIDIA Omniverse™,並透過 NVIDIA Cosmos™ 及 NVIDIA Isaac™ 等平台,讓客戶在數位孿生環境中模擬機器人協作,再將驗證過的模型部署到實體場域,協助不同領域的客戶提升研發效率,並降低部署的成本。
Agentic AI 時代 軟硬整合才能達到最高效益
「AI 既然能夠當 Agentic AI,就是要解決人的事情。」周世偉說企業必須自己掌握資料的機密性、輸出結果的時間、能力、花費,甚至精準度。當代理式 AI 從一次性的問答演進成持續執行任務的系統,這幾件事的掌控權留在自己手上對企業就特別重要。

Photo Credit: The News Lens Brand Studio
他強調這條光譜的價值在於找到最適合自己的配置。「不一定每個客戶都需要 NVIDIA® GB300 等級的算力。」麗臺會依照公司的規模、同時使用的人數、應用場景,以及要部署模型的大小,協助客戶配對最適合的硬體與軟體組合。當推論成為 AI 應用的主場,本地推論的需求會與資料中心推論需求並行擴張。從邊緣到資料中心、從個人開發者到大型企業,麗臺在 COMPUTEX 2026 展示的,正是一套能依企業規模彈性配置、讓資料主權與推論效能都掌握在自己手中的完整解決方案架構。這不只是硬體選型,更是企業在 AI 落地時代取得主導權的起點。