普通视图

发现新文章,点击刷新页面。
昨天以前首页

大模型狂飙的尽头,这家国产 GPU 厂商要把算力放在客厅

作者 张子豪
2026年5月21日 17:03

AI 算力的故事,正在走向两个相反的方向。

云端这边,万卡、十万卡集群是行业标配,算力越堆越高,皆因头部应用日均消耗的 Token 已经突破百万亿。

落到普通人这边,云端训练出的聪明模型,往往变成手机里一个要联网等几秒钟才回话的对话框。

算力走进生活的最后一公里,应该是什么样的?

一个做国产 GPU 的公司,在前几天的发布会上,一口气更新了好几款端侧产品,有家庭智能中枢、AI PC、Agent,还有具身智能相关的工作。

本周一,摩尔线程 2026 年发布会上,除了常规的 GPU 显卡更新、夸娥万卡级智算集群的迭代,一台只有手掌大、整块镁铝合金一体 CNC 雕出来的小盒子被搬上了台。

它叫 MTT AICUBE,按官方说法是「一台面向家庭的 AI 智算中枢」。更直观的解释,AICUBE 就是一个能够本地运行模型并管理家庭数据的「AI 电脑」,它能听懂我们的各种需求、能跑本地模型、甚至能存全家照片和视频。

这场发布会上至少有三件硬件冲着端侧去:面向客厅的 AICUBE、面向开发者的 AIBOOK、面向工业的 E300 模组。

摩尔线程创始人、董事长兼 CEO 张建中在台上讲,「过去我们谈论很多 IoT 是 Internet of Things,那今天的 IoT 应该叫 Intelligence of Things。

那么一家做万卡集群的 GPU 公司,为什么要把战线拉到客厅?

做 GPU 的公司很多,但选择哪条路

做 GPU 的玩家不少,但路线分化其实很清楚。

一类像壁仞、天数智芯,走的是纯 AI 训练和推理路线,把算力拉到极致,图形渲染能力几乎为零;另一类像景嘉微和砺算,图形能力扎实,但 AI 推理的短板明显。沐曦走的是接近 AMD 的路子,数据中心训推为核心,图形是后来才补的产品线,且还在研发中。

这些路线都有各自清晰的商业逻辑,但每一条都有一道隐形的边界。路线决定了一张芯片能去哪里、不能去哪里。

摩尔线程从成立起选的就是另一套逻辑:全功能 GPU。它采用的 MUSA 架构不会在「图形」和「计算」之间做分割或取舍,同一套芯片可以同时承载 AI 计算、图形渲染、科学计算、物理仿真与超高清视频处理五种能力。

这种多能力的整合,正是真实端侧场景里的刚需。

一颗只懂得矩阵运算的芯片,很难要它同时做到驱动客厅里的 4K 云游戏、实时数字人;抑或现在爆火的具身智能机器人,AI 决策和物理世界理解也在并行发生;纯 AI 加速路线的厂商,可以把算力做到顶,但很难进入千家万户、千行百业,进入到同时发生多种计算需求的显示场景。

换句话说,「全功能」是一个只有在端侧才能被真正检验的说法。

摩尔线程的架构,注定它要走出数据中心,往边缘和终端走。这次的三款端侧硬件,是这场延伸的起点。

把数据中心放进你的客厅

AICUBE 放在桌上,比一台 Mac mini 高了一头。整块镁铝合金一体 CNC 雕刻出来,外接 HDMI 或者 Type-C 接口即可连接电视和显示屏。并且,AICUBE 还配备了 4 个麦克风阵列和立体声扬声器,完美适配了语音交互的需求。

这个产品的定位是「家庭 AI 中枢」,规格层面是 32GB 或 64GB 统一内存,1TB 全闪 SSD 起步,支持最高 12TB 扩展。算力来自摩尔线程自研的「长江」SoC——CPU、GPU、NPU、VPU 异构集成,AI 算力 50TOPS。

它是当今 AI 需求的「三位一体」:AI Agent 的执行能力、AI PC 的算力、AI NAS 的私有存储。

在现场的演示过程中,产品经理使用 AICUBE 完成了语音播放电影、旅行规划、自动保存文件、AI 生成朋友圈文案等功能。从这个角度看,AICUBE 很像一台 Mac mini,但是内置了一个 AI Siri 语音交互系统,再加一个 NAS。

但它真正有意思的地方,是把「数据中心」整合进了一个家庭可接受的形态。

在家庭中我们可能遇到各种场景,无论是当做智能音箱,或者就是一个 NAS 来使用——AICUBE 存在的意义,更在于它是全功能 GPU 架构在最难场景下的一场压力测试。

算力足够跑本地大模型,体积轻松塞得进电视柜,功耗低到能 7×24 小时静音运行,数据要锁在本地不上云,操作要老人和小孩都能用语音直接调用。

以上这五大约束,任何一个单拿出来都不难。但它们要同时成立,而且要成立在一个售价面向普通家庭的消费级产品上,这才是端侧全功能 GPU 的设计目标。

数据中心不需要面对这些约束。它可以用水冷、高压供电、专业运维来回避物理限制;数据隐私可以靠网络隔离和权限管理来处理;至于「谁来用」这个问题更是不存在,毕竟如今的数据中心 AI 算力供不应求。

现在大部分家庭 AI 服务还在依赖云端。语音指令、照片、视频全要上传服务器。本地化、能同时管存储、跑模型、联动多个 APP 的设备,消费市场上几乎空白。

AICUBE 不仅解决了那些限制,内置的「小麦」智能体还预装了 60 多项技能,可以跨 36 款以上 App 做控制。摩尔线程的官方数据显示,「小麦」对高频工具调用成功率超过 95%,任务执行速度比通用智能体快 7 倍。

MTT AICUBE 在 6 月 18 号京东预售,这些数字很快就会在真实场景中得到验证,走进我们的客厅。

但从架构角度看,AICUBE 是全功能 GPU 在最难一类场景下的压力测试。毕竟数据中心的资源可以轻松调度,而端侧只有一颗芯片。

摩尔线程这颗「长江」SoC 在一颗芯片里同时跑 AI 推理、3D 图形渲染、4K 视频编解码、NAS 存储调度,是真实地做到了在紧凑的物理空间里,协调多种计算单元的实时调度。

张建中在台上还说了一句话:「推理不是某一颗芯片的事情,推理更像是一个解决方案。」AICUBE 大概就是这套解决方案在家庭场景的第一个样本。

「长江」流向何方?

作为自研的智能 SoC,「长江」和摩尔线程包括云端 GPU 在内的全系列产品共享一套 MUSA 架构,只是被压缩到了端侧的物理形态。

「长江」有 8 个主频 2.65GHz 的全大核 CPU、全功能 GPU、高能效 NPU 异构集成,最高支持 64GB LPDDR5X 统一内存。

围绕这颗 SoC,摩尔线程在端侧的另外几款产品也在加速落地。

AIBOOK 面向开发者,被定义为「为智能体而生」的笔记本电脑。

底层跑的是基于 Ubuntu 改造的原生 Linux 系统 MTT AIOS,预装「龙虾」(OpenClaw) 智能体,本地能同时稳定跑十几个 AI Agent,对接 90 多个 CLI 工具接口,支持虚拟化 Windows 和容器化 Android 多系统。

AIBOOK 的预期使命,是在英伟达控制的 CUDA 之外,给国产 GPU 构建一套从开发、调试到部署的闭环工具链,让 MUSA 生态从「能用」走到「有人用」——从最基础的笔记本形态开始。

MUSA 则是摩尔线程的 GPU 架构,包含从芯片、硬件、软件栈到生态的统一架构体系,全栈对标 CUDA。

过去几年,摩尔线程也一直在对 MUSA 软件栈进行优化:DeepSeek、Qwen、Kimi、MiniMax 这些国内头部模型现在都能顺利支持,vLLM 的官方后端也已接入,SGLang 主线代码更是提供了原生适配,PyTorch 的算子覆盖率到了 100%。

MUSA 的适配性已经做的相当扎实,也显著追上了与 CUDA 之间的差距。

但生态这件事,光有适配还不够。MUSA 社区的生长需要优秀的地推和开发者深度参与。摩尔线程希望 AIBOOK 能够在工具链普及和 MUSA 的推广上起到关键作用。完整的 MUSA 软件栈,让大模型开发者可以顺利地在这台笔记本上直接完成模型训练的诸多核心阶段步骤。

本质上,AIBOOK 是摩尔线程与英伟达 DGX 桌面系列产品对标的开始。

押注端侧,降低迁移成本

尽管路途遥远,MUSA 生态正在证明自己有持续迭代的潜力。

从 AIBOOK 到 AICUBE,从云端显卡到仿真平台,这些产品共同构成了摩尔线程的完整拼图:当云端训练、边缘推理与终端交互共享同一套 MUSA 架构时,国产算力的迁移成本、适配门槛与生态碎片化问题,才有可能被系统性解决。

回望摩尔线程的迭代史,早期的游戏显卡 MTT S80 自 2022 年推出,从只能跑 DX9 到能跑《黑神话:悟空》,实现中国 Top 50 热门游戏 100% 兼容,并针对其中 44 款已完成专门优化,靠的是底层重构和持续的驱动迭代。这套工程能力,也套用到这次的端侧产品上。

更长一点看,摩尔线程押的是另一件事:当算力同时出现在数据中心、开发者桌面、工业现场和家庭客厅,谁能在每个场景都有入口,谁手里的牌就比只守住数据中心的玩家更好打。

迁移成本、适配门槛与生态建设,这些目前都是摩尔线程端侧战略中的关键考量。

而从硬件显卡的持续迭代,MUSA 生态的逐步完善,从底层 100% 兼容主流 CUDA 生态,到全面适配国内 Top 5 开源大模型,这种速度与系统级优化能力,很明显是摩尔线程重要的护城河,也让他们在端侧的发力有了明显优势。

张建中在台上说,「对于用户,如果买不到国外的计算芯片,用摩尔线程的 GPU,你不会有任何后顾之忧」。

这份自信的背后,正是国产算力迈向成熟,在每一种形态、每一个场景中站稳脚跟的必经之路。

过去的物联网(IoT)是 Internet of Things,在摩尔线程的叙事里,未来的万物互联将全面演进为 Intelligence of Things(智能物联网)。

至少端侧这条路,摩尔线程是认真要走的。

文|杜晨、张子豪

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

RTX 50 SUPER 傳聞復活!爆料大神稱重回正軌,RTX 5060 將升級 12GB VRAM

作者 Rocky
2026年6月6日 10:07

受到 AI 伺服器需求、記憶體供應與 GDDR7 成本影響,NVIDIA GeForce RTX 50 SUPER 系列之前不僅傳出延後,甚至有消息稱可能會取消,對想要有大 VRAM 的玩家來說,一定會感到失望。不過,現在又有新消息了。根據爆料大神 MEGAsizeGPU 的近日推文,RTX 50 SUPER 已經「back on track」,也就是又回到規劃中,而且這次陣容可能還多了一張 RTX 5060 12GB,名稱也有機會叫做 RTX 5060 SUPER。

The post RTX 50 SUPER 傳聞復活!爆料大神稱重回正軌,RTX 5060 將升級 12GB VRAM appeared first on 電腦王阿達.

為了不讓 CPU 拖累 RTX 3080,國外 YouTuber 把 10 年前的 i7-6700K 灌到 1.7V 挑戰極限超頻

作者 Rocky
2026年6月8日 13:49

很多人升級電腦時,第一個想換的通常都是顯卡,畢竟玩遊戲 FPS 太低、畫質無法調高,最直覺就是 GPU 不夠力。不過,如果 CPU 太舊的話,即使換上高階顯卡,也可能出現明明顯卡效能夠了,但就是跑不滿的狀況,這就是所謂的 CPU 瓶頸。根據外媒 Tom's Hardware 報導,最近國外 YouTube 頻道 TrashBench 就做一項實驗,拿 10 年前推出的 Intel Core i7-6700K 處理器,搭配 RTX 3080 後發現 GPU 使用率偏低,就透過極限超頻試著解決 CPU 瓶頸問題,最高甚至嘗試把電壓拉到 1.7V,挑戰 5.2GHz、5.3GHz,雖然最後還是無法讓 RTX 3080 使用率達到 100%,但至少從原本約 60%提升到 74%。

The post 為了不讓 CPU 拖累 RTX 3080,國外 YouTuber 把 10 年前的 i7-6700K 灌到 1.7V 挑戰極限超頻 appeared first on 電腦王阿達.

💾

I put an old Intel i7-6700K against an RTX 3080 and tried to fix the bottleneck the only reasonable way possible, delid it with a vice, freeze it, and give i...

蘋果將Private Cloud Compute不再完全於自有資料中心執行,聯手Google Cloud而且還用了NVIDIA GPU技術

作者 Chevelle.fu
2026年6月9日 10:44

蘋果宣布隨著採用Google Gemini技術的Apple Foundation模型的新一代Apple Intelligence技術推出,蘋果將Private Cloud Compute(PCC)擴展到Google Cloud,不再完全使用蘋果自有資料中心,同時也由於Google Cloud與NVIDIA的合作,這些在Google Cloud執行的工作也同樣使用NVIDIA GPU技術,但強調保有PCC的安全、隱私。

強調與Google合作在Google Cloud與NVIDIA硬體實現原本在蘋果晶片的安全要求

Proud to collaborate on the next frontier of private AI. 🔒

Apple is expanding Private Cloud Compute to @GoogleCloud using NVIDIA GPUs.https://t.co/6R6MP1SkVm

— NVIDIA (@nvidia) June 8, 2026

蘋果PCC不再完全透過蘋果私有資料中心的關鍵,在於蘋果需要能在全球範圍內營運的全面、端到端的保密推論通道,強調雖是使用Google Cloud服務及NVIDIA GPU,但仍依循蘋果PCC所要求的核心原則,諸如無伺服器運算(或稱無狀態運算),可強制執行的保證、無特權執行階段存取、非目標性與可驗證的透明性等。

雖然PCC最初是建構在蘋果自有的晶片架構,然而蘋果在Google Cloud則是利用NVIDIA的機密運算技術實現蘋果對於PCC原始的要求,NVIDIA機密運算建構在NVIDIA GPU、Intel TDX CPU與Google Titan晶片的硬體架構,並與Google合作建構超過傳統機密運算所提供的功能。

在NVIDIA的機密運算技術再添加更多安全防護機制

蘋果強調其技術不僅止於利用傳統機密運算避免來自外部對虛擬機器的攻擊,強調從韌體到主機到作業系統堆疊至應用程式程式碼都是可信任運算基礎的一環。

為了降低來自供應鏈環節攻擊的風險,蘋果提供一個具有加密、僅可單向添加並用於記錄所有屬於PCC叢集的Google Cloud硬體的加密錢包,並針對可能被濫用於竊取使用者資料的元件,在軟體驗證加入至少基於來自兩個獨立供應商的獨立信任根。

此外在Google Cloud的PCC叢集也使用與原本PCC相同的架構安全模式進行推論堆疊的隱私及安全保護,每個請求的原始網路解析都在自身命名空間的專用程式進行,共享的推論軟體以較短的存在時間進行循環利用,經過驗證的金鑰保存在與外部虛擬機器隔離的獨立專用機密空間。

使用NVIDIA GPU是為了Gemini技術的妥協?

▲對於把技術底層轉向Gemini的蘋果,或許選擇NVIDIA GPU叢集而非TPU叢集有其苦衷

對於蘋果而言,最初的AI策略是希冀由自身技術一手包辦,也是初始蘋果在2024年提供基於自有晶片的PCC服務的目的,然而隨著AI技術發展迅速,蘋果自研AI一直無法達到內部的目標,蘋果似乎認清光靠原本的計畫根本趕不上市場的變化,最終決定採用變相的做法:與Google合作以Gemini技術建構自有的Apple Foundation Model;這樣的策略有助於蘋果以相對領先的Gemini技術提供新一代AI要求的快速及準確,且透過自主培訓使模型呈現蘋果希冀的目標。

然而就現實而言,即便Google已經具備專為推論而生的TPU技術,但若要使用最前沿的AI技術,恐怕NVIDIA的GPU仍是可提供相對豐富資源、且技術最領先的平台,即便是Google當前最新的模型訓練也還很難擺脫建立在NVIDIA的技術基礎上;此外,也許NVIDIA GPU具備的可程式化GPU運算能力,也使得蘋果可將一些原本針對自有晶片的技術透過軟體的方式在NVIDIA GPU執行。

而且可預期的是Google Cloud所提供的NVIDIA GPU叢集的性能及執行效率恐怕也勝過蘋果私有PCC資料中心的表現,可說是考慮到現況評估的結果;然而依照蘋果的個性,倘若Google的TPU已經可達需求,恐怕也會義無反顧的改用TPU叢集取代NVIDIA叢集。

國外 RTX 5090 用戶即便定期檢查 12VHPWR 接頭,卻還是發生燒毀事故

作者 Rocky
2026年6月10日 14:01

16-pin 供電接頭燒毀問題,從 RTX 4090 就傳得沸沸騰騰,PCI-SIG 也針對這類問題推出改良版 12V-2x6 規範,希望降低接頭未完全插入所帶來的風險。正常來說買 RTX 5090 的人,應該都會特別小心這塊,尤其是一定要用 12V-2x6 線材,沒想到還是有人不信,以為只要多檢查就好。

The post 國外 RTX 5090 用戶即便定期檢查 12VHPWR 接頭,卻還是發生燒毀事故 appeared first on 電腦王阿達.

Arm攜手遊戲開發商打造手遊光影新生,展現Arm類神經與UE引擎MegaLight技術在行動裝置的潛力

作者 Chevelle.fu
2026年6月11日 13:27

Arm的Mali GPU在智慧手機、平板有著出色的市佔率,也廣泛用在許多旗艦手機上;為了展現Arm下一代Arm CSS平台的GPU的潛能,Arm與Sumo Digital合作開發「光影新生」(Neural Dawn),除了成為首款使用Unreal Engine當中Mega Lights光影技術的手遊,更採用新一代Mali GPU的Arm類神經技術,展現可兼具PC級的沉浸是覺得同時還有出色的續航力,光影新生也將成為搭載下一代Arm Mali GPU的Android裝置,成為專屬獨家內容。

AI是挹注行動裝置視覺升級的關鍵

▲Arm在2025年8月就預告將著手為2026年下一代Mali GPU的類神經技術鋪路

Arm認為AI將自根本重塑行動影像運算,未來的行動影像運算不再是依賴更快的GPU,更需考慮能否在受限的功率內將效能盡可能最大化,將影像運算與基於AI的類神經就是一條明路,也是Arm之所以投資類神經技術的動因,並將專用的類神經加速器與下一代Arm Mali GPU整合,也將在2026年稍晚的下一代行動晶片帶來已AI驅動的視覺體驗。

與遊戲開發商合作展現結合Arm類神經技術的下一代手遊體驗

Arm與Sumo Digital攜手,旨在展現下一代手遊視覺體驗的潛能,雙方合作打造的「光影新生」是針對Arm下一代Mali GPU開發的展示性遊戲,預計在2026年下半年在具備Arm下一代Mali的裝置獨家推出,以科學家在洞穴網路探索作為故事主軸,在光的指引揭開崩塌文明的背後真相、首席科學家的隱密計畫與自己及一切的關聯,透過約120分鐘、4個關卡,讓玩家在光照的引導下進行遊戲,光照既是美術核心、也是遊戲的關鍵:一但看到光等同存在可互動元素。

結合Arm類神經技術為行動裝置帶來PC級視覺效果與流暢體驗

▲Arm的類神經技術包括超取樣、雜訊消除以及幀生成三大應用

光影新生啟用Unreal Engine 5.6.1的MegaLights與光線追蹤技術,為遊戲帶來逼真的光影效果,然而勢必對GPU產生更高的運算負擔,但受益於Arm類神經技術的AI增強,使裝置能夠提供流暢的幀率,並可延長遊玩時的裝置續航力,同時Arm類神經技術不僅提供類神經超取樣,還具備類神經雜訊消除(NSSD)與類神經幀生成(NFRU);且當前無論是PC或家用主機也鮮少同時啟用MegaLights與光線追蹤的案例,這次的展示更對手遊開發商具有重大的意義。

UE MegaLights為遊戲挹注複雜的光影效果

光影新生採用的MegaLights技術是可在單一場景部署大量動態光源的技術,結合直接光照與光線追蹤陰影,使遊戲場景具有更逼真的光線效果,更使進階光影效果成遊戲敘事及玩法的一部分,不再僅是背景的靜態視覺;然而過往受限有限功率與行動GPU的純效能,在行動裝置難以實現如此複雜的光照效果,光影新生示範結合AI技術開啟的可能性,並指引遊戲開發者在手遊的下一代可能。

開發者可透過UE引擎外掛獲得功能

▲Arm為開發者提供遊戲引擎插件,使開發者不須額外修改專案即可直接啟用嶄新的類神經技術

此外,Arm亦與Epic Games合作,使開發者可透過Arm Unreal Engine Plug-In獲得Arm類神經技術相關功能,在既有開發過程實現「隨插即用」的快速整合,不須為了實現AI增強功能重構渲染管線或大幅手動修改,此外還可提升遊戲遊玩的續航力;而Sumo Digital更以17人小團隊示範在18個月完成光影新生從前期製作到成品的流程,展現Arm透過自開發上游的整合協助開發者更容易採用這些尖端技術。

當然以Arm目前Mali GPU的合作關係,聰明的讀者應該也已經猜到是哪個品牌的哪一款晶片會成為光影新生的獨佔平台了,畢竟隨著許多手機晶片商都有獨自開發的GPU或已在GPU有其它想法,現在也僅剩下一家Android一線晶片供應商選擇Mali GPU。

❌
❌