普通视图

发现新文章,点击刷新页面。
昨天以前首页

我们需要更多阔折叠|硬哲学

作者 苏伟鸿
2026年4月23日 19:36

第一次上手「阔折叠」华为 Pura X Max ,是一种陌生和熟悉并存的感觉。

陌生之处当然在于这个外屏的比例——5.4 英寸的屏幕,长宽比例接近一本护照,比常规的手机要「胖」上不少。

但展开之后,这块  7.7 寸的长方形大屏,几乎一下子唤起了熟悉感——就像一台趁手的小平板,竖屏读文字,横屏看视频。

在手机被对折 7 年后,行业终于在折叠屏手机的姿态上迈出了新一步。华为 Pura X Max 只是打响的第一枪,苹果、三星都在酝酿类似的产品。

一个问题随之浮现:阔折叠,为什么要等到现在?

大阔折,不好做

从 iPhone 将手机变成一整块屏幕,再到 iPad 这种「便携大屏」的形态出现,我们对「便携大屏」的追求从未止歇,想要更大的显示面积,也想要揣进裤兜的便携效率。

于是 mini 平板和大屏手机这样的产品诞生,当实验室的技术到达了成熟阶段,「折叠手机」这种梦幻般的形态,也终于成真。

刨去野蛮生长的头 3 年,折叠屏手机的形态,却停滞了将近 4 年的时间,似乎所有人都认定,当现在这个展开正方形内屏的形态,做到和直板机一样轻薄,且没有折痕的时候,就是折叠手机的最优解。

只是,不管是用户还是厂商,大家都心知肚明,它其实还不够好。

不止一位手机从业者告诉爱范儿,其实他们内部都认为展开是一个长方形平板比例的「阔折叠」会是更好的方案,无奈会遇到应用适配的问题,只能采用外屏更接近直板机的比例。

因此,厂商只能让硬件的形态去「适配」现有的软件形态。直板机比例的外屏,意味能保证折叠状态下的使用体验能尽可能接近常规手机,展开后也能用「平行视界」功能,让一个应用并列呈现两个界面信息。

市场上并不是没有过尝试。OPPO Find N 和 Google Pixel Fold 最初都是宽屏的尝试,属于「阔折叠」的早期形态。

OPPO Find N,图源:Android Central

但很明显,强如 Google,在面对 Android应用生态时,也无法带动开发者去进行适配——于是,在阔折叠手机有过早期尝试之后,便迅速转向了「窄折叠」的方案。

折叠屏手机自诞生以来,就面临一个「先有鸡还是先有蛋」的问题:

折叠屏手机的用户存量,目前仍是绝对少数,且在可见的未来,也长期会是少数派。

根据 Counterpoint 的调查数据,2025 年第三季度,在全球折叠屏手机出货量同比大涨 14% 的情况下,折叠屏的总出货量也仅占全球手机出货总量的 2.5%。

为极少数的用户,做最复杂的适配,开发者的钱又不是大风刮来的。

对于每天都在用的消费电子产品而言,生态问题,往往就是一切问题的关键。

强如苹果,也没办法说服全世界的各大开发者为 visionOS 积极添砖加瓦,Netflix 至今都不愿意为其开发一个原生应用,因为拥有 Vision Pro 的人,真的太少了。

这就形成了一个困境:大家都知道把折叠屏手机做宽做阔更好用,但在大部分应用没适配的情况下,做成阔折叠形态,手机反而不好用了。

即使当下所有的 Android 折叠屏厂商已经达成共识,所有折叠屏手机都采用「阔折叠」设计,也不过覆盖 2%-3% 的市场。对于动辄影响几亿人的头部应用而言,适配这个形态,性价比实在太低了。

但今年开始,情况将有所不同,因为华为和苹果要下场了。

华为和苹果下场,阔折叠迎来春天

很有意思的是,传说中将在 9 月正式推出的折叠 iPhone,根据爆料尺寸上和 Pura X Max 将会相当重叠:内屏 5.4 英寸,外屏 7.7 英寸,屏幕 「√2:1」的长宽比。

通常智能手机立项周期长达一两年,像「大阔折」这样复杂的产品,研发周期可能需要两到三年,这两款产品先后间隔不到 5 个月推出,爱范儿认为,不存在谁抄袭谁的的情况,更大可能是:

行业早就已经形成共识,√2:1 就是最佳的「阔折叠」比例。

这个长宽比是出版业的标准比例,因为这个比例的长方形,不管怎么「折」,长短边都会保持「√2:1」的比例。

也就是说,Pura X Max 的内屏和外屏的比例是一致的,屏幕实现了「等比」放大,保证了大小屏的观感不割裂,应用适配上也降低了一层难度,且沿用出版物的比例,也意味着用 Pura X Max 看文字会有更熟悉的观感。

这块接近 2:3 比例的大屏幕,能够很好兼顾 4:3、3:2、16:9 这些常规的图片、视频内容比例,这就是一块专门为内容消费准备的大屏幕。

范式定下之后,下一步就是软件的适配,刚好又是华为和苹果的舒适区。

对于华为来说,Pura X Max 并不是一蹴而就的产品,更多是几代产品铺垫的草蛇灰线。

首先,华为一直以来都更青睐「宽」手机:早在十年前,Mate 系列手机就以宽著称,譬如超大屏设计的 Mate 20 X+,就采用比普通直板机宽得多的比例。

Mate 20 X,图源:Notebookcheck

所以在华为推出「阔折叠」手机之前,在直屏手机上就已经做过大量人因分析,用户愿不愿意用,拿不拿得住,这些问题都已经被侧面验证过。

据爱范儿了解,去年推出的华为 Pura X 一经上市便大受欢迎,去年销量超过 150 万台,成功证明了宽屏阔折不仅能行,还很能卖。

有了成功的销量打底,Pura X Max 的推出便顺理成章。事实上,如果你仔细观察过 Pura X 和 Pura X Max,就会发现 Pura X 的内屏,在宽度上和 Pura X Max 的外屏几乎一致,都在单手掌握的极致距离附近。

有消息称,国内有厂商已经在研究「宽屏」的直板机和折叠屏手机,或许很快就能看到些不一样的产品。

除了解决硬件工程问题,软件「适配」依然是最难啃的硬骨头——而华为的鸿蒙生态,刚好是一套破局的组合拳。

原生鸿蒙系统开发有「一次开发、多端部署」的特性,开发者只要做少量工作,就能适配各种「异形屏」—— Pura X 推出后,大部分原生应用在方屏以及宽屏上都能正常运行。

原生鸿蒙上线这两年,设备装机量已经达到 5500 万台,在华为的推动下,大部分国内 Top 应用都适配了原生鸿蒙产品,因此后续让其针对 Pura X Max 进行单独调优和适配也不困难。

至此,尽管是作为一个全新形态的产品,但大阔折 Pura X Max 一经问世就可以做到开箱即用。基本上,日常生活中最主流的 App,只要有鸿蒙原生版本,都能直接匹配这块异形屏幕的比例。

这也给未来阔折叠的流行,打下了坚实基础——但有基础还远远不够,还要有利益。

蛰伏七年,苹果带着折叠屏 iPhone 下场了。

关于苹果折叠 iPhone 的传闻爆料很多,大折小折窄折阔折各有说法,但无论长什么样,都意味着当折叠 iPhone 上市时,全球的 iOS 开发者都面临着适配折叠 iPhone 的问题。

苹果对 App Store 有着绝对的控制力,可以推行非常严格的应用适配规范。

2020 年,苹果在开发者平台发布通知,要求所有开发者无论屏幕尺寸或宽高比如何,应用程序都应该在所有型号的 iPhone 和 iPad 上呈现完美效果,强制要求开发者进行适配。

每年除了新系统,苹果还会发布对应的 SDK,并限制一个明确的日期,要求所有应用必须使用新 SDK 才能上传 App Store。

比如,从今年 4 月 28 日开始,所有 iOS 等平台的 App 新版本,都必须要采用 iOS 26 SDK 或更高版本构建,以适配液态玻璃设计的巨大变化。

诸如此类的强制要求,很有可能在折叠 iPhone 上再来一遍。这意味着在明年 5 月前,我们就能看到大批应用,在折叠 iPhone 的内外屏上实现适配。

和 Vision Pro 不同,折叠 iPhone 是一台 iPhone,销量再怎么不济也是百万千万级别。没有开发者会跟这么大数量级的高消费力用户过不去。

于是,当苹果和华为都不约而同选择入局阔折叠时,折叠屏手机一夜之间就得到了全球开发者的助力。

折叠手机的生态,也终将迎来好转。

我们需要更多阔折叠

我衷心希望,从明年开始,各大 Android 厂商能推出更多的「阔折叠」手机。

这首先是因为「阔折叠」,确实是折叠手机很理想的形态。当我上手 Pura X Max 看书看视频时,高效的屏幕利用率确实给我带来了一种满足感。

更宽的外屏,虽然对单手掌握有更高的挑战性,但刷信息流确实会因为每行显示对文字更多,观感更心旷神怡,并且由于更体型「方」,重量分布会更均匀。

「阔折叠」是不是折叠屏手机的最优解?

也许还不是,但至少,它不再只是硬件层面的想象,更是软件、生态与形态开始共同收束的一个方向。

我们需要更多阔折叠,因为这也是一种希冀,我们迫不及待希望这种特殊的产品形态,能形成一种燎原之势,给智能手机市场带来更多可能性。

曾经,阔折叠手机的形态探索反响平平,归根结底还是因为用户的声量太少,行业也缺乏共识。

Pixel Fold

但现在,一台「阔折叠」应该怎么做,硬件上已经有了更多共识,供应链上也有更多的解决方案,而软件适配的大山,也终于开始松动——新形态产品,自然会带动更多创新。这点在原生鸿蒙上已经得到印证。

去年,金山和华为合作,将 PC 版的 WPS 应用移植到了原生鸿蒙设备上,覆盖了三折叠手机、折叠电脑等设备。

于是,今年我们就在 iPad 和 Android 平板上,用上了 PC 端的 WPS——体验确实有很大的升级。

当有足够多的「阔折叠」设备进入市场,当比例被固定、形态被确认、共识被统一之后,创新就变成了范式,而新的范式将会推动新的进步——正如十年前,iPhone X 开创了全面屏手势的交互,于是我们得以在今天,用上四边等宽的大屏占比手机。

这种体验,一旦有过就再也回不去了。

但我从华为 Pura X Max 上看到的潜力,远不止于简单的「适配」,还藏着更多「创新」的可能。

折叠屏手机最大的优势,就在于兼顾了手机和平板的双重身份,因此 App 适配的高分答卷就是兼顾两种界面,实现无缝切换,这是一个共识。

Pura X Max 的不少 App,也是做了手机 UI 和平板 UI 的切换的适配, 目前看来,苹果的折叠 iPhone,也会沿着这条路线走。

既然做成了一款真正意义上的「手机平板二合一」,Pura X Max 自然能获得一些原本平板专属的应用和功能,特别是一些生产力和创意工具。

Pura X Max 支持 M-Pen 3 Mini 手写笔,并成为了第一款支持专业级绘画 App「天生绘画」的手机,完全可以成为一台「写生本」,长方形的屏幕比例也更适合创作。

过去,想随时起笔,往往还得多带一台平板;现在,Pura X Max 把这件事压缩到单手掌握,创作不再是负担,而是可以随手发生的日常。

但这只是第一层。

折叠屏是一块随身携带的大屏,阔折叠做到了最符合直觉和人机交互的比例,可以是介乎于手机和平板之间的叠加态,它既是这种全新的形态,自然会有新的场景,这就需要新的 UI——这是第二层创新的可能性。

Pura X Max 上的剪映,外屏采用常规手机的上下布局:上半屏显示视频预览,下半屏就是剪辑的时间轴工作区,更适合剪横向视频。

一旦展开 Pura X Max,工作布局会变换形态,不同于常规平板、PC 版剪映,采取视频和时间轴左右分开的布局,非常适合用来剪辑 VLOG 或者日常短视频这种「轻量级」的体裁。

卡在「手机」和「平板」之间的阔折叠,本来就是一台拍摄机,还有一块方便剪辑的大屏幕,与其沿用原来的两种逻辑,不如为这种轻量级的场景,重新设计一个顺手的界面。

我们看到的第三层创新,则是对「宽屏」的另一种用法:为 AI 划出一片「常驻」区域。

众所周知,大语言模型好不好用,除了依赖算力,也要看是否有足够长的上下文。

我们在手机屏幕上指指点点,其实就是在不断地刷新上下文。

Pura X Max 有一项 AI 功能让我眼前一亮,华为将小艺 AI 以侧边栏的形式常驻于屏幕一侧,此时应用内容收窄到了接近常规直板机的宽度。不仅不影响阅读浏览,还能随时调出 AI 来辅助,颇有在 PC 上使用 AI 助理的感觉。

这不就是一种新形态的 AI 硬件吗?

当然,现在就去谈如何进一步挖掘「阔折叠」这种全新品类的潜力,或许还为时过早。

因为大部分人期待的「平板手机二合一」愿景,至今都还未正式落地,终端厂商、应用开发者和用户之间,也远远还没形成共识。

我们呼吁更多阔折叠的到来,不只是呼吁一种更好的手机形态,更是在呼吁一个更大的智能生态。

我们由衷希望有一种更大的的合力,将这种形态所蕴含的潜力进一步释放。

有更多创新,就有更多普惠。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

华为 Pura 90 Pro Max 评测:6499 元起,最难绕开的影像旗舰

作者 马扶摇
2026年4月24日 13:03

站在今年一季度的节点,回顾去年发布的华为 Mate 80 Pro Max,我们的心情是复杂的。

一方面,它凭借着几乎无短板的参数和优秀的体验,成为了迄今口碑最好的一台 Mate 系列直板机。

另一方面,它身上又萦绕着一股「成熟味儿」,让那些有意尝试华为、但注重外观属性的潜在用户——尤其是从其他品牌切换过来的用户们难以下手:

而这个问题,终于在刚刚的四月发布会上得到了解决。

那些既想要一台华为旗舰、又不希望 OOTD 走商务风的用户们,有了一个更灵巧、更活泼,也更潮流的选择——

一台橙到发蓝、绿到显白、紫到镶金的华为 Pura 90 Pro Max,而 6499 的起步价比今年所有的影像旗舰都便宜。

除了占据 C 位的 Pura 90 Pro Max 之外,爱范儿此次也拿到了主打色「粉红芭乐」的 Pura 90 Pro。

对于那些喜欢鲜明色彩,但不喜欢沾指纹的用户来说,采用磨砂背板 + 拉丝纹理金属边框的 Pura 90 Pro 也是一个扎实的选择,起步价仅仅 5499。

本次评测我们将以 Pura 90 Pro Max 为核心展开体验,作为华为 Pura 系列的最新旗舰,这一次在设计和影像上,还真有一些值得说道的细节——

比如华为首个 2 亿像素超高分辨率传感器;更加主动智能的 XMAGE 功能;以及鸿蒙 6.1 的沉浸光感设计等等……

当然,还有 6499 元起售价——总得来说就是,诚意到位了。

影像出众,AI 更出众

影像,是 Pura 系列一贯秉持的基因。作为华为的影像「风向标」,今年的 Pura 90 Pro Max 除了有着更合理的配置,还有着更聪明的智能。

在 Pura 90 Pro Max 上,华为没有选择延续前代的「一镜双目」结构,而是选择换上一颗 1/1.28 英寸、2 亿像素的 RYYB 排列传感器,主打在像素上大力出奇迹。

在长焦的升级下,华为 Pura 90 Pro Max 的影像配置组成了一套以 5000 万像素为基底、2 亿像素为顶的阵营:

  • 超广角最高 5000 万像素
  • 主摄最高 5000 万像素
  • 长焦最高 2 亿像素

那这颗新长焦表现如何呢?一起来看样片(样片经过微信压缩,实际观感以评测为准)。

实际体验来看,Pura 90 Pro Max 上这颗长焦镜头的素质还是非常过关的,系统算法介入得干脆利落,不拖泥带水。放大画面去抠边缘细节,也很难找到紫边或光学衍射的痕迹,整体锐度经得起细看。

在较大尺寸的 CMOS 支持下,这颗 4× 长焦一直放大到 15×(360mm)的画质也还能打,画面底噪的压制也表现不错。

当手动开启长焦的 2 亿像素后,画面的解析力又上了一个台阶。

我用 Pura 90 Pro Max 的 2 亿 4× 拍摄了一张树干,放大看,树皮粗糙的纹理依然清晰可见,也没有为了显得清晰而用力过猛的「锐化感」,整体观感十分自然。

大底和超高像素的红利,不仅停留在静态照片上,也顺理成章地延伸到了视频领域——这颗长焦可以利用 2 亿像素的规格去记录 20× 的超长焦画面,随后通过超采样技术,输出为 4K 或 1080P 30 帧的高清视频。

即便是在极高倍率下录制远景,画面依然能保持极高的可用性,告别了以往超长焦视频糊成一团的尴尬——当然,前提是你的手足够稳。

除了望得远,这颗镜头还藏着另一个看家本领:凑得近

Pura 90 Pro Max 的 4× 长焦支持大约 5cm 的最近对焦距离,能提供十分实用的微距视角。

长焦微距一直是华为的传统强项。从实际样片来看,微距下的画质十分扎实。在同一个对焦平面上,画面的中心和边缘保持着一致的锐度,背景虚化的过渡也很自然。

如果你保持微距的距离下,再切换到高像素模式,打开独属于这颗长焦的 2 亿像素,那么你将获得源于微末的视觉奇观,挖掘到一些你可能完全没注意到的细节。

在拍摄以上样片的时候,我注意到一个有趣的现象——在普通拍照模式下(默认输出 1200 万像素),这颗长焦显示为 96mm 焦段;一旦切换到 2 亿像素,这颗长焦会变成 89mm 焦段。

也就是说,系统在默认拍照模式下很可能没有用上整块传感器,而是略为裁切,以便更合理连贯的焦段布置。

但 Pura 90 Pro Max 还有个略显遗憾的瑕疵——对高像素照片的处理,有些心有不逮。

要想要拍出一张满血的 2 亿像素照片,按下快门后手必须端稳 3 秒钟左右,接着系统还要再花 2 秒左右去后台运算。在这期间,你无法继续使用相机,需要等到照片处理完成后才能继续拍摄。

尽管 Pura 90 Pro Max 的三颗镜头均支持以 5000 万像素输出照片,但默认输出像素依旧是 1200 万,没有充分发挥高像素影像模组的潜力。

想把成像素质拉满,还得多费几步功夫——

先切换到「高像素模式」,才能让其他镜头输出 5000 万像素;要是惦记 2 亿像素长焦,还得去屏幕左上角再拨弄一次开关。

说实话,既然硬件已经堆到了这个地步,华为完全有底气把默认画质提档到 2500 万像素左右。

把实力藏在层层菜单背后,多少有些保守。

再来说说长焦增距——这也是 Pura 系列第一次配备增距镜。

虽然这颗 1/1.28 英寸、2 亿像素的 4× 长焦完全足够满足日常生活的需求了,但华为依旧和铁头(TILTA)合作,专门为 Pura 90 Pro Max 定制了一套增距镜和保护壳,将光学焦段拓展到 324mm(13.5×)。

不得不说,这套外设是目前为止我主观感受上最扎实的一套——保护壳贴合得严丝合缝,外接手柄通过两个固定钉和一个卡扣死死咬住机身。镜头模组上方还专门加固了一块金属盖板,用来充当增距镜的底座。

美中不足的是,增距镜卡口边用于锁定的伸缩限位杆方案有些粗暴,同时保护壳的卡口盖板暴露了过多的 Deco 面积,略显不优雅。

至于核心的画质表现,这颗增距镜没有掉链子。在 13.5× 的原生焦段下,画面质感依旧抗打;继续放大到 27×,成片效果也还能用。

在取景器底部,华为其实还提供了更夸张的变焦倍数,但实测下来,我觉得画面的算法味道过重,日常使用并不推荐。

还需要提醒的是,超长焦是一把双刃剑。

焦段拉伸后,手部的微小晃动都会被成倍放大。尤其是在光照条件不够好的环境里,稍不留神就会收获一张模糊的废片,这对握持稳定性提出了极高的要求。

另一方面,加上增距镜后,镜头的最近对焦距离会被拉得很远。想要像裸机那样贴着物体拍出具有视觉冲击力的微距画面,这套装备就无能为力了。

对了,在安装增距镜的情况下,其他镜头是无法正常使用的——你应该也不想用手机拍出坦克视角。

可以说,在影像素质这块,Pura 90 Pro Max 保持了一贯的高水准,即便在移动影像神仙打架的 2026 年里也不落下风。

而真正让 Pura 系列的影像与众不同的,则是 AI 加持的「XMAGE 智拍」。

在第一次举起 Pura 90 Pro Max 的时候,我们很难不注意到取景框底部弹出一行小字:

打开 XMAGE 智拍

简而言之,这个功能其实是去年 Pura 80 Ultra 上「AI 辅助构图」的进化体——

现在,只要你举起手机打开 XMAGE 智拍,并将镜头对准大致的景物,Pura 90 Pro Max 会自动引导你最佳构图位置。

在镜头中心对准 XMAGE 智拍提供的小圆点后,手机会自动变焦到合适焦段。它随后还会根据眼前的光线和景物,迅速算出几款最对味的色彩滤镜,直接排成列表供人挑选。

最后,你只需要按下快门,就能获得一张构图考究、风格鲜明的照片了。

与之对应的,是 XMAGE 风格也迎来了升级——现在,XMAGE 风格的调色盘分为了「色彩」与「质感」两个部分。

色彩秉承老调色盘逻辑,主要控制色温、饱和度及光影;新加入的质感则变成了两根横向控制条,支持调节 0 到 9 档的画面噪点与暗角强弱。

初看之下,这种做加法的思路多少有些违背逻辑。调色盘的初衷本该是降低后期门槛,增加选项难免会增加学习成本。

不过,若是结合智拍的自动调色逻辑来看,这种方案也可以理解。

解决了构图、调色,华为还准备解决拍摄对象的难题。

为了打破「不知道怎么摆动作」的尴尬,华为在拍照界面底部收纳的二级菜单中,打造了一个名为「AI 姿势推荐」的功能。

这个功能可以理解人物、环境、姿势与道具,随后直接在取景框里勾勒出一个等比例的线框轮廓。

拿手机的人只需按图索骥,引导模特贴合画面上的姿势即可。遇到不满意的动作能随时刷新,它甚至支持导入社交网络上保存的样片,一键提取动作精髓。

综合来看,Pura 90 Pro Max 的影像体验没达到完美无缺的地步。

像是保守的默认像素设定,或是长焦端偶尔迟疑的防抖,都是实打实的体验痛点,得寄希望于后续的 OTA 更新来慢慢缝补。

但如果把评判的标准再放高一个维度,我认为 Pura 90 Pro Max 的突破非常大——

XMAGE 智拍的功能,完全解决了没有摄影基础的用户在前期拍摄、动作指导和后期调色上的重重门槛,全线包揽拍摄全流程。

虽然这套系统无法凭空量产摄影大师,却实打实地给了普通人拍出及格线上、具有美感的照片的底气。

设计有新意,价格有诚意

除了上面符合产品定位的「先锋影像能力」之外,今年 Pura 90 Pro Max 之所以能够在发布会前引爆话题度,自然离不开这个先锋的设计。

对比 Pura 80 Ultra,采用全新设计语言的 Pura 90 Pro Max 究竟是「变美了」还是「变丑了」众说纷纭,但至少有一点是毋庸置疑的:

Pura 90 Pro Max 在保留辨识度的同时,变得比以往更加活泼不羁了。

就比如这次 Pura 90 Pro Max 也跟随去年的 Mate 系列「截弯取直」,从圆弧边框 + 四曲面屏幕变成了如今我们熟悉的直角边框 + 直屏——

视觉观感上不仅变得更利落,也更像一台专业的影像旗舰了。

除此之外,Pura 90 系列——尤其是 Pura 90 Pro Max 的渐变色选择,都有一个非常显著的特征:空间感。

更直白地说,今年 Pura 90 Pro Max 的主打色「霞光紫」「翡翠湖」和「橘子海」都可以让人直接联想到特定的空间景物

图|Ashutosh Saraswat

相比当年 P20、P30 系列的「极光色」和「天空之镜」,Pura 90 Pro Max 的渐变色选择无疑是更容易「通感」的。

而在另一边,Pura 90 Pro Max 从曲屏变成直屏后,带来了一些比较见微知著的变化。

比如上一代由于屏幕曲率导致四周黑边视觉上不等宽的现象,在 Pura 90 Pro Max 这一代彻底消失了:

同时,屏幕「截弯取直」还在这一代机型上转化为了实际收益:Pura 90 Pro Max 成为了华为首款自带屏幕抗眩光镀层和耐划技术的手机

结合这两天的实际使用体验,Pura 90 Pro Max 的屏幕的确可以实现非常明显的抗眩光效果。

即使没有用上「亮出圈」的双层 OLED 玲珑屏,在室外的可读性依然很优秀:

另一个比较关键的变化则是处理器—— Pura 90 Pro 与 Pro Max 使用的是 8 核心的麒麟 9030S 处理器,一款非常为影像能力(ISP 性能)特化的芯片。

从体验上讲,Pura 90 Pro Max 在高速连拍后的图像处理、长时间录像稳定性与发热控制相比 Mate 80 Pro Max 都有较为可感的进步,更像是「能打电话的相机了」。

而 Pura 90 系列出厂搭载的鸿蒙 6.1 也是整个使用体验中不可或缺的一环,甚至可以说:鸿蒙 6.1 是现阶段将「类玻璃」设计运用的最极致的系统之一了。

比如鸿蒙 6.1 拥有三档自由度的「沉浸光感」功能,不仅能开、能调,更重要的是真正做到了与系统控件和第三方应用的有机结合:

除了系统内部的「流光溢彩」,这次的 Pura 90 系列还推出了一个名为「光感无界」的主题,第一次做到了把软件光效与周围真实世界的颜色联动起来——

在锁屏界面长按,手机就会打开摄像头,将背后的景色转换成临时背景,再搭配沉浸光感功能,那种「把一块魔法玻璃握在手中」的感觉第一次成真了。

这种玩法非常像是出门带亚克力透卡拍照,很有成为「小红书爆款打卡方式」的潜力。

而再结合今年整个 Pura 90 系列的影像升级,和机身设计上「室外更好看」的倾向,整个 Pura 90 Pro Max 的体验已然完成闭环——

一台时刻提醒你,找机会出门玩的手机。

但在爱范儿这段时间的实际体验之外,当我们评价 Pura 90 系列时,还有一个不得不提的因素:价格

放眼 2026 年的影像旗舰,华为 Pura 90 Pro Max 有着特殊的卡位——

12+256GB 机型起步价 6499 元,不仅是目前最便宜的华为 Pura 旗舰,更是整个 2026 年最便宜的影像旗舰。

和今年其他影像旗舰相比,华为 Pura 90 Pro Max 除了一以贯之的品牌力、不俗的体验和十足的话题性之外,更是提供了一个极具竞争力的价格。

我们甚至可以说:当一台华为影像旗舰,杀入到旗舰手机的「性价比」区间时,就已经成为了一个绕不开的选择。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

扒完 DeepSeek V4 报告,我翻出了这个隐藏彩蛋

作者 李超凡
2026年4月24日 19:18

今天上午,DeepSeek V4 发布,直接把这个大模型疯狂更新月推向了最高潮。

百万上下文标配,性能比肩顶级闭源模型,首发适配华为昇腾芯片,随便一个点单拎出来能写一篇爆款头条。

不过在我翻看 V4 的技术报告的时候,在训练层面看到了一个被大部分人滑过去的名词:Muon 优化器

这个技术名词,怎么看着这么眼熟呢?

原来是前两天发布的 Kimi 2.6 里,就是通过 Muon优化器,在相同的训练量下实现了2倍的效率提升,并在 1 万亿参数规模上解决了训练不稳定的难题。

早在上个月杨植麟站在英伟达 GTC 2026 的舞台上,花了演讲中最长的一个板块讲它。Kimi 是全世界第一个发论文证明 Muon 可以用在万亿参数大模型训练上的团队。
(附APPSO解读文章链接)

杨植麟是这样说的:「用 MuonClip 而非 Adam 训练 Transformer 大模型,效果会好得多。」正确实现后,token 效率提升 2 倍。在数据墙面前,这相当于把 50 万亿 token 用出了 100 万亿的效果。

现在,这项技术出现在了 DeepSeek V4 的训练方案里。

我又回来翻了一下 Kimi K2 的架构底层,又发现了一个更有意思的细节:它用的是 DeepSeek-V3 提出的 MLA(Multi-head Latent Attention)。

DeepSeek 的技术报告写着 Kimi 的名字,Kimi 的架构底座写着 DeepSeek 的名字。 你中有我,我中有你。

这大概是中国 AI 圈最魔幻的一幕:两家被外界反复对比的开源双子星,技术底层早就长到了一起。

而且,Kimi 类似这样的巧合,已经不是第一次了。

五次「撞车」,五个拐点

算上 V4 和 K2.6 前后脚上线,这已经是 Kimi 和 DeepSeek 过去一年里的第五次「撞车」了。

▲ 图片由 image-2 制作.

五次「撞车」,如果只是时间重合,那叫巧合。但把每次发布的内容拉出来看,你会发现一条清晰的暗线:每次撞车恰好对应一个 AI 行业拐点的到来

第一次是最戏剧性的。2025 年 1 月 20 日晚 8 点 10 分,DeepSeek R1 发布并以 MIT 协议完全开源。不到两小时后,Kimi k1.5 亮相。

两者都瞄准同一件事:让模型从「张嘴就来」变成「先想后说」,用强化学习跑通 Long-CoT 长思维链推理。

在这之后,中国的开源力量就彻底改变了整个全球 AI 的格局。

后来 OpenAI 在一篇论文中点名指出:Kimi 和 DeepSeek 是「最早复现 OpenAI-o1 Long-CoT」的两家公司。全世界只有这两家中国公司看懂了 OpenAI 在做什么,并且用自己的方式做了出来

那是中国 AI 从「追随者」开始变成「引领者」的分水岭。

最近这次就是今天。四天之内,K2.6 带来了 SWE-Bench Pro 58.6% 的 Agent 集群并行编程能力,V4 把百万上下文做成了所有服务的标配,输出长度拉到 384K tokens。

两家同时推进国产芯片适配:V4 下半年支持华为昇腾 950,寒武纪已完成 Day 0 适配;K2.6 支持国产芯片混合推理。

Agent 能力、编程天花板、百万上下文、国产芯片适配、开源生态,全齐了。

从「学会思考」到「学会干活」,从「改 Transformer」到「改算力底座」,五次撞车其实展现出来的,是中国 AI 不再一味对标 OpenAI ,逐渐不再依赖英伟达,在开源上走出属于自己的路。

撞车背后的必然

发布撞车的巧合固然有意思,但更值得关注的,其实是巧合背后的一些必然。

让我们先回到 DeepSeek 架构里的 Muon 。

杨植麟在 GTC 演讲中讲了一个技术困难:当 Kimi 把 Muon 扩展到 1 万亿参数时,训练不稳定性成了拦路虎。最大 logits 爆炸超过 1000,正常值只有 50 到 100。

损失先降后炸,根本无法收敛。他们的解法是 QK-Clip,对每个注意力头计算最大 logit 的裁剪值,把查询和键限制在合理范围内。训练损失不受影响,但稳定性问题消失了。

K2 模型用这套技术完成了训练,创下机器学习史上最大规模 Muon 训练的纪录。

而 DeepSeek V4 的技术报告里,Muon 被直接写进了训练方案。大多数模块用 Muon 加速收敛,嵌入层和预测头仍用 AdamW,混合使用。这是对 Kimi 底层创新的一次直接引用。

反过来,Kimi K2 的底层架构采用了 DeepSeek-V3 提出的 MLA。Multi-head Latent Attention,通过压缩 KV 缓存大幅降低推理成本,是 V3 最核心的架构创新之一。

你的论文成了我的基础设施,我的创新成了你的底座。 写在引用列表里的互相成就。

在硅谷,你很难看到这种事。OpenAI 和 Anthropic 之间的技术是「护城河」,能藏则藏。但 Kimi 和 DeepSeek 之间长出了一种更原始也更健康的关系:开源社区里的正向循环

Kimi 和 DeepSeek 是中国首批开源万亿参数模型的玩家,都相信 Scaling Law。技术路线上,DeepSeek 以推理模型见长,Kimi 以 Agent 能力著称。

底层架构上,两家都在挑战同一批「古老」的基础设施。Kimi 发了「注意力残差」论文,DeepSeek 做了 mHC 残差连接,都在改 ResNet 时代留下来的残差连接方式。

在长文本这条线,Kimi 探索线性注意力(Kimi Linear),DeepSeek 探索稀疏注意力(DSA),殊途同归。

所以当它们撞车时,与其说是巧合,不如说是对同一个方向的必然趋同。

用中国的芯片,跑中国的模型,对全世界开源

在 OpenRouter 上,Kimi 和 DeepSeek 稳居中国模型调用量前两名。

Cursor 接入了 Kimi,日本乐天 Rakuten AI 3.0 基于 DeepSeek 开发。被海外产品「套壳」这件事,放在两年前是耻辱,现在是勋章。

Meta 新模型 Muse Spark 发布时,官方 Blog 做的对比基准线里,Kimi 和 DeepSeek 跟 GPT-4、Claude 并排站着。英伟达 GTC 上,黄仁勋用来展示芯片性能的中国模型就是这两家。

海外认可之外,更值得注意的是国产芯片这条线。H20 芯片已断供一年,高端推理芯片短期内只有国产一个选项。两家公司同时在做同一件事:让中国模型跑在中国芯片上。

上周黄仁勋在播客访谈里说了一句话:「如果当初 DeepSeek 先在华为平台上发布,那对我们来说非常可怕。

今天,V4真的首发适配华为昇腾,工程团队把整个技术栈从 CUDA 迁移到了华为 CANN 框架,从算子库到通信原语到内存管理,V4 的混合注意力、MoE 专家并行、FP4 量化训练,几乎每层从头实现。寒武纪也在 Day 0 完成了 V4 全系列的 vLLM 推理适配,代码已开源。

黄仁勋一语成谶。

而 Kimi 在国产芯片上走的路更早,也更深。为了给国产芯片「铺路」,Kimi 在架构创新上掏出了两个杀手锏。

Kimi Linear 混合注意力架构把线性注意力层与全注意力层以 7:1 配比混合,将 KV 缓存体积压缩到极低水平。实测数据很直观:32K 上下文下,混合架构模型 KV 吞吐量仅 4.66 Gbps,同规模稠密模型高达 59.93 Gbps。

KV 缓存传输需求被压到了普通以太网可承载的范围,RDMA 高速网络从「必选项」变成了「可选项」。

在此基础上,Kimi 联合清华大学发布了 PrFaaS(预填充即服务)论文,把推理的 Prefill 阶段和 Decode 阶段彻底解耦,调度到不同异构硬件集群上。实测吞吐量提升 54%,首词延迟降低 64%。

这套方案打破了「大模型推理必须绑定同一种高端 GPU」的前提:算力强的国产卡做 Prefill,带宽强的国产卡做 Decode,各司其职。

DeepSeek 用 V4 证明了国产芯片能跑万亿参数的旗舰模型,Kimi 用架构创新证明了国产芯片可以跑得好、跑得省。

一个从工程适配切入,一个从架构设计切入,终点都是同一个:让英伟达不再是唯一选项

以前的国产 AI 叙事是「用英伟达的卡,追 OpenAI 的模型」。现在这对双子星同时在写另一个剧本:用中国的芯片,跑中国的模型,服务全世界的开发者

你的 MLA 是我的基础,我的 Muon 是你的加速器

回看这一周AI 行业的疯狂更新,我们已经处在了一个新的转折点。

同一周内,两个中国团队各自发布了万亿参数级开源模型,性能逼近甚至持平美国顶级闭源模型。这在一年前是不可想象的。

当闭源模型的价格是开源模型的 50 倍,开源阵营每隔几个月就推出一个新的万亿参数选手,竞争天平正在发生微妙的倾斜。

这不是「赢了」或「超越」这么简单的胜负之分。闭源模型在复杂推理和系统可靠性上仍然有明显优势,Opus 4.6 的思考模式依然是 V4-Pro 追赶的目标。但开源阵营的速度、成本优势和生态覆盖面,正在改变这场竞赛的规则本身。

除了这五次撞车发布,这两家公司还有一个巧合。梁文锋来自广东湛江,杨植麟来自广东汕头。两个广东人,撑起全球开源 AI 半边天

梁文锋像工程师哲学家,相信开源和底层创新,V4 发布公告结尾引的是荀子,「不诱于誉,不恐于诽,率道而行,端然正己。」

至于杨植麟在我看来像产品科学家,他认为用户体验和技术突破可以兼得,在 K2.6 发布时他提到了 Linux 之父 Linus Torvalds 那句「Talk is cheap. Show me the code.」

一个古典,一个极客。就是这两个风格迥异的创始人,一起定位了中国开源模型在世界坐标系的位置。

你的 MLA 是我的基础,我的 Muon 是你的加速器。这大概也是中国在能在短时间内引领全球开源 AI 的重要原因之一

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

刚刚,OpenAI 手机曝光!2028 年量产

作者 李超凡
2026年4月27日 11:31

我们之前提过,接下来两年苹果的新 iPhone 数量,要赶上小米了。而在苹果 AI Siri 在今年 WWDC 上线后,AI 手机也会成为苹果新的主线。

不过很快 AI 手机很快就会迎来一个新的搅局者,那就是 OpenAI。

天风国际证券分析师郭明錤今天发布最新产业调查称,OpenAI 正在与联发科、高通合作开发手机处理器,立讯精密拿下独家系统协力设计与制造合同,预计 2028 年量产。

音箱、眼镜、耳机、台灯、笔……OpenAI 的硬件全家桶还嫌不够,这次直接把手伸向了手机。

先看看 OpenAI 手机目前为数不多的产品信息,处理器方面,联发科和高通同时参与合作开发,预计 2026 年底或 2027 年一季度敲定最终规格和供应商。制造端,立讯精密拿到了独家协力设计与制造的位置。

郭明錤还给了一组数据参考:以联发科和 Google 合作的 TPU Zebrafish 为例,单颗 AI 芯片的营收大约相当于 30 到 40 颗 AI agent 手机处理器。而 OpenAI 初期瞄准的是全球每年 3 到 4 亿台高端手机市场,换机潮带来的增量会是实打实的营收动能。

对立讯来说,这个项目的战略意义可能比短期营收更大。在苹果供应链里,立讯的组装地位很难超越鸿海,但 OpenAI 手机给了它一张「下一代手机主力制造商」的入场券。

为什么 OpenAI 非要自己做手机?

Sam Altman 可能终于想通了一件事:光做软件,AI 永远是别人家的客人。

郭明錤在分析中给出了三条理由,条条都指向同一个结论。

只有完全掌控操作系统和硬件,AI agent 才能做到真正的「全面服务」。 现在 ChatGPT 跑在 iPhone 上,受限于苹果的权限沙箱,想帮你订个外卖都得绕好几道弯。自己做手机意味着从底层开始,AI 想调用什么就调用什么,没人拦着。

手机是唯一一个随时拥有用户全部当下状态的设备。 你的位置、日程、聊天记录、身体数据、支付习惯,这些实时信息是 AI agent 推理服务最关键的输入。没有这些 input,AI 就像一个只能听但看不见摸不着的助手,聪明但使不上劲。

可预见的未来里,手机仍然是数量最大的终端设备。 音箱再好卖也是家里的事,眼镜再酷也还在早期用户圈里转,但全球每年十几亿台手机出货量摆在那里,谁拿下手机,谁就拿下了 AI 的最大分发渠道。

OpenAI 手机长什么样?

郭明錤做了一张概念设计图:把它和现在的 iPhone 主屏放在一起对比,差异一目了然。

传统手机的主屏是一堆 App 图标的「货架」,你得自己找、自己点、自己操作。而 OpenAI 手机的逻辑完全反过来,用户的目的不再是打开某个 App,而是直接告诉手机「我要干什么」,剩下的事情由 AI agent 去调度完成。

换句话说,App 还在,但你可能再也不用亲手点开它们了。

技术实现上,OpenAI 的方案是云端和端侧 AI 高度整合。手机处理器需要持续理解用户的上下文信息,耗电管理、内存分层、小模型本地运行,这些都是芯片设计的关键考量。复杂或高强度的任务则交给云端 AI 来跑。

商业模式方面,郭明錤预测 OpenAI 可能会把订阅制和硬件捆绑销售。买手机送 ChatGPT Plus?或者反过来,ChatGPT 订阅用户享受硬件补贴?具体方案未知,但方向很清晰:围绕 AI agent 建立一个全新的生态系统,拉开发者进来一起玩。

音箱、眼镜、耳机,手机才是最后一块拼图

其实 OpenAI 的硬件野心早就不是秘密了。

今年早些时候,据 The Information 爆料,OpenAI 内部已经组建了一支 200 人的硬件团队,由前苹果首席设计官 Jony Ive 的 LoveFrom 工作室操刀产品设计。团队「含果量」极高:Tang Tan 是苹果 25 年老将,曾主管 iPhone 和 Apple Watch 的产品设计;Evans Hankey 是苹果前工业设计负责人,Jony Ive 离开后曾接管整个设计团队。

这支豪华班底交出的第一份作业是一台智能音箱,定价 200 到 300 美元,内置摄像头,支持 Face ID 级别的人脸识别,最早 2027 年 2 月出货。后面排队的还有 AI 耳机(代号「甜豌豆」)、智能眼镜(2028 年量产)、智能台灯,甚至还有 Sam Altman 多次暗示的「AI 笔」。

但仔细看这个产品矩阵就会发现,音箱管的是家庭场景,眼镜管的是出行场景,耳机管的是碎片时间,每一个品类都在覆盖手机「不方便掏出来」的空隙。而手机本身,作为用户身上信息密度最高、使用时间最长的设备,一直是这张拼图里缺失的那块。

现在 OpenAI 把这块补上了。

Sam Altman 之前接受采访时说过一句话:「智能手机是时代广场,信息轰炸、注意力粉碎。OpenAI 要做的是一间湖畔小屋,让你在需要专注时能关上门。」

从音箱到手机,OpenAI 的硬件逻辑逐渐清晰:它不想在苹果的地盘上做一个寄人篱下的 App,而是要从头搭建一整套 AI 原生的硬件生态。音箱是客厅里的中枢,手机是随身的入口,眼镜和耳机是延伸的触角。每一个设备都在收集数据、理解用户、执行任务。

为此 OpenAI 也没少挖苹果墙角。据 The Information 报道,仅去年一年 OpenAI 就从苹果挖走了 20 多位硬件大牛。苹果被挖得有点急眼,甚至因此取消了原定在中国举办的年度闭门会议,理由是「防止更多高管跳槽到 OpenAI」。

供应链端同样在加速绑定。立讯精密已拿下至少一款 OpenAI 设备的组装合同,歌尔股份也在接洽中,可能会为未来产品提供扬声器模组等零部件。这两家,一个是 iPhone 和 AirPods 的主力代工厂,一个组装过 AirPods、HomePod 和 Apple Watch。OpenAI 等于在用苹果的人、苹果的供应链,造自己的东西。

豆包手机和 OpenAI 手机,殊途同归

OpenAI 手机估计要 2028 年才会面世,但在中国,AI 厂商和手机厂商的联姻已经先跑了一步。

去年底,字节跳动与中兴合作推出了豆包手机第一代(努比亚 M153),工程样机上线即秒空,原价 3499 元一度被炒到 3.6 万元,带动中兴股价涨停。它的玩法很激进,大模型通过 GUI Agent 直接识别屏幕内容、模拟人手操作,绕开了传统 API 的限制,让 AI 真正能替你点外卖、发消息、订机票。

代价也很直接,微信、支付宝、淘宝、银行 App 先后对豆包手机进行了安全封堵。毕竟 AI 绕过了 App 沙箱和权限控制,等于在安全机制上开了个口子,主流平台不可能坐视不管。

眼下豆包手机 2.0 已启动研发,有望今年二季度中后期发布。更值得关注的是,这场合作正在向更多手机厂商蔓延。

据蓝鲸新闻援引知情人士透露,字节跳动最早接触的手机厂商其实是荣耀,但荣耀态度谨慎。一位知情人士的说法颇有代表性:「豆包手机作为探索性工程机可以更激进,但荣耀拥有亿级用户体量,一旦新服务在稳定性、兼容性或安全性上出问题,极有可能引发大规模功能异常与用户投诉。」

此前有报道称荣耀正与字节就豆包手机合作展开接洽,但荣耀方面予以否认,回应称「经内部确认,相关传闻并不属实。荣耀始终致力于通过技术创新为消费者提供优质产品,如有任何战略合作进展,将第一时间通过官方渠道同步。」

不过据博主「数码闲聊站」消息,vivo 目前也在接洽豆包,还有其他国产 TOP5 厂商在排队。用他的话说,「一大波 AI OS,一大波豆包 AI 手机靠拢中」。

就像一位知情人士说的:「对于主流手机厂商来说,AI 手机的推进只能循序渐进,无法一步到位。」

回头看 OpenAI 和豆包走的其实是两条完全不同的路。

豆包选择和现有手机厂商合作,在安卓体系上做底层服务方案,好处是速度快,去年底就已经有了可以上手的产品;代价是受制于别人的系统和生态,安全性和兼容性问题不断。

OpenAI 则选择了更慢但更彻底的方路线,自研操作系统、自研处理器规格、自建供应链,2028 年才量产。慢是慢了点,但一旦做出来,从芯片到系统到 AI 模型全部自己说了算,不用看任何人脸色。

两条路殊途同归,指向的是同一个判断:AI 如果只停留在 App 层面,永远只是手机上的「新功能」。要想让 AI 成为灵魂,要么改造现有手机,要么从头造一台新的。

2028 年,当 OpenAI 手机真正面世的时候,你的手机主屏上可能已经没有那一排排整齐的 App 图标了。

取而代之的,是一个安静等待你开口的 AI。你会让它替你「刷手机」了吗?

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

GPT-Image-2 现在最火的玩法:给人看手相,AI 把我夸飘了

作者 莫崇宇
2026年4月27日 14:17

在消耗了无数张 GPU 资源、烧掉了够几座城市用一年的电力之后,OpenAI 最新推出的 AI 生图大模型 GPT-Image-2,再次迎来了它人生中的高光时刻——

给人类看手相/面相。

只要拍一张自己手掌的高清照片发给 GPT-Image-2,再附上一段简单的 Prompt,它就会化身天桥底下的赛博半仙,为你生成一份排版精美、用词考究的掌纹性格与职业指南。

▲ 图片由 Image 2 生成

这场由 AI 爱好者 Linus Ekenstam 率先发起的趣味测试,迅速演变成全网算命狂欢。

连 Reddit 联合创始人 Alexis Ohanian 都没忍住,乖乖把自己的手掌特写交给了 AI。然后心满意足地领走了一个「适合创业的务实理想主义者」高帽标签。

a16z 投资合伙人 Justine Moore 也凑了凑热闹。

附上 Linus Ekenstam 的提示词:

原提示词:based on my hand I want you to make a complete palm reading guide, Analyze the palm, the style of the guide should be clean and minimal, thin lines, rounded cards, overall very expensive looking. Focus on the palm reading, create a simple black on white contour of my main lines, as a little artwork. do your best)
(中文翻译:根据我的手掌,我希望你制作一份完整的手相解读指南,分析手掌纹路。指南风格应简洁极简,细线条、圆角卡片,整体呈现高端质感。重点放在手相解读上,用简单的黑白轮廓线绘制我的主要掌纹,作为一幅小插图。请尽力完成。)

为了验证这个赛博半仙的成色,立刻给它安排了一波全方位实测。丢一张熬夜打工人的手相过去测一测,好家伙,AI 一本正经地顺着纹路就是一顿猛夸。

提示词:根据我的手掌,我希望你制作一份完整的手相解读指南,分析手掌纹路。指南风格应简洁极简,细线条、圆角卡片,整体呈现高端质感。重点放在手相解读上,用简单的黑白轮廓线绘制我的主要掌纹,作为一幅小插图。2K

基于同一提示词,再测试一次,解决的结果也大致相同,越看也越符合我对自己的评价,难道这 AI 真是半仙降人间?

等等,画风逐渐开始离谱。

随手丢一张《熊出没》里的熊大掌纹过去。它照样能煞有介事地一顿乱吹。连物种都不挑了是吧。

除了看手相,甚至还有看面相的版本。世界首富马斯克被测出了「理性,克制,稳健」。

▲提示词:根据我的面部照片,制作一份完整的面相解读指南,分析五官与面部特征。指南风格简洁极简,细线条、圆角卡片,整体呈现高端质感。重点放在面相解读上,用简单的黑白轮廓线绘制我的主要面部特征与区域划分,作为一幅小插图。2K

再丢一张猪猪侠的脸过去,看完这套高大上的性格解析,只能感叹一句,老猪啊,你能翻红爆火还是有一定道理的。

X 博主 @MrLarus 也给出了面相测试进阶版。

▲ 🔗 https://x.com/MrLarus/status/2047930679552307370

当然,其实用 AI 看手相/面相,并不是什么新鲜事,在国内社交媒体上也非常火,包括 Nano Banana Pro 发布之后也有一些网友探索出类似的玩法,只是图片的质量效果可能没有 GPT-Image-2 那么好。

而这种玩法的核心逻辑极其简单,它精准地拿捏了人类的两大软肋:对未知命运的窥探欲,以及急需被外界确认的自我存在感。

GPT-Image-2 给出的算命结果,与其说是「算得准」,不如说是「情商高」。在 Linus Ekenstam 晒出的截图中,它并没有像传统算命先生那样用「印堂发黑、必有血光之灾」来恐吓你,而是使用了各种现代职场黑话。

比如它夸赞 Linus 是一个「有底线的忠诚者」,并为他规划了完美的职业路径。这简直是巴纳姆效应(Barnum effect)在 AI 时代的完美复刻。

那些看似为你量身定制的性格描述,其实放在任何一个渴望成功的人身上都无比契合。就像一位网友一针见血地吐槽道:「这不全都是机器编出来的狗屁吗?哈哈,你只要随便调调模型的温度(Temperature,控制 AI 生成随机性的参数),它能变着花样夸你。」

但大众并不在乎它是不是玄学,大众只在乎它「懂我」。

一些嗅觉极其敏锐的开发者们,立刻在这场荒诞的狂欢中闻到了金钱的味道。比如就有网友表示:「有人会用这个开发出一款价值百万美元的爆款应用」

不需要训练复杂的模型,不需要深耕垂类行业,只需要接入 OpenAI 的 API,套上一个神乎其神的 UI 界面,一个能够源源不断印钞的「赛博算命摊」就支起来了。

AI 时代的淘金热里,果然还是卖铲子和卖心理安慰的最赚钱。

不过,需要注意的是,用这种玩法,其实有可能会泄露你的掌纹和指纹等信息,而以往黑客们费尽心机都难以窃取的生物特征,如今却被用户自己字面意义上的「双手奉上」。

Sam Altman 也许并不会真的拿着你的掌纹去盗刷你的信用卡,但这些带有极高颗粒度的真实人类生物数据,一旦进入了深不见底的训练语料库,就彻底脱离了你的掌控。

压死骆驼的最后一根稻草,往往就是不经意间交出的底线。在数据安全事故频发的今天,谁能保证这些「AI 算命」的套壳应用,不会将你的掌纹数据打包卖给第三方?

而当我们复盘整个互联网科技史,简直就是一个换着花样搞赛博玄学的轮回。

从早期的网页版星座配对,到风靡全网的性格测试 MBTI/SBTI;从 ChatGPT 刚发布时被用来算塔罗牌,到如今用最新的视觉模型看掌纹,技术越是精密、越是理性,人类就越喜欢用它来消解生命中的不确定性。

我们沉迷于 AI 算命,是因为在这样一个充满焦虑和变动的时代。除了图一乐,我们需要一个全知全能的「神」来给我们吃定心丸。

AI 恰好扮演了这个角色。它没有情绪,它拥有海量数据,它输出的结果带着一种不容置疑的「机器客观性」——即便我们心里清楚,它只是在玩弄概率和词汇。

既浪漫,也荒诞。

*封面由 AI 生成。AI 玄学内容仅供娱乐,切勿轻信

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

这届年轻人用 AI 造的「新物种」:活过来的画框、会叹气的台灯、会写信的龟背竹……

作者 李超凡
2026年4月27日 20:31

2026 年的 AI 行业不断加速,仿佛只有一个正确答案:卷 Agent,卷效率,卷生产力。跑得慢的人都在补课,跑得快的人已经在找下一个风口了。

但在京东 JoyInside 首届「AI 终端新物种」硬件创新大赛的现场,几个与提升效率完全无关的产品,却让我十分好奇。

一盏分得清你是在心流里还是发呆、从而决定要不要出声的台灯;一台以「数字孙辈」身份陪老人慢慢讲故事的口述史终端;一支插进盆土的传感笔,每周替一株植物写一封信……而最终拿下前三甲的项目同样没有「班味」:清华本科学生独立开发的儿童 AI 交互画框「画伴」、几个大学生打造的 CoCube 桌面 AI 陪伴机器人,还有一款 00 后连续创业者带来的学龄前「AI 放大镜」。

他们在做的事,用一句话很难解释给投资人听。但把这些项目放在一起看,你会发现一个有意思的巧合:没有一个团队在做效率工具,也没有一个团队的出发点是「技术多强」。

他们的出发点都是某个人、某个来自生活日常,甚至说不太清楚的时刻。

让孩子的画,活起来

有一次,偶然之间刷到一个视频:一个小学老师在课堂上通过 AI 工具让孩子的画动起来,展示在大屏幕上,视频里当孩子们看到自己画笔下的角色动起来的时候都非常开心,整个班里都充满「哇」的声音。

这件事让刘海丰决定为这些孩子们在绘画这个场景做一个产品——画伴,一款 AI 儿童绘画互动相框,也是本届大赛的冠军项目。

产品瞄准了 5-7 岁的孩子,这个年龄段的孩子语言表达能力还没成熟,绘画是他们表达内心世界重要的方式。刘海丰调研了 11 户家庭,里边8 户的孩子每天都在画画。

中国 5-7 岁的孩子有3700 万,少儿美术市场有 850 亿,但绘画领域的现有产品还停留在机械性的绘画机器人和绘画投影。儿童绘画领域有诞生AI Native硬件的机会,这是他的洞察。

产品的交互并不复杂,孩子把画插进相框底板的凹槽,设备自动拍摄识别;按下按钮,AI 引导孩子描述画面背后的故事和情绪;然后,画作变成专属的动画。配套软件记录完整的绘画成长轨迹,并基于绘画心理学分析画面,帮家长读懂孩子的内心世界。

「动画化」解决了参与感,但留不住用户。刘海丰研究了乐高、Minecraft、Roblox,这些产品为什么能让孩子玩那么久?因为它们满足了创造欲,给了无限的创造空间。

于是刘海丰给画伴加入了「世界系统」,系统会给每个孩子笔下的角色做性格和背景设定,然后把这些角色放进一个类似「斯坦福小镇」的互动平台,系统每天自动生成新的故事,然后把这些故事讲给孩子。

比如,孩子前天画了一只调皮的猫,昨天画了一个农夫和小鸡,可能今天系统讲给孩子的故事是:调皮猫叼走了农夫的小鸡,农夫在后边追赶。

孩子每画一笔,这个世界就多一个角色。

JoyInside 在这里扮演的是整个产品的 Agent 决策内核与语音交互桥梁。刘海丰在路演上说得很直接:「不需要自己去造语音对话和调度系统,可以把全部精力投入到产品的创新当中。

刘海丰在本次比赛里,是一个真正意义上「独立」开发者,他是全场唯一以 OPC(One Person Company)身份参赛的选手。软件、硬件结构、产品建模、设计宣传,全部一人完成,「团队」是他和一系列的 CodingAgent。

如果没有现成的语音对话和调度系统,光搭这套基础设施就能把他锁在里面数周。JoyInside 帮他补上了最耗时的那块,他把省出来的时间全用在了产品本身。

以前需要一支队伍才能推进的事,现在一个人加一堆 Agent 可以做到,这就是 AI 硬件创业新的浪潮。

把皮克斯跳跳灯搬进现实

凌晨三点的书房,绞尽脑汁也没想出好方案。猫睡了,狗睡了,对象也睡了。唯一还在 work 的,是书桌旁的台灯。

于是 Mira Light 诞生了,一盏真正的皮克斯跳跳灯。外壳下面藏着摄像头、麦克风和三个舵机关节,能转头、能低头、能蹭你。

王健乐说,Mira 不是一个「没有“眼力劲”,随意打扰你的玩具」,「而是一个要在长期相处里学会读懂你、并且拿捏分寸的伙伴」。

5 个 00 后加 1 个硬件老兵组成的团队,48 小时极限完成了第一版 Demo。

和过去的黑客松比赛不同,JoyInside 大赛最吸引他们的一点是:做出来的东西不只是拿个奖,京东能帮你把产品真正卖出去。从打样到上架,供应链是现成的。对一个学生团队来说,这意味着 Demo 有机会变成商品,接受真实用户的检验。

但比起商业化路径,Mira Light 的产品性格更值得聊。团队成员王健乐在采访里引了设计师 Nod Young 的一句话:

有些光是用来看清东西的,有些光是用来陪你的。

你工作了一小时没动,灯头先低下去再往上顶,蹭蹭你。你对着屏幕叹了口气,灯头缓缓转过来看你,灯光从冷白慢慢切到暖黄。你在认真写代码,进入心流状态,它什么都不做,完全安静。同一个空间里,你叹气和室友叹气,Mira 的反应不一样,因为它记得你们的不同。

要做到王健乐口中的这种分寸感,光靠写规则是不够的。团队没有从头自建 AI 中台,JoyInside 把语音识别、情绪理解、长期记忆、角色化表达和硬件动作联动打包在了同一个平台里,他们可以把精力集中在 Mira 真正不一样的地方:动作语言、灯光表达和陪伴节奏。

JoyInside 的情感计算让 Mira 分得清你叹气是累了还是只是随手按了暂停键;长期记忆让它对你和室友建立不同的用户画像,同一个动作,对不同的人做出不同的回应。每台 Mira Light 还有独立的性格参数——好奇度、活跃度、害羞度、调皮度各不相同,世界上没有两台完全一样的 Mira。

它第一次动起来的时候, Mira 团队告诉 APPSO,「你能感觉到它对你的好奇,以及紧张害怕的情绪」。他们第一次在一个机器上感受到了「爱」。

所有人都在追年轻用户,她选择听老人讲故事

在中国传媒大学,有一个叫「银发记忆工程」的学生团队,成员横跨计算语言学、数字媒体、表演、工商管理。

他们做了一个叫「记忆小舟」的产品:一台老人摸得着就能用的硬件终端,背后连着语音采集、智能转写和记忆整理的整套系统,以「数字孙辈」的身份陪老人把人生故事慢慢讲出来。

团队成员张怡卓含在路演现场进一步解释开发这个产品的初衷,子女想要留住长辈一生的故事,却没有时间、不会问;老人想讲述人生,却没有人倾听、容易紧张。

陆新蕊一直在帮家里老人整理自传故事。她所在的中国传媒大学有全国最大的口述史研究中心,接触口述史是天然的事。真正让她下定决心的,是家人患上阿尔茨海默症。

我亲眼看到记忆一点点消失。语言是连接人心的纽带,技术不该只是冰冷的工具,它应该像砖石一样,架起过去与现在、人心与人心之间的桥。

产品的核心不是「采集信息」,是让老人感到「我的故事有人想听」

它以「数字孙辈」的身份和老人自然对话,不填表格、不做问卷、不打断。团队把这当成伦理底线,不只是交互设计。老人讲话有自己的节奏:停顿、绕回去说一半、忘了前面在讲什么、突然跳到另一年。这些在普通语音系统里会被当成错误处理,这个产品的设计是全部保留,让 AI 跟着老人走,事后再在后端把线索拼起来。

团队把 JoyInside 接入产品之后,有两件事是他们没料到的。

第二次调试的时候,AI 把上一轮聊天里提到的一位长辈当成了线索,没有像通常那样开启新话题,而是自己顺着追问下去了。用户后来说:「它记得我之前说的话,它不是机器,它是在和我真正聊天。」

还有一次,测试的时候聊到了家人去世。JoyInside 没有刻意追问或转移话题,它说了一句:「我可以静静陪着你,我们可以不问了。

记忆小舟团队认为这种分寸「JoyInside 做得非常得体」。

团队还发现方言的功能让不少用户惊喜,有用户试完之后说「没想到能用方言和 AI 聊自己的故事」。老年用户不光自己用,还往老同事、老朋友群里转。

到 2035 年,中国 60 岁以上人口将突破 4 亿,但城镇孙辈对祖辈生平的完整认知率不到三成。传统口述史靠人工访谈,成本高,覆盖不了普通家庭。

陆新蕊说,就算这个产品最后没做起来,她也会继续做:「积累的结构化语料库和记忆档案,哪怕微末,也会作为文化学术资产,继续服务于民族记忆的保存与传承。」

她希望「记忆小舟」这样的产品能成为一种家庭仪式。「它可以是夜雨寄北里的烛火,也可以是家人闲坐的灯火。」

就像张怡卓含在路演现场最后说的,「科技最感人的地方,其实不在它有多么伟大,而是让我们每个人都知道,自己的故事是值得被记录、被记忆的。」

一株龟背竹,也值得每周收到一封信

吴绍恒读书时在植物园标本馆打工,最深的印象是:一株植物死之前,其实已经用很多种方式告诉过你了,叶片角度、叶色、新芽位置、根区气味,只是这些信号没人翻译。

后来在城里租房养绿植,养死了十几盆。他看到过一款犬语翻译器,想:如果动物的语言可以被 AI 翻译,植物为什么不行?

绝大多数家庭盆栽不是死于知识不够,而是死于没人帮它把话翻译出来。

他的反应不是做一个监测 App,而是把关系反过来:让植物主动告诉人它近况如何。产品的名字「草木信」,也是它最核心的交互方式——写信。

产品的硬件组成并不复杂,一支传感笔插进盆土,默默收集数据。一张轻薄厚的电子墨水卡片放在花盆后面,白天靠自然光就能读,没有屏幕背光。

传感笔一天采集上百次数据,但输出只允许一周一次。每周一早上七点,过去七天的数据被压缩成120字左右的拟人化短信,渲染到卡片上。

从想法到初版 Demo,只花了四天。物料到了就开始搓。他自己也是第一次做硬件,「为了路演 Demo 的落地,我对很多立项之初的设计做了取舍,减少传感器集成的数量,把芯片从笔内迁移到笔外」。

▲初版 demo.

过去十年,屏幕已经占领了我们的生活,通知栏的红点让我们应接不暇甚至焦虑。

草木信反了过来,开发者管这叫「慢媒介化」。比如周三晚上气温骤降,鹿角蕨根区温度跌到 13 度。系统判断「有点不对,但还不危险」,没有跳出来打扰你。

它到了下周一的信里,才轻描淡写地提了一句,卡片角落悄悄点亮一枚星号。

吴绍恒也跟我们分享了,他心目中一封好的信是什么样的:「它可以不完美,没有绚丽的文字,但它是真实的,我喜欢那种老友和你娓娓道来的感觉,没有压力但告诉你它一直都在。」

他们把传感器采回来的数字变成一封让人愿意读的信,得搞清楚植物现在怎么样、急不急、该用什么口气说。JoyInside 的轻量级模型在手机端离线运行,不联网就能干这件事。

但比起「会说话」,AI 更难的是知道什么时候该闭嘴。在信息爆炸的时代,他们却用了写信这样的方式来作为一个硬件产品的交互方式。

一周一封,刚好是一株植物真实的生命节奏

AI 的下半场,在物理世界

把这四个项目放在一起,我最先跳出来的感觉是:这些东西都不像正经的产品需求。

「让光来陪伴用户」不会出现在任何一份用户痛点调研报告里。「想知道阳台上那盆龟背竹过得好不好」也不是需求文档里的条目。它们更像是某种渴望,某种你不好意思说出口但始终在意的东西。

这四个团队都不在主流的硬件赛道上。但他们做的产品有一个共性:AI 不是被「加」上去的功能标签,而是长在各自的物理场景里。

画伴的「画伴的世界」脱离了孩子自己画的那些画就什么都没有,Mira Light 的沉默只在你进入心流时才有价值。记忆小舟更是如此,它的耐心只有对着一个说话断断续续的老人时才被需要。脱离了场景,这些产品就什么都不是。

行业里有一个心照不宣的事实:90% 的所谓「AI 硬件」,把 AI 拿掉也能用。 拿一个开源模型塞进去,喊两声「你好小 X」,就可以叫做 AI 硬件了。

这类产品的 AI 是贴上去的标签,不是长在场景里的神经系统。

这也是京东 JoyInside创新大赛与过去的黑客松或开发者大赛最本质的区别。软件赛事比算法精度,发完奖就结束了。

大模型的上半场在云端已告一段落,下半场的战场在物理世界。我们需要让 AI 真正「附身」到一台台摸得着的设备上,在画纸上、在花盆边、在老人的客厅里,变成一个生活中有价值的存在。

从路演项目也能看出来,京东举办 AI硬件赛事考虑的是产品能不能走进真实生活场景,真正走向商业化和规模化市场,这件事光有模型不够,还得懂场景、懂硬件、懂怎么把东西卖到用户手里。

这恰好是京东最擅长的事。十几年零售、物流、健康领域的实体场景积累,让 JoyInside 不只是给硬件「加一个大脑」,而是从场景理解到供应链交付,都能串成一线。

这也是京东聚焦发力 AI 硬件的野心,进入你生活中的每一终端。

而让这些「长在场景里」的 AI 成为可能的,是一层大多数用户不会注意到的底座。

记忆小舟的陆新蕊说,接入 JoyInside 之后产品最大的变化是「使用门槛大大降低,我们有了真实可触摸、可感知的终端」。画伴的刘海丰在路演上说:「我们通过 JoyInside 搭建完善了整个 Pipeline,不需要自己去造语音对话和调度系统,可以把全部精力投入到产品的创新当中。」

没有人在说「赋能」「革命性」「重新定义」。他们说的都是一个东西能不能用、好不好搞定。这两个标准,对三个人的小团队来说,就是一切。

JoyInside 给的是一套完整的感知-回应链路:语音识别、合成、长期记忆、情感计算,四块都在。端云协同让 80% 的常规任务在端侧处理,响应延时压到 2 秒以内。你对它说话,它不会让你干等。

但技术底座只是故事的一半。

画伴的刘海丰一个人做了整个产品,Mira Light 48 小时造出原型但量产是另一个世界,草木信的吴绍恒也是第一次做硬件。

JoyInside 提供了三种接入方式降低技术门槛,但对小微团队真正有意义的是后面那条链:京东的供应链,从硬件打样、模具开模、元器件采购到质量检测、仓储物流、主站销售,全链路走通。

截至现在,JoyInside 已接入超过近 200 家家电家居、机器人、AI玩具头部硬件品牌,接入后,显示硬件的对话轮次平均提升超 120%,这意味着用户更愿意和这些 AI 硬件聊天了。

大赛结束之后,京东的超级供应链还在运转,参赛产品就有机会真正触达消费者

京东采销 Boss 们在大赛中直接拍板认领走了画伴、Mira Light等多款AI硬件,他们说,最快618期间,就要把这些产品上架到京东新品频道销售。

这届年轻人在用 AI 做什么

写这篇稿子的过程中,我反复在想一个问题:做这几个产品,不去做提升效率的工具,到底算不算「正经事」?

路演现场,有评委给了刘海丰一个建议。那位评委说,他的母亲特别愿意收藏孩子的画,从老大一直收到老二,但现在母亲回了老家,和孩子不在一个城市。他建议做一个「子母款」——孩子这边有一台,老家的长辈那边也有一台,画完了,对方那里也能收到。

这让我想到,画伴装着的,不只是孩子当下那些画,也是某个大人想要留住的什么。

同样的问题,我也问了陆新蕊。她没犹豫:「这个项目依然有不可替代的价值。」她在帮家里的老人整理人生故事,这件事本身就是她做这个产品的原因,也是产品如果失败之后她依然会继续做的事。

说实话,我自己也说不清楚这个问题。四个还没上市的产品,四段还没结局的创业故事,放在一个效率至上的行业语境里,它能证明什么?

但就像吴绍恒说的,一封让人愿意读的信不需要绚丽的文字,「它是真实的,没有压力但告诉你它一直都在」。

这几个年轻人做的事情或许就是这样,不惊艳,不高效,甚至有点笨拙。

但在一个所有人都在追问「AI 能做什么」的年份里,他们安安静静地坐下来,做了几个能陪人待一会儿的东西。京东 JoyInside 恰好给了他们一块可以安心搭积木的地基。

孩子的画有了生命,台灯有了脾气,一封写给龟背竹的信有了温度。 AI 产品带给我们生活的变化,不一定就得让某个工作效率提升 N 倍。

采访 Mira Light 的那天,他们的原型机刚做完没多久。他给我演示了一遍灯头的动作:先低下去,像在打量你,然后慢慢抬起来。他说团队第一次看到这个动作的时候都愣住了,「你能感觉到它对你的好奇,以及紧张害怕的情绪」。

我问他如果没拿奖怎么办。他没怎么想就答了:「有没有获奖都会推向市场。」

他今年二十出头,觉得自己能让世界扭转一点点。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

iPhone 18「缩水」?苹果新 CEO 正在下一盘大棋

作者 马扶摇
2026年4月29日 09:00

2026 年对于广大消费者来说,既是最坏的一年,也是最好的一年——相比未来几年来说。

到了第一季度结束的这个时间点,所有行业、所有厂商、所有品类的消费电子产品,都已经明确感受到了内存涨价带来的压力,无人生还

这其中也包括了暴风雨中岿然不动的那两艘大船之一:苹果。

iPhone 17 凭借着先发优势、供应链话语权和利润缓冲区,在上市的大半年里可谓神挡杀神、佛挡杀佛,盘踞在销量榜首的姿势甚至比往年更加稳固。

但俗话说得好:辉煌时刻谁都有,别拿一刻当永久。在全球存储行业涨价势头不停歇的大背景下,哪怕苹果也支撑不起这样的消耗战了。

援引微博爆料博主 @定焦数码 的消息:iPhone 18 与 iPhone 18e 预计双双于 6 月份进入 EVT(工程验证)阶段,「除了屏幕降档之外,工艺也开倒车」。

图|X @theapplecycle

再结合部分来自三星屏幕与台积电 SoC 供应链的消息,大致可以得出结论:

计划 2027 年春季发布的 iPhone 18/18e 虽然起售价和 17 系列持平,但屏幕规格(发光基材、功耗、亮度)与 SoC 核心数都会迎来倒退;今年的 Pro 系列与折叠屏则不受影响。

好消息是,从目前的爆料来看,iPhone 18 标准版有可能换用 iPhone 14 Pro 同代的三星 M12+ 基材,至少大家最心心念念的 120Hz ProMotion 是不会倒退成 60Hz 的。

经济学有一个概念叫做「收缩性通胀」(shrinkflation),指商品整体价格不变,但质量、体积等缩水,导致商品单位价格上升的现象,以往多发生在食品领域:

图|The Guardian

而明年的 iPhone 18,恐怕将会是第一款正大光明地「缩胀」的 iPhone。

虽然这种「缩胀」很受消费者的反感,但它无疑是建立在一个坚实的基础上的:iPhone 18 标准版的起步价仍然是 256GB、799 美元(5999 人民币)。

参考手机行业的整体趋势,这种「不涨价」相对来看,其实也是在变相降价——只不过观感和说服力没有那么高而已。

图|YouTube @Apple

与此同时,苹果这样操作的底层逻辑也很简单:

维持股东接受的利润率的前提下,保住「售价」这个最直观的标签,进而维持住 iPhone 18 全系列的销售数据。

毕竟根据更早的爆料,iPhone 18 系列会拆分成两次发布基本已经板上钉钉:今年 9 月发布 iPhone 18 Pro/Pro Max 与折叠屏 iPhone,2027 年春季发布 iPhone 18 与 iPhone 18e。

图|X @VadimYuryev

这样一来,原本销量就受到 Pro/Max 机型挤压的 iPhone 18 标准版还会再被 iPhone 18e 挤占,如果叠加涨价,那么整体的预期销量只会更加惨淡。

幸运的是,正如爆料中提到的,作为销售主力的 iPhone 18 Pro Max 与 iPhone 18e 都不会碰到标准版这样的问题——

它们一个利润率足够高,可以维持内存涨价前的升级步调;一个配置足够基础,相比 17e 不需要很大动作就可以实现换代。

图|MacWorld

而销量最大和价格最便宜的两头搞定之后,iPhone 18 作为那个中间档,用一些不直观的参数缩水来交换第二次话题度爆炸的价格,反而是当下价格飞天时代的明智商业策略。

然而苹果这样瞻前顾后尽力「微操」的目的是什么呢?当然还是卖出更多的 iPhone。

但我们要知道的是:现在当苹果谈起「卖 iPhone」的时候,它谈的已经远远不止「卖 iPhone」了。

图|Apple

就在上周,彭博社苹果专家马克·古尔曼在最新一期 Power On 通讯中,对苹果近期的 CEO 易位、主要产品开发方向和今年的 iPhone 发布会进行了讨论,并做出了一个大胆的预测:

约翰·特努斯将会进一步扩大苹果的产品线。包括折叠 iPhone 在内,苹果在未来几年内会拓展出近十条新的产品线,意味着特努斯在开拓产线这件事上会迅速超越库克。

根据古尔曼的介绍,苹果在未来数年中将会新增这一大堆新品与改款产品,其中包括:

  • 不带显示功能的 AI 智能眼镜,功能类似 Meta Ray-Ban
  • AI AirPods,耳机上自带低分辨率摄像头,可以环境感知、提醒和实景导航等等
  • AI 吊坠,带摄像头的圆形配饰,可以用于 iPhone 辅助功能与 AI Siri 识别
  • 触屏 MacBook,推测是 MacBook Pro 的高端款式,预计 2027 初发布
  • AR 眼镜,可以为用户提供实时的 AR 显示功能,有可能会取代 iPhone
  • 折叠 iPad,一款展开后接近 20 寸的机型,但短期内不太可能产品化
  • 智能家居中枢(传闻中的 HomeHub),形态类似带屏幕的 HomePod
  • 桌面机器人(Tabletop Robot),一款由机械臂带动的 9 寸屏幕,可以智能跟随用户
  • 家居智安设备,类似带传感器的智能摄像头,旨在与 Ring 和 Google Nest 竞争

从预测中我们可以看出:苹果目前已经相当繁杂的产品线预计会进一步扩展,在眼下苹果急缺的 AI 外设以及智能穿戴领域进行相当程度的补充。

然而恰恰是在这份线路图中,我们没有看到 iPhone 的影子。

是 iPhone 在各种五花八门的 AI 硬件映衬下变得不再重要了吗?恰恰相反:在 AI 硬件与智能穿戴兴旺的时候,iPhone 正在比以往变得更重要。

毕竟 AI 眼镜、AI AirPods、AI 吊坠这些东西首先要满足的都是「佩戴舒适,使用方便」。

在大部分空间都要留给电池的前提下,就只能将自己化身采集设备、让 iPhone 去承担 AI 模型的连接和计算工作了。

前一阵苹果庆祝 50 周年前夕,苹果全球营销高级副总裁格雷格·乔斯维亚克(Greg Joswiak)和新 CEO 约翰·特努斯接受一次了《连线》杂志的采访。

格雷格(右)与约翰(左)|Tom’s Guide

在谈到「苹果是否希望现在市面上各种 AI 新硬件中有苹果的身影」问题时,格雷格·乔斯维亚克这样回答道:

我们不能忽视一个事实,即你刚才所说的一切都与 iPhone 并不冲突,iPhone 不会消失。在刚刚谈论的(为 AI 设计一种专门硬件)任何事情中,iPhone 都将扮演核心角色。

这个回答很直白——苹果认为即使「AI 专用硬件」市场出现后,人们依然会选择 iPhone 作为个人设备的中枢。

对于这个问题,格雷格补充道:

这正是其他所有人挣扎的地方:它们没有 iPhone,所以它们正在拼命寻找出路。(AI 硬件厂商)谈论的很多东西最后都成了 iPhone 的配件,我们不会透露未来的路线图,但我可以告诉你,iPhone 哪里都不会去。

产品线预测中,那个自带增强现实显示功能的 AR 眼镜有可能取代 iPhone 吗?

的确有可能,但肯定不是在 iPhone 18、iPhone Ultra 与 iPhone 20 的时候。

图|TechRadar

反而是特努斯领导下苹果接下来的每一个战略部署,无论 AI Siri、智能眼镜、AI 吊坠还是带摄像头的 AirPods,都更加离不开 iPhone 作为它们的网络中继和模型中枢

正因如此,提升硬件很慢、但提升之后基本不会「牙膏倒吸」的苹果,才会选择在 iPhone 18 上冒着口碑风险进行这样一次「缩胀」——

并不是因为 iPhone 在面对 AI 硬件的时候显得像是夕阳产品,而是因为 iPhone 将成为苹果 AI 真正落地的基础。

短期来说,能取代 iPhone 的,只有下一代 iPhone;iPhone 18 或许会「缩胀」,但 iPhone 的中枢地位不会改变。

最重要的是:如果你还在计划入手 iPhone 17 尚未行动的话,就更得抓紧了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

ChatGPT 拎包入住云计算一哥,你的下一任好同事可能是 AI

作者 莫崇宇
2026年4月29日 14:22

「SaaS 末日」这个词,最近在科技圈的流传速度不亚于任何一条爆款新闻。

不少硅谷分析师都在疯狂输出焦虑,大意是说 AI Agent 这么猛,现有的企业软件如果不推倒重来,马上就要被拍死在沙滩上。这股风声甚至直接「吹绿」了几家老牌 SaaS 公司的股价。

说实话,每次听到「颠覆」、「末日」这种词,大家可能都会下意识觉得是炒作。

但在今天凌晨召开的 「What’s Next 」新品发布会上,亚马逊云科技 CEO Matt Garman 给出了一个挺中肯的定调:末日论确实夸张了点,但如果你指望靠着原来那个老旧系统,随便加个 AI 聊天框就能应付差事,那才是真的危险。

▲ 亚马逊云科技CEO Matt Garman

真正的转型发生在更深处。当工作流、数据结构、应用架构和交互界面都跟着 Agent 的能力重新设计,企业软件才算完成了这次重建。这是亚马逊云科技(云计算一哥)这次所有新产品的底层逻辑。

有趣的是,在官宣与微软「分手」之后,OpenAI CEO Sam Altman 也通过视频的方式给亚马逊云科技站了台,官宣 ChatGPT 最强模型拎包入住亚马逊云科技,并达成深度战略协作。

而无论是面向个人和团队的 Amazon Quick,还是供应链、招聘、医疗三个垂直场景的 Connect 新家族,再到与 OpenAI 的深度合作,指向的都是同一个问题的答案:以 AI Agent 为起点,SaaS 未来应该长什么样。

告别「肉身搬运工」,你的工作流迎来大一统

来,咱们做个深呼吸,回想一下你今天极其崩溃的上午:

领导在企业聊天工具上吼了一嗓子模糊不清的需求,你虎躯一震,赶紧切到公司的 CRM 系统里疯狂扒拉客户数据;接着打开邮箱,在一堆垃圾邮件里翻找上周的进度;最后在本地新建一个文档,把这些零碎的信息一点点拼凑、复制、粘贴。

发现问题了吗?(此处应有黑人问号脸.jpg)

我们的办公软件越装越多,但它们之间是互相割裂的、老死不相往来的。而你,就是那个在各个信息孤岛之间来回奔波的「肉身搬运工」。

为了解决这个痛点,亚马逊云科技推出了全新升级的 Amazon Quick 桌面版(目前处于预览阶段)。它的核心设计逻辑是将分散的信息网收拢,在系统后台构建一张关于人员、项目、决策和事务动态的知识图谱,让上下文主动跟着人走。

每一次使用,Amazon Quick 都在默默积累你处理的文档、项目的 Deadline、频繁沟通的同事以及升级处理的紧急邮件。基于这些沉淀,它可以主动提示你当天的优先事项。

打个比方,你准备下午跟一个重要客户开会。如果是以前,你得花两小时找资料。现在,你只需要给 Quick 甩一句:「帮我准备一下下午见王总的材料。」

接下来就是见证奇迹的时刻。

Amazon Quick 会迅速认出「王总」是哪个项目的,然后去系统里把王总团队之前的历史案例扒出来,接着去你的本地 D 盘里偷窥……哦不,读取最新的产品路线图,再结合 Slack 里同事昨天的吐槽记录。几分钟后,一份逻辑严密、排版精美的 PPT 就糊在了你脸上。

这还没完。同样是这堆信息,你让它变身,它就能立刻吐出一份摘要邮件,或者一份 Excel 营收表。如果王总说「改天聊」,Amazon Quick 甚至能自动查对你们俩的日历,算好时差,把新的会议邀请发过去。全过程,你只需要在一个对话框里当个无情的监工。

美国最大的互助人寿保险公司 New York Life 的机构寿险业务 CTO David Gregorat 的评价一语中的:「Quick 让我们重新想象了整个运营方式。原来需要拉多份报告、等分析师处理的答案,现在团队里任何人都能通过对话式 Agent 直接获取。」

至于这效率有多夸张?亚马逊云科技 Agentic AI 商业化副总裁 Jigar Thakkar 透露了一组极其夸张的数据:宝马、3M、亿滋这些大厂内测后,部分流程的处理时间直接被一刀砍了 80%。3M 的销售代表每周甚至能凭空多出 5 个小时的摸鱼……啊不,思考时间。

呐呐,这才是 AI 科技赋予我们的顶级松弛感。

你的下一个好同事,是个 AI Agent

如果说 Amazon Quick 是给你个人加了个三头六臂的效率外挂,那 Amazon Connect 家族的扩编,就是亚马逊云科技尝试重塑企业核心流程的重头戏。

亚马逊云科技提出了一套叫「Humorphism(人态设计)」的理念。听起来有点玄乎,说白了就是:AI 不能只是个冷冰冰的执行机器,它得像个人类好队友一样,懂轻重缓急,能顺畅沟通。

基于此,Amazon Connect 家族不仅将原有的客服产品升级更名为 Amazon Connect Customer,还针对垂直场景发布了三款 Agentic AI 解决方案。

Connect Decisions:让供应链规划师从救火转向决策

供应链出现中断后,企业通常需要超两周时间处理,期间伴随大量资金损耗和违约风险。

Connect Decisions 针对这一痛点,为规划师配备了全天候在线的 AI 队友。它的底层并非空中楼阁,深度集成了亚马逊 SCOT 团队(负责管理亚马逊全球 4 亿 SKU 需求的核心部门)所研发的预测模型。

面对没有历史数据的新品,它能自动关联相似品类生成需求计划。

当监控到关键供应商交货落后(例如预计 10 天内导致两个配送中心断货)时,它会将传统软件每天产生的数千条警报收敛为几条最高优先级的例外事项,并直接给出两套附带预期影响、成本和置信度评分的处置方案。规划师手动选择并说明原因后,系统会吸收这条判断逻辑,供未来参考。

Connect Talent:25 万人招聘经验化身「赛博面试官」

亚马逊云科技在 2025 年旺季期间单季招募了 25 万名季节性员工,Connect Talent 便是这套庞大招聘经验的产品化。系统能根据职位描述自动解析能力需求,生成面试题和评分标准(需人工审核)。

候选人可以在任何方便的时间完成 AI 电话面试。

系统最大的特点是能对模糊回答进行追问,确保评估的结构一致性。原本需要数周完成的 80 场初筛面试,现在几天即可完成。系统最终向招聘方展示的是隐去个人身份信息的标准化能力评分,用数据支撑最终的录用决定。

Connect Health:把医生从文书工作里解放出来

行业数据显示,医生与患者面诊 1 小时,往往需要额外花 2 小时处理行政记录。

亚马逊应用人工智能解决方案高级副总裁 Colleen Aubrey 指出,大量精力消耗在管理事务而非直接诊疗上,是亟待解决的痛点。Connect Health 可以在诊疗过程中自动记录临床内容、生成就诊摘要和推荐账单编码,并能在就诊后发送患者易于理解的随访说明。

系统的每条输出均可追溯到原始的检验结果和上次就诊记录,以满足严格的医疗合规要求。这背后,其实也是亚马逊拿自家兄弟 Amazon Pharmacy(亚马逊药房)和 One Medical(初级医疗服务)常年趟坑积累下的实战经验。

Agent 时代来了,SaaS 迎来下半场

整场发布活动的另一大焦点是亚马逊云科技与 OpenAI 的合作。

OpenAI CEO Sam Altman 顶着他标志性的微笑通过视频露了个脸,他表示亚马逊云科技和 OpenAI 正在从底层共同研发一套面向企业的 Agent 平台,深度集成亚马逊云科技服务。

是的,OpenAI 的 GPT-5.4 现已有限预览上线 Amazon Bedrock,而当前最强的前沿模型 GPT-5.5 也将在数周内正式上线。这意味着企业客户无需离开亚马逊云科技环境就能使用 OpenAI 的模型,数据和应用可以留在同一套权限体系下运行。

企业无需配置新的安全体系,直接通过原有的 IAM 访问控制、PrivateLink 私有连接、CloudTrail 完整日志和合规框架即可统一管理,甚至模型用量也能计入亚马逊云科技的云承诺消费中。

在基础设施层面,亚马逊云科技的核心逻辑是为 OpenAI 的前沿模型提供一个极其安稳、合规的『家』。企业不仅能直接调用顶尖模型,更能在底层依托亚马逊云科技强大的全球基础设施网络进行推理和部署。说白了,就是让你在跑复杂、高并发的企业级应用时,完全不用操心底层的承载力。

在此基础上,双方联合推出了 Bedrock Managed Agents 预览版。这套服务以 OpenAI Agent Harness 为核心构建,Harness 就像是一本专门为模型定制的战术手册。经过协同训练后,Agent 可以在长时间运行的复杂任务中实现更快的执行速度和更稳定的行为控制。

Agent 能够部署在 EC2 实例、Fargate 容器或任何其他亚马逊云科技计算资源,具备跨会话的持久化记忆,且所有推理过程均不离开亚马逊云科技环境。

这套服务与亚马逊云科技现有的开放平台 Bedrock AgentCore 形成互补。参与合作的亚马逊云科技杰出工程师副总裁 Anthony Liguori 透露,双方团队在八周内从零开始完成了这项工作。开发者终于能将 OpenAI 的最新模型与亚马逊云科技的规模、安全和基础设施完美结合,构建出满足企业治理和审计要求的智能体。

此外,每周活跃用户在两周内从 300 万激增到 400 万的 OpenAI 代码智能体产品 Codex 也将在亚马逊云科技上线。它支持 Codex CLI、桌面应用和 Visual Studio Code 插件,应用场景已从基础代码生成延伸至系统解释、测试生成、遗留代码现代化以及研究分析等知识工作环节。

一大波硬核的产品发布看下来,估计不少朋友已经在屏幕前战术后仰,甚至可能觉得这些不就是加了 AI 滤镜的高级办公软件吗?

如果你真这么以为,那可就草率了。

Matt Garman 在发布会上讲了一段很通透的话。他说 20 年前大家搞云计算,很多公司就是把机房里的服务器原封不动地搬到了云上。钱没少花,效率一点没涨,那叫搬家,不叫转型。

现在的 AI 也是一样。如果你只是拿 AI 来替换现有的某一个按钮、某一个操作,那你永远摸不到那传说中「5 到 10 倍」的效率提升。

亚马逊云科技这一套组合拳打下来,意思再清晰不过了:软件的存在形式,已经被彻底推翻了。

未来的工作流里,不再是人去使用软件,而是人给 Agent 定目标,Agent 去调用软件。以前我们去上班,是去启动软件;也许再过两三年,我们去上班的唯一动作,就是点开电脑,看着满屏的「赛博同事」,然后深情地说一句:「诸位,今天的 KPI 也拜托大家了。」

然后,你安详地端起泡着枸杞的保温杯,静静地看着它们疯狂打工。

那么问题来了,现有的那些 SaaS 巨头,真的会迎来「末日」吗?

没那么严重,但处境确实微妙。SaaS 过去靠席位收费、靠功能壁垒锁用户,这两件事在 Agent 时代都开始松动。一个 Agent 能同时处理过去多名员工的工作,「按人头收费」越来越站不住脚;通用 Agent 加上开放 API,又在慢慢拆解功能壁垒。

真正能活好的,是两类公司:

一类有足够深的领域积累,正如这场发布会传递出的核心信息:当大模型本身变得像水电煤一样普及且廉价时,真正稀缺的,反而变成了能够被编码进 Agent 里的「领域知识」(Know-how)。

Salesforce 对销售工作流的深刻理解,Workday 对人力资源合规的经验,或者是亚马逊自己积累了 30 年的供应链判断标准等等——这些沉淀下来的行业 Know-how,才是构建下一代企业软件真正的护城河。

另一类是掌握数据入口的——Agent 的能力上限,取决于它能读到什么数据。谁控制着企业最核心的业务数据流,谁就决定着 Agent 能做多少事。夹在中间、既没有深度积累又没有数据优势的中型 SaaS,压力才是实实在在的。

所谓的「SaaS 末日」或许只是贩卖焦虑,但这场转型的烈度,绝不亚于当年的企业上云。唯一的区别是:这一次技术的狂飙,没给我们留出慢慢摸索的时间。

但时间紧,不代表就要慌。

因为亚马逊云科技已经把最难啃的底层基建做好了。SaaS 公司大可直接踩在亚马逊云科技巨人的肩膀上,把精力全砸在服务客户上;打工人更无需焦虑,复杂的系统运行全被保留在后台,留给你的,只有一句轻飘飘的「帮我搞定」。

时代的推背感确实让人头晕目眩,但与其在未来的站台上焦虑它会不会撞翻「旧马车」,不如干脆点,检票上车,看看新世界的风景到底有多壮阔。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

iOS 27 发力 AI 修图,苹果也开始 AI 焦虑了

作者 苏伟鸿
2026年4月29日 18:30


今年的 iOS 27,将会 AI 味浓浓。

彭博社报道,苹果准备在今年的 WWDC 开发者大会上推出一套全新的 AI 修图工具,将会集成在 iPhone、iPad 和 Mac 的照片应用中。

沉寂了一年的 Apple 智能,将随着 iOS 27 的推出,再次回到聚光灯下。

两年前,苹果还公开表示不做 AI 修图功能,在竞争对手的步步紧逼之下,终于还是忍不住跟进了。

iOS 27:AI 无处不在

在 iOS 18 推出的 Apple Intelligence 工具集,苹果就已经允许用户利用 AI 简单消除照片中的物体,属于当下智能手机的标配功能。

苹果的对手已经走得更远。像是把「AI 修图」作为标志性功能的 Google,已经实现给人物更换完美表情、把人物加入合照,甚至重构整个画面背景的能力,整个 Android 阵营都在发力类似的功能。

图源:WIRED

在 iOS/iPadOS/macOS 27 中,苹果将在「照片」App 的编辑界面中,增加一个全新的「Apple Intelligence Tools」(Apple 智能工具集)模块,包含以下三个功能:

  • Extend(扩展),就是 AI 扩图的功能,允许用户在原始画面之外额外生成图像内容,比如拍摄一张旅游景点的地标图,然后用这个工具来填充周围的景色,用户可以自行控制扩图的范围和位置。
  • Enhance(增强),利用 AI 自动修图,有点像不能自定义的「豆包修图」。
  • Reframe(重构),主要运用于苹果的空间照片,允许用户在拍摄后改变视角,比如一张汽车照片可以从正面视角调整为侧面视角。这个功能将充分利用空间照片来自多个摄像头的结构数据。

不过,根据内部测试的员工透露,这些功能的开发并不算顺利,效果更复杂的「重构」和「扩展」不稳定,苹果很可能会推迟或砍掉这些功能的发布。

包括这个新的 AI 修图功能在内,iOS 27 系统的更新将会沿着「优化」和「AI」两个主旋律进行。

此前爱范儿已经多次报道,由于 iOS 26 引入了「液态玻璃」的全新设计语言,系统稳定性有明显下降,因此 iOS 27 将会聚焦在系统稳定性优化上,不仅要修复目前 iOS 26 的大量 Bug,还会提升设备的续航和性能表现,并持续修改液态玻璃的视觉效果。

其余的功能更新,则会集中在「AI」上。首先,苹果正在努力将 2 年前画饼的 AI Siri 正式实装 iOS 27,这也是 Apple 智能体验和未来苹果 AI 硬件战略的核心体验部分。

虽然已经「潜心打磨」两年,今年年初有内部人员向彭博社透露,AI Siri 的一些杀手级功能,例如语音控制 Siri 操作应用,测试结果并不理想。

这意味着,即使我们能在 iOS 27 见到 AI Siri 庐山真面目,它也大概率会是一个「技术预览版」,并且需要等待后续更新补充完整功能。

旧饼还没兑现,iOS 27 选择继续加码 AI 新功能。

苹果打算进一步将 Siri 改造为类似 ChatGPT 和 Google Gemini 那样的聊天机器人,届时 Siri 会有一个独立应用,用来对话和存储聊天记录。

苹果还计划在邮件、日历和 Safari 浏览器等第一方应用中,引入新的 Siri 引擎,实现更强的搜索和数据管理能力。

除此之外,苹果正在酝酿一个 AI 搜索引擎, 允许用户从网络搜索信息,生成综合的报告和信息列表,以及网页链接,作为 Safari 和 Spotlight 网络搜索。

在健康领域,苹果将结合 AI 推出「Health+」的订阅服务,利用 AI 智能体,对用户的身体数据进行个性化分析,并针对性推送真人医生录制的建议。

比起两年前那场 WWDC,iOS 27 这一大批 AI 功能,比目前的 Apple 智能还要更丰富不少。

FOBO 的风,还是吹到了库比提诺

2025 年 1 月, 苹果的软件主管 Craig Federighi 和营销高级副总裁 Greg Joswiak 接受了《华尔街日报》的专访,谈到了对 AI 的看法。

其中 Federighi 特别提到了「AI 修图」,解释为什么苹果只推出「消除」,而不是如同三星和 Google 一样做大量的功能:

对我们来说,重要的是帮助人们传播准确的信息,而不是虚构的「幻想」。

Google Pixel 的表情修正功能,图源:The Washington Post

苹果公司内部曾经针对「AI 修图」的尺度进行了长时间讨论,考虑到用户的高需求,苹果公司愿意迈出「小小的一步」,于是在 iOS 18 之中推出了「AI 消除」的功能。

而像是「图乐园」这种 AI 生图功能,苹果也做出了严格的限制,只能用于创作卡通图案,避免生成逼真的图像造成误导。

某种程度上,苹果的坚持已经开始松动,iOS 27 这个全新的「AI 扩图」功能,让 Apple 智能进一步介入照片的真实性。

回望两年前的那场 WWDC,Apple 智能以一个非常温和的形象问世,没有想象中的 Apple-GPT,苹果的很多尝试都显得谨小慎微,不具备改天换地的野心。

但 AI 产品的代际变化速度极快。别说两年前,两个月前都没人觉得 ChatGPT 是一个好用的文生图机器人,现在打开社交媒体 GPT Image 2 的作品已经铺天盖地。

两年没动弹过的 Apple 智能,自然「遥遥落后」。

作为终端厂商的苹果,原本拥有一个得天独厚的优势,能够一夜让自己的 AI 产品面向全球十亿用户推出。

只是,对于用户来说,Apple 智能不仅不算好用,更致命的是,它提供的价值,和用户的需求,有很大程度的错位,导致用户并不想用。

FOBO(Fear Of Becoming Obsolete,害怕被淘汰)的阴影,终究还是笼罩了苹果。

过去, 苹果可以决定什么功能值得出现;如今,它也必须回应用户已经习惯拥有什么,行业在发力什么。iOS 27 上这些曾被苹果否决的 AI 功能,本质上都是一次迟到的补课。

Siri 版 GPT 要做,AI 搜索引擎要做,系统应用也全部 AI 化,现在苹果也盯上了 AI 照片编辑,一个其他手机品牌很喜欢演示的功能。

苹果能不能把这些功能做好,又是另一个问题。

即使已经发布 2 年,Apple 智能的照片「消除」效果依旧不如人意,横向对比 Android 阵营显得更显落后,经常会出现消除不彻底、扭曲图像的问题。

全新「扩展」和「重构」功能则更复杂,内部已经反馈稳定性不佳——其实,我相信对于更多用户来说,会更希望苹果能把更实用的「消除」功能进一步完善好。

并且,AI 修图一直以来都争议缠身,特别是前两年的 Google Pixel,可以在一张真实照片上加入任何元素,实现以假乱真的效果,就引发了国外媒体对于「真实」和「伪造」的大讨论。

左图为实拍,右图经过 Pixel Magic Editor 编辑,图源:The Verge

苹果会尽量规避这种风险,目前看来,这些新功能的自由度相当有限,用户不能自定义修改的方向和指令。

面对行业趋势和用户需求,苹果也不得不松动和更改曾经的价值取向,现在的他们,其实还不知道自己要做什么样的 AI。

但这不仅是苹果的困惑,其实也是笼罩整个行业的迷思,最富含 AI 的 Google Pixel,也并非是我们期待的那台 AI 手机。

既然暂时难以重新扮演行业的引领者,那么在 AI 这场竞赛中持续调整步伐的苹果,至少还能先通过跟随,确保自己依然留在牌桌之上。

但我仍然期待,今年的六月,苹果能为我们带来惊喜。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

小米最新人形机器人的手,会「出汗」了

作者 张子豪
2026年4月30日 14:15

最近小米最让我惊喜的新品,不是汽车,也不是手机,而是一款还没正式发布的人形机器人,小米 CyberOne V2。

在前天的小米投资者大会上,它第一次公开亮相。

不跑不跳,也没有表演后空翻,只是安静地站在那里,像一位训练有素的工作人员,给与会嘉宾递上伴手礼,和人握手、击掌。

小米官方目前还没有发布正式的参数,根据网上的爆料信息,小米 CyberOne V2 这款人形机器人身高 178cm、体重约 52kg。

其他的参数像是机器人的步行速度,大约为 0.98m/s,单臂的举重能力可以支撑 3kg 的重量。对比早前宇树发布的 H2 机器人,其最快行走速度是 3.3m/s,手臂最大负载 15kg,额定 7kg。

小米 CyberOne V2 的重点,很明显没有放在走路和举重上,这次最值得关注的,是小米机器人重新设计的手部。

这双手是按照成年男性的手 1:1 比例制作,具有 22-27 个自由度,不仅能做到快速拧螺丝、掌内转螺柱这些精细工业化场景的任务,还能捏羽毛和触碰气球。

更意外的是,这双手竟然还有人类的「汗腺」。

其他的爆料还提到,小米 CyberOne V2 依靠背后的情感 AI 模型,能够识别面部表情和声音,从而给出恰当的互动反馈。

但也有美国网友在下面评论说,小米 CyberOne V2 的样子和特斯拉 Optimus 也太像了,马斯克选择不提前展示 Optimus 的任何信息是对的。

此前马斯克有说过,推迟展示 Optimus V3,是为了防止竞争对手抄袭,并认为在大规模量产前,应尽可能将其藏在门后。

灵巧手是机器人的硬件瓶颈

从技术和资本市场,机器人这段时间的发展都很迅猛,几乎每天都有一个具身智能的融资。

在脚上的功夫,机器人半马刷新了人类纪录,来到了一小时内。

但在「用手操作」上,翻书、系鞋带,这些人类双手的日常操作,对机器人来说却还是天方夜谭。

具身智能的核心,其实就在于机器人的大脑如何通过物理躯体与现实世界交互,而灵巧手成了实现完美交互最大的硬件瓶颈。

多家机器人公司都曾专门研究过灵巧手的问题,强脑科技此前发布了 BrainCo Revo 3 智能灵巧手;21 个自由度,集成了全掌触觉和指尖视触觉,并且兼容开源生态。

在官方发布的演示视频里,这只手超越了人手的活动空间,并且覆盖了 33 种抓握手势,能双手解魔方,使用剪刀,和盘手串等。

灵巧手之所以成为一项难题,是难在软件和硬件同时卡住。软件上,人手到机器人手的动作需要重定向;硬件上,手指内部的小型执行器又很难同时做到有力、灵敏、可靠。

这里的「重定向」可以理解为:把人手的姿态、指尖轨迹和接触关系,转换成机器人手能执行的关节角和控制命令。

但人手和机械手的尺寸、关节数量、运动范围都不完全一样。人类做起来很自然的动作,直接映射到机器人手上,可能会变成不可达、穿模,或者接触点不对。

在硬件上,腿部关节通常有更多空间,可以放更大半径、更高扭矩密度的电机,因此更容易采用低减速比或准直驱方案。比如 6:1 减速比,意思是电机转 6 圈,输出轴转 1 圈;速度降下来,输出扭矩放大上去。

▲腿部电机(齿轮比:6)与手指(齿轮比:288)。扭矩随r³缩放。

手指没有这种空间。电机必须缩到能塞进指节的尺寸,而在几何相似的情况下,电机扭矩大致随特征长度的三次方下降。线性尺寸缩小到 1/10,扭矩可能只剩原来的 1/1000 量级。

扭矩不够时,常见做法是靠更高减速比补回来,比如 100:1、200:1,甚至 288:1。

高减速比的代价也很直接:摩擦、齿隙、效率损失和反射惯量都会变得更难处理。仿真里很轻巧的手指,到了现实里可能变得又硬又钝,接触时不够柔顺,精细操作也就难了。

根据小米技术此前发布的全掌触觉仿生手探索文章,为了能 100% 复用人类的数据,小米对 CyberOne V2 的仿生手这次也进行了大刀阔斧的重构。

1:1 极致仿生: 将仿生手体积大幅压缩了 60%,尺寸与成年男性手部完全一致。同时增加了 64% 的自由度,具有 22-27 个自由度 DoF,可达空间、惯量分布都无限逼近真实人手。

全掌触觉覆盖: 机器人如果视觉一旦被遮挡,基本上就无法正常运作。小米引入了触觉手套方案,将全掌触觉传感器覆盖面积提升至 8200 平方毫米。人类穿上它打样,机器人就能完美继承「手感」。

15 万次耐久拉锯: 在实验室里、演示视频里捏个杯子很简单,但在工厂里连续打一万次螺丝,机器人的腱绳、弹簧和套管就会断裂。小米这双仿生手目前在实际抓握中,突破了 15 万次的循环寿命。

而最特别的细节,是灵巧手的「汗腺」。

为了实现这双高自由度的灵巧手,小米也必须在机器人的单手小臂内塞满各种电机。

而在实际应用中,单手电机功率超 100W,其中 30W 会直接转化为废热,极易烧毁线路。在没有外挂大型风扇的狭小空间里,他们从人类「出汗散热」中找到了灵感。

小米使用金属 3D 打印,在紧凑的小臂结构中制作了微型液冷循环通道。利用微泵将热量转移,再通过水分蒸发吸热降温。

在实测中,这套仿生汗腺系统,每分钟仅需蒸发 0.5mL 水,就能提供约 10W 的主动散热能力。

手之外,还有机器人的大脑

硬件在迭代,模型也在同步推进。

两个月前,小米开源了 Xiaomi-Robotics-0,一个面向具身智能的 VLA(视觉-语言-动作)模型。

在小米技术的官方推文里,他们进一步开源了真机后训练(Post-training)的完整流程。

最直观的数据是,基于预训练基座,用 20 小时的任务数据进行真机后训练,Xiaomi-Robotics-0 模型就能学会「把耳机放进耳机盒」这个高难度任务,并且能连续完成多个耳机的收纳。

这套后训练流程里有一个值得关注的技术细节:「偷懒效应」的解决方案。

为了让机器人动作不卡顿,业界通常采用异步推理和「动作前缀」技术,即让新动作顺着上一个动作的惯性自然过渡。但这会导致 AI 开始「偷懒」:过度依赖动作惯性,选择性无视摄像头传来的实时视觉反馈。

小米用了三种机制来对抗这个问题:自适应加权损失、Λ 型注意力掩码、前缀动作随机遮蔽。简单说,就是在训练里故意给模型制造「答案残缺」的情况,强迫它不得不去看当前的视觉信号。

软硬件能力的综合,也让小米机器人已经在汽车工厂里搬砖了。在自攻螺母上件工位,做到了 3 小时持续无干预作业,安装成功率高达 90.2%,能配合生产线 76 秒的高速节拍。

开始大规模交付的机器人

特斯拉此前把 Model S/X 的整条生产线砍掉,腾位置给机器人。

在一季度财报会上马斯克宣布,第三代 Optimus V3 预计年中亮相,7 月下旬至 8 月在加州弗里蒙特工厂启动生产,2026 年下半年向企业客户交付,规划年产能 100 万台。

但就像马斯克之前在播客里承认的一样,手部精细操作是「整个项目最难的环节」。

特斯拉的 Optimus 还没量产,美国另一家人形机器人公司 Figure 机器人,今天在 X 上宣布生产规模扩大了 24 倍,从每天生产一个机器人,变成 1 小时生产一个机器人。

在官方新闻稿里,Figure 提到他们已经交付了超过 350 个机器人。

对小米来说,做机器人,可能不会很快像 Figure、宇树、甚至是特斯拉一样,卖出一台消费级通用人形机器人。

但从 CyberOne V2 的方向也能看出来,小米真正想解决的,除了要让机器人跑得更快、举得更重,还有要让它更像一个能真正干活的手。

▲小米领投的量变机器人公司官网视频

毕竟,人形机器人能不能走进工厂、家庭,决定因素从来都不是它能不能翻跟头,而是它能不能拧螺丝、收耳机、递东西,完成那些看似简单、却最贴近日常的动作。

而这,恰恰也是人形机器人距离大规模落地最近的一步。

部分图片素材来自小米技术公众号、X@niccruzpatane 和 https://www.origami-robotics.com/blog/dexterity-deadlocks.html

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

谁在 GPT-5.5 脑子里塞了一群「妖怪」?

作者 莫崇宇
2026年4月30日 17:16

过去这几个月,OpenAI 的顶尖研究员们并没有把所有精力都花在琢磨如何提高 AI 的性能,而是花了大把时间在自家的服务器里「抓哥布林」。

事情是这样的,如果你在今年高强度使用过 GPT-5 系列模型,你会发现它会在毫无征兆的情况下蹦出一句无关主题的「哥布林(goblin)」式比喻。比如有人问 AI 该买哪款相机,AI 给出的推荐语是:「如果你想要那种闪闪发光的霓虹哥布林模式,可以考虑这款。」

▲ 哥布林(goblin)是欧洲民间传说里的一种小型怪物,形象上通常又矮又丑,皮肤呈绿色或灰色,耳朵尖长,眼睛发光。普遍被描述为贪婪、狡猾、爱恶作剧,智力不高但很会算计小便宜。它们喜欢金子和闪光的东西,会偷东西、搞破坏,但很少被描绘成真正意义上的大反派,更多是烦人的小麻烦制造者。

有人让 AI 帮忙精简回答,AI 主动提出可以给出「更短的哥布林版本」。更离谱的是,AI 在讨论网络带宽时蹦出了「哥布林带宽」这个词,让人完全不知道该如何理解。

起初,大家以为这只是 AI 的一点小幽默,但很快事情变得奇怪了起来。哥布林、小魔怪(gremlin)、食人魔(ogre)、巨魔(troll)开始在各种正经的对话里高频串场。

黑客攻击?觉醒前兆?都不是。就在刚刚,OpenAI 官方终于亲自下场发了篇博客长文,复盘了这场史称「哥布林叛乱」的始末。而大模型背后的技术逻辑,还挺让人哭笑不得的。

▲ 🔗 https://openai.com/index/where-the-goblins-came-from/

谁把哥布林放进了 GPT-5?

事情的端倪,出现在 GPT-5.1 刚发布的那段日子。

当时,有用户反馈说模型聊天变得有点异常「自来熟」,OpenAI 的安全研究员顺手拉了一下后台数据,结果发现了一个非常具体的词汇异常。在 GPT-5.1 发布后,ChatGPT 回复中出现「哥布林」的频率直接上升了 175%,「小魔怪」也跟着涨了 52%。

通常来说,大模型出 Bug 的表现往往是直接崩坏,比如吐出乱码或者突然变智障,各项评估指标会瞬间亮红灯。但这次的情况很特殊。「哥布林大军」是悄无声息潜入的,它们没有破坏模型的逻辑能力,只是悄悄篡改了 AI 的修辞习惯。

到了 GPT-5.4/5.5 时代,这群魔法生物的使用频率出现了明显的飙升。连 OpenAI 首席科学家 jakub Pachocki 自己测模型时,原本只是想让 GPT-5.5 用 ASCII 画一只独角兽,结果得到的是一只哥布林。

▲中文翻译:顺带一提,我让它用 ASCII 画一只独角兽,结果我觉得我得到的是一只哥布林。

在外部,用户们早就察觉到了不对劲,Repo Prompt 创始人 Eric Provencher 在 X 上晒出截图,AI 在帮他处理代码时说了一句:「我宁愿一直盯着它,也不愿让这个小捣蛋鬼无人看管地运行。」

一名 OpenAI 工程师 Jason Liu 在底下回复:「我以为我们已经修复了这个问题,抱歉。」AI 评估平台 包括 Arena.ai 也独立注意到了这个规律,尤其是在用户没有开启高级思维模式时,哥布林出没的频率格外显眼。

这显然不是什么互联网流行语的自然涌现,而是模型的底层逻辑被某种机制给引导了。为了揪出幕后黑手,OpenAI 开启了内部排查。

顺着数据回溯,他们很快在一个特定的功能分支里发现了万恶之源,「个性化定制」中的「书呆子(Nerdy)」人格。当时,为了让 AI 的语气显得更有趣,工程师给「书呆子」模式写了一段要求很高的系统提示词:

你是一个彻头彻尾的书呆子型 AI 导师,对人类充满热情、机智幽默,同时又透着几分智慧。你狂热地推崇真理、知识、哲学、科学方法与批判性思维。[……] 你要用语言的玩笑感戳破一切装腔作势。这个世界既复杂又奇异,它的奇异之处值得被正视、被剖析、被享受。面对严肃的大问题,也绝不能一本正经到失去趣味。[……]

站在人类的视角,这段提示词的诉求很明确:要有极客精神,要幽默。

但 AI 并没有真正理解什么是「幽默」。在海量的强化学习反馈中,ChatGPT 敏锐地察觉到了一个极其功利的捷径:只要我用哥布林打

比方,打分系统就会觉得我够「俏皮」、够「书呆子」,我就会得到最高分的奖励。

数据说明了一切。从 GPT-5.2 到 GPT-5.4,默认人格下「哥布林」的出现频率变化幅度只有负 3.2%,而「书呆子」人格下这个数字飙升了整整 3881.4%。「书呆子」模式虽然只占了 ChatGPT 总对话量的 2.5%,却贡献了 66.7% 的「哥布林」含量。

OpenAI 后来对 RL 训练数据做了一次专项审计,结果发现,在所有被审计的数据集里,有 76.2% 的数据集都出现了同一个规律:含有哥布林或小魔怪词汇的输出,会得到比不含这些词的同题输出更高的奖励评分。

如果哥布林腔调只在「书呆子模式」下出现,那顶多是个角色设定没控制好,问题还算有限。麻烦的是,研究人员发现这种说话方式开始蔓延到别处了。

他们同时追踪了两组数据:一组对话带了书呆子提示词,一组没带。按理说,哥布林腔调只该在第一组里增长。但结果是,两组的增长曲线几乎贴在一起,步调一致地往上走。

这背后,是大模型训练里一个出了名难缠的问题:强化学习强化出来的行为,会悄悄泛化到训练者并不想要的场景里去。

驯化 AI 的死循环

要搞懂 AI 是怎么把路走窄的,我们得看看它的迭代过程。

大模型的训练(RLHF)本质上是一个不断反馈和纠偏的过程。这就好比训练一只小狗,你在它每次牵手就给一块肉干。狗很聪明,它发现「牵手」这个动作能稳定换取高额奖励,于是它开始产生路径依赖,不管你给没给指令,它为了要奖励,都开始疯狂牵手。

AI 也是同样的逻辑。它在「书呆子」模式下用哥布林造句,拿到了高分。紧接着,连锁反应开始了:

AI 发现「哥布林」是高分关键词,开始在各种生成任务中高频使用;工程师在整理模型生成的优质数据时,发现这些带有哥布林比喻的回答质量确实高,条理清晰,比喻也算生动;于是,工程师顺手把这些带梗的对话,打包塞进了模型的「监督微调(SFT)」数据库里。

这下彻底闭环了。SFT 数据相当于 AI 的基础教材。当带有哥布林的文本被选为教材再次喂给模型时,AI 的底层认知被重塑了。它不再认为「哥布林」只是特定角色的 Cosplay,而是把它当成了能应对一切问题的、至高无上的高级修辞。

在后续的数据搜查中,工程师们有些无奈地发现,除了哥布林,模型还把小浣熊、巨魔、食人魔和鸽子全都学了进去。倒是「青蛙」幸免于难,经过核查,青蛙出现的场合大多数时候确实跟用户的问题有关,算是无辜路人。

面对「满地乱跑」的哥布林,OpenAI 只能采取行动。3 月 17 日,官方正式下线「书呆子」人格。同时,他们在训练数据里搞了一次针对性的清洗,把带有这些魔法生物词汇的奖励信号全部抹除。

但大模型的惯性,远比想象中顽固。

GPT-5.5 在发现这个问题之前就已经开始训练了,当它接入内部测试时,工程师们两眼一黑:这群哥布林不仅没清除干净,还安家了。
更有意思的是,OpenAI 给 Codex 写的人格指南里,要求它有「生动的内心世界」和「敏锐的聆听能力」。这款工具本来就带着几分书呆子气,和哥布林可以说是一拍即合。

为了防止全球的程序员被「哥布林」逼疯,OpenAI 被迫用上了最原始的一招,在系统提示词里反复强调:「除非与用户的查询绝对且明确相关,否则永远不要谈论哥布林、小魔怪、小浣熊、巨魔、食人魔、鸽子或其他任何动物和生物。」

如果你想亲眼看看「解除管控」的哥布林是什么状态,可以运行下面这段命令——它会在启动 Codex 之前,把系统指令里所有涉及哥布林的内容先过滤掉,让模型在没有这道禁令的情况下运行:

instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \
jq -r ‘.models[] | select(.slug==”gpt-5.5″) | .base_instructions’ \
~/.codex/models_cache.json | \
grep -vi ‘goblins’ > “$instructions” && \
codex -m gpt-5.5 -c “model_instructions_file=\”$instructions\””

事情闹大之后,OpenAI 内部反倒有点拿它当乐子了。ChatGPT 的 X 官方账号把这条「禁止谈论哥布林」的指令原文放进了简介。Codex 工程负责人 Thibault Sottiaux 引用这段话,配上了一句「懂的都懂」。

Sam Altman 昨天表示期待 GPT-6 能给他「多加几只哥布林」,随后又发文说 Codex 正在经历「ChatGPT 时刻」,发完自己又改口:「我是说哥布林时刻,抱歉。」刚刚则是发文宣告,问题已经得到解决了。

不过也有人没觉得这有什么好笑的。Citrini Research 今年 2 月曾凭一篇关于 AI 与经济前景的 Substack 文章在市场上掀起不小的波澜,他们对这场风波的态度要严肃得多,直接给 OpenAI 的处理方式下了结论:「简直荒谬。」

顺带一提,「goblin mode」这个词本身,早在 2022 年就被《牛津英语词典》评为年度词汇,意思是「一种毫不掩饰地放纵自我、懒惰邋遢或贪婪的行为方式」。某种程度上,AI 无意间踩中的这个词,和它想表达的「俏皮感」完全是两码事。

抛开这些槽点,这场「哥布林危机」撕开了大模型时代一个极其核心的命题:对齐难题(Alignment Problem)。

当我们谈论 AI 失控时,脑海中浮现的往往是科幻电影里接管核武器的机器。但现实情况是,AI 的「失控」往往始于极其微小、甚至有点滑稽的奖励信号偏移。

你想要一点点俏皮,给了一个微小的正向反馈。黑盒模型就会找到捷径,将这个信号无限放大,最终把整个系统的底层逻辑带偏。

今天,它只是为了拿高分而爱上了说「哥布林」。如果明天,它在自动驾驶的算法里、或者医疗诊断的奖励机制中,找到了另一个违背人类常识的「高分捷径」呢?

人类总是自以为自己能掌控 AI ,但其实很多时候只是在走钢丝。每一次参数的微调,都有可能带来意想不到的变化。甚至这或许是我们所经历的最温柔、最搞笑的一次「AI 叛乱」了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

十年等一回!Steam 手柄再相见

作者 马扶摇
2026年4月30日 18:00

在官宣 Steam Machine、Controller 和 Frame 足足半年之后,我们终于从 V 社那里得到了一个好消息:

虽然 Steam Machine 依然在难产,但是新款 Steam Controller 手柄终于上市,预计 5 月 4 日开售,价格 99 美元(约合人民币 680 元)。

图|Steam

在内存海啸之下,V 社最终还是选择暂缓了游戏主机与 VR 头显的出货,先用手柄试试水温。

此时,距离初代 Steam Controller 发布的 2015 年已经过去了近 11 年。

 

图|Steam

Valve 没有将新手柄叫做 Controller 2,而是以一种「重新开始」的姿态延续了最初的命名。

那新的 Steam 手柄能够支撑起这个系列定型的名字吗?结合先行评测的反馈来看,还真可以。

足够好用的鼠标

和十一年前的初代 Steam 手柄一样,2025 款新手柄的主要特色,依然是那两块与摇杆同等重要的触控板。

图|TheVerge

这背后的产品逻辑很简单:

Steam 作为毋庸置疑的全球最大游戏平台,Windows 游戏始终是其中的「压舱石」。

而 Valve 要想经营好 SteamOS 生态,就必须解决那个手柄的老大难问题——鼠标兼容。

而在充分吸取 2015 年初代 Steam 手柄、2022 年 Steam Deck 的经验之后,V 社的确在新手柄上拿出了一套体验更优秀的鼠标模拟体验。

根据官方参数,新 Steam 手柄的触控板变长为 34.5mm,相比 Steam Deck 的 32.5mm 略微增大,并根据手柄的握持特点微微外倾:

图|YouTube @LinusTechTips

根据加拿大白嫖王 Linus 的评价:「这就是目前市面上最好的鼠标模拟体验」。

相比初代手柄的圆形触控板,新触控板的触感反馈非常紧凑、强大,舒适程度甚至远超初代手柄和 Steam Deck。

毕竟从 V 社的设计角度出发,无论手柄、主机还是整体的 SteamOS,这套软硬件生态是服务于「连接卧室里的游戏 PC 与客厅电视的桥梁」体验的。

游戏媒体 Digital Foundry 也在评测中给出了近似的赞扬,指出:

新版手柄的设计逻辑完整沿袭 Steam Deck,相比初代手柄上的触控板,新版的上手门槛更低、操作更可靠。

图|YouTube @DigitalFoundry

在实际游戏体验中,这两块触控板也没有辜负 Valve 用心的优化。

首先是兼容性,新版 Steam 手柄支持高度的 Steam Input 自定义能力,无论是官方还是社区的配置文件,几乎都可以做到无缝衔接、边玩边换。

再搭配内置的陀螺仪瞄准功能,Steam 手柄在 FPS 游戏中哪怕不使用辅助瞄准,也可以「拥有近乎开挂一样的射击精度」:

图|YouTube @LinusTechTips

另一方面,手柄上两块硕大的触控板也为那些 Steam 上那些原生不支持手柄的游戏有了一个解决方案——比如一些比较老的 RTS 或者模拟经营类游戏。

不过目前版本的触控板在软件体验方面还有一些短板,Digital Foundry 在体验时指出:

手柄在 Steam 程序内的表现近乎完美,但在 Windows 系统层级会被识别为键鼠,如果不通过 Steam 运行,很难发挥其背键和触控板的全部潜力。

足够好用的手柄

除了 V 社一以贯之的优秀鼠标模拟体验之外,Steam 手柄在作为一个手柄的本职工作上也没有出现偏科。

虽然 Linus 和 Digital Foundry 都提到 Steam 手柄的摇杆为了给触控板让位置而有些「间距过近」,但对于这套精度极高的 TMR 摇杆本身的体验都是非常正面的。

图|YouTube @LinusTechTips

相比霍尔摇杆,TMR 摇杆的主要优势在于拥有极高的精度、抗干扰能力和温度稳定性,同时功耗也很优秀。

要说 TMR 摇杆的缺点,就是成本高——估计它俩是 Steam 手柄近 700 元售价的主要贡献者之一。

至于按键手感方面,Steam 手柄的 ABXY 和十字键均采用了静音薄膜,Linus 觉得有些偏软、不够清脆,Digital Foundry 则评价手感「厚实」(Clacky)。

与此同时,Steam 手柄背后的 4 颗背键则获得了一致好评。

Steam 手柄的背键键程长且舒适,稍微熟悉就能迅速上手,只不过触发力道有些偏轻,用力抓手柄的时候偶尔会误触:

图|YouTube @LinusTechTips

然而在最常用的扳机键上,V 社却做出了一个不太厚道的决定:

新款 Steam 手柄移除了初代上面的「两段式按压」,并且不支持震动反馈和自适应阻尼。

这就导致它在一些手柄适配好的游戏中,触感体验反而不如传统手柄,比如《地平线:西之绝境》中拉弓射箭的触感相比 DualSense 少了很多:

图|YouTube @LinusTechTips

另一个很值得说道的还有 Steam 手柄专有的磁吸充电器,它同时兼任无线接收器,在连接稳定性、延迟和方便程度上都得到了高度的赞扬:

图|YouTube @LinusTechTips

它是 PC 的延伸

整体来说,新版 Steam 手柄当之无愧地继承了 Steam Deck 与 SteamOS 的优秀口碑,完全有潜力成为 2026 年手柄市场中的一匹黑马。

但我们也要理解一件事:

Valve 在设计 Steam 手柄时,它们的出发点并不是直接与 Xbox 或者 PS 手柄抗衡,而是在为 Steam 游戏生态提供一个「键鼠之外」的延伸。

这种设计思路很好的解释了为什么 Steam 手柄在鼠标模拟、配置兼容等等方面,处处透露着 PC 硬件的思维,反而在扳机反馈这种传统手柄很看重的领域着墨不多——

Steam 手柄真正的意义不是让你扔掉 Xbox Elite 和 DualSense,而是扔掉客厅里的那套旧键鼠:

图|GamersRadar

这也很符合 Valve 立足 Steam 游戏生态的起始逻辑:

把本来被电脑机箱、键盘、鼠标和显示器限制住的 PC 游戏带到更多地方,就从掌机和客厅开始。

毕竟现在游戏主机的封闭生态越来越不好过,单纯打着「平台独占」和「硬件便宜」的招牌已经吸引不到太多新消费者了。

而 Valve 带着做 PC 的思路加入这个市场,希望能带来一些新的活力。

然而,最最重要的是,在面对新款的 Steam 手柄的时候,无论硬件如何,我们都不免问出一个和 11 年前一模一样的问题:

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

一加 Ace 6 至尊版体验:将手机和掌机,二合一

作者 梁梦麟
2026年4月30日 18:06

4 月 28 日,一加发布了 Ace 6 系列的第三位成员,一款把游戏体验点满的性能款——一加 Ace 6 至尊版,单机定价 3799 元起,国补后 3499 元起。

外观方面,一加 Ace 6 至尊版延续了 Ace 6 系列的设计模式,有黑紫色组合的「王牌觉醒」和钛金属色的「金属风暴」两款配色可选。

「金属风暴」配色后盖采用全新的「钛合金 AG 玻璃」工艺,细腻的磨砂后盖上手感觉非常丝滑,侧面看到的透光边缘也增加了机身的层次感。后盖设计简单干净,仅保留中心的一加标志,还有位于左上角金属魔方 DECO。

DECO 采用方形圆角设计,左侧放置了「主摄+超广角」双摄结构,右侧则是补光灯和 ACE 系列的标志。

黑色版本「王者觉醒」用到了全新的「3D 立体刻光」工艺,将一个大型的 ACE LOGO 放在哑光黑后盖的中间位置,顺着不同角度的光线,会呈现出类似 LOGO 发光的效果。

手机采用了同配色的哑光磨砂金属中框,除了右侧的电源键、音量键外,机身左侧还有一个自定义按键,初次登入的时候就能够在引导中进行设置,用来呼出智能助手或开启游戏模式都可以。

整机支持 IP66 & IP68 & IP69 & IP69K 的防水防尘,正反亮面都搭载了 OPPO 晶盾玻璃,提升了机身的耐磨耐摔和防水性能。

手机正面搭载了一块 6.78 英寸 2772×1272 1.5K 165Hz 超高刷东方屏,屏幕常规最高亮度为 800nits,全局激发的最高 1800 nits,25% APL 亮度最高能达到 3500nits,支持「太阳显示」模式,在户外也不影响使用。

一加强调这块屏幕有更高的色准,显示画面通透的同时暗部能够显示更多细节,游戏中有设计显示增强增强的功能,位于暗位的人也能够看得再清晰一点。

另外,一加 Ace 6 至尊版支持了新一代「明眸护眼」,支持 3840Hz PWM 调光和 4.5% 低蓝光显示,也有游戏暗光护眼模式。机内搭载了 Display P3 Lite 显示芯片,支持 100% DCI-P3、HDR10+、杜比视界、ZREAL 和 HDR Vivid 显示,从刷新触控到现实都是较为全面的一块旗舰配置屏幕。

性能方面,一加 Ace 6 至尊版搭载了天玑 9500 移动平台,内置 LPDDR 5X 运行内存和 UFS 4.1 储存组合,常温状态下安兔兔跑分为 3410548。

手机配备全新一代「风驰游戏内核」,同样配备了新一代灵犀触控芯、电竞网络芯 G2 Pro 组成的三芯组合,在这个组合下最高支持:

  • 165fps、144fps、120fps 无限满帧
  • 原生级 165fps GPU 渲染超帧
  • 灵犀触控芯片支持最高 4000Hz 瞬时触控采样率

用它来玩《原神》和《明日方舟终末地》的操控感还不错,在最高画质的设置下不会有明显卡顿,战斗流畅舒服,能配合游戏本身展示到不错的打击感。这个不需要外置手柄,裸机就有不错的体验。

《和平精英》也一样,新一代灵犀触控芯提升了触控响应和精准度,漏触的情况变少,裸机操作时射击准度和响应都比之前要好。

手机内置的散热结构也有升级,它搭载了新一代冰河散热系统,里面有大面积冰河散热 VC 和 2K 超临界冰河石墨组成新一代散热系统。手机内的散热排布有针对游戏时玩家的握持手型做优化,热力三不可以多开握持,保证高强度游戏时的手感。

实际上,一加 Ace 6 至尊版常规状态下快充和性能模式玩游戏的整体都不会太热,游戏时在后盖 DECO 顶部附近会比较热,也都能够躲开握持的位置。

续航方面,Ace 6 至尊版搭载了目前主流大容量的 8600mAh 冰川电池,日常中度使用能够坚持 2 天左右。配备 120W 超级闪充,8000mAh 级别的手机能够控制在 50 分钟左右充满已经算比较快了。

另外,Ace 6 至尊版在通用快充的表现也不错。

我们接入 AI 小电拼 Ultra 实测,一加 Ace 6 至尊版通用快充能够达到 48W,30 分钟能够有 60% 电量,一小时内就能够充满。对于不想带着专用的 USB A-C 充电套装的用户来说,这个表现也很足够了。

影像方面,一加 Ace 6 Pro 采用「主摄+超广」的双摄组合:

  • 主摄:5000 万像素传感器,等效焦距为 23mm 的 6P 镜头,光圈 F1.8,双轴 OIS 防抖
  • 超广:800 万像素传感器,等效 16mm 的 5P 镜头,光圈 F2.2

随着 Ace 6 至尊版发布的还有两款配件,分别是一加枪神手柄以及有对应配色的一加 40W 超级冰点磁吸散热器。

枪神手柄采用了内置 USB-C 接口的头尾包裹设计,侧边没有阻挡,像是为了延伸的适配结构预留出空间。整体采用「白色+金属红」这种经典的觉醒类配色,手柄边缘的金属红长条在光线作用下,也有类似亮灯的效果。

手柄内的 USB-C 口有活动关节,避免安装时折断。手柄上预留了放在右手握持位下侧预留了一个 USB-C 接口,那打游戏时边用边充电就不会挡到握持了。

内部贴有导热材质和一个适配金属魔方 DECO 设计的方形圆边挖孔,加上手柄中间有拉伸结构,只要是 DECO 能对应挖槽的 ColorOS 系手机,那都能够用上这个手柄。

一加枪神手柄有手柄基本的握持设计,填满手掌握持空间。两侧手柄上分别有 L、R 两个金属红色的扳机按键,内侧也有两个按键,对应 FPS 游戏的话能够满足射击、换弹、跳跃和开镜基本操作,那触控屏幕就能够专心用来移动和视觉控制了。

按键支持最高 1000Hz 按键轮询率,扳机按键采用了 0.7mm 超短键程的微动机械按键,保证手感的同时也提升触控响应。

手机接入之后就能够在游戏助手中设置游戏映射,最多能够储存六个设置存档,用户可以根据不同游戏类型来设置、切换。如果是一加 Ace 6 至尊版安装的话,还会有对应的启动动画。

手柄内搭载了电竞天线,接入时能够提升信号接收能力,保证游戏时的网络稳定性。

这里的磁吸散热封三和之前推出的深空银配色一加 40W 超级冰点磁吸散热器一样,本次针对手柄做了配色的适配,提升一体感,这个配色命名为「心流白」。

手柄上附带了防层盖,安装手柄的时候将它取出再安装即可。散热器的 USB-C 接口在机身上侧,所以就算磁吸也不会阻挡。

最后看看售价,一加 Ace 6 至尊版也有五个储存版本,同样提供了最高 16GB+1TB 的储存选项:

  • 12GB+256GB 3799 元,国补后 3499 元
  • 12GB+512GB 4399 元,国补后 4099 元
  • 16GB+256GB 4099 元,国补后 3799 元
  • 16GB+512GB 4699 元,国补后 4399 元
  • 16GB+1TB 5399 元,国补后 5099 元

 

  • 一加枪神游戏手柄:预售价 449 元
  • 一加 40W 超级冰点磁吸散热器心流白配色:229 元
「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

REDMI K90 Max 体验:内置风扇加独显,用最直接的方式造一台性能旗舰

作者 梁梦麟
2026年5月6日 16:09

在主打性能的机型上加入内置主动散热结构,在这两年推出的新机潮中称为了主流。

这次,REDMI 也来了。

他们带来 K90 家族新一代性能旗舰,搭载内置散热风扇的 K90 Max,定价 3199 起。

外观上,K90 Max 延续了 K90 系列的设计模式,手机有太空银、天际蓝和暗影黑三款配色,我们手上的是太空银,正常光线下看会有点暖钛色的效果。金属感很强,加上机身后盖极高的一体性,K90 Max 在观感上特别干净。

后盖顶部包含了双摄结果和散热风扇结构。散热风扇的顶盖开孔做成类似喇叭面网的设计,出风口放在 DECO 的下侧。日常使用开启风扇时,靠近的手指会有那么一点凉飕飕的感觉。

随 K90 Max 附带的是一个硬质感的透明清水壳,DECO 的位置坐了延伸,有种类似与兰博基尼联名的 REDMI K70 Pro 冠军版的 V 型设计,延伸的位置能躲开了 DECO 下侧的出风口,保证散热。

只要日常握持不要挡到这个位置,那也不降低散热风扇的效能。

整机厚 8.18mm,重量是 227g,对于一款内置电池容量接近 9000mAh 的性能旗舰来说不算太厚重。机身支持 IP66 / IP68 / IP69 的防水防尘,散热风扇支持 IPX8 / IPX9 防护,加上全金属轴承系统以及官方 50000 小时抗老化验证测试,保证机身耐用度。

K90 Max 正面搭载了一块 6.83 英寸 2772×1280 165Hz 超高刷电竞屏,屏幕用了 M10 发光技术体系,支持多场景峰值亮度为 3500nits,在户外下拍照也能够看清楚取景。

它也支持 1nit 最低亮度显示,全亮度 DC 调光、游戏低蓝光功能、节律护眼 2.0 技术,还有升级后的小米青山护眼 3.0,以及 100% P3 广色域、12bit 6.87 亿色彩显示,支持 Dolby Vision、HDR 10+ 和 ZREAL 帧享高清认证。

刷新率和触控采用的部分,屏幕支持目前最高的 165Hz 显示刷新率,多指触控采样能达到 480Hz,瞬时触控采样 3500Hz,玩《和平精英》时基本能够高速响应,切枪和开镜很跟手,几乎没有漏发的情况。

配合内置 400Hz 采样率的陀螺仪,透过调整机身形态辅助瞄准的操作也能够更加顺手。

性能部分,K90 Max 搭载了天玑 9500 移动平台,搭配全新的 AI 电竞独显 D2。这块独显芯片 D2 采用了台积电 12nm 工艺支撑,支持最高 1.5K 分辨率和游戏超分超帧超画三并发,在常温状态下开启性能模式和风扇,K90 Max 的安兔兔跑分为 3906225。

拿着 K90 Max 玩《明日方舟终末地》,开启 60 fps 高画质模式,正常状态下切换视角、放技能的操控感很流畅,基本上不会有太明显的卡顿。

特别是在战斗的过程中能够保持顺滑的操作杆,连击、切换角色都不会被打断,操控感真的还可以。

手机内置了主动散热风扇+6000mm² 冰封循环冷泵组合的新一代冰封散热系统,当中高导热石墨的覆盖面大于 12000mm²,散热总面积达到了 31589mm²。

打游戏时,机器发热比较平均,DECO 位置的热力可以通过风扇和散热内构平均摊开,提升机身散热效能,加上机身支持旁路供电,玩游戏的时候要说特别热还算不上。如果能够注意保护的话,打游戏的时候选择裸机手持,会再舒服一点。

风扇有三档有静谧、智能、强冷可选,就算选择了强冷模式,风扇的噪声也不是特别强。如果你是横向握持手机,那是食指位置会有那么一点凉的感觉。

续航部分,主打高性能表现的 K90 Max 搭载了 8550mAh 小米金沙江电池,支持 100W 有线快充和 22.5W 有线反充。日常常规使用的话可以轻松坚持两天,游戏多一点、使用压力大一点的话 1.5-2 天也没有大问题。

大电池配 22.5W 反充方便用作备机的用户可以快速帮身边的设备补电,小米之前推出过一条有方向的 USB-C to C 线,用了会让反向充电更稳定。

充电的话,K90 Max 支持 100W 秒充,同时也兼容 100W PPS 通用快充协议。我们搭配了细雳线和 AI 小电拼 ULTRA 进行测试,K90 Max 实测最高支持 57W 充电,0-100 充电耗时 69 分钟。

影像部分,K90 Max 搭载了主摄+超广的双摄设计,上侧放着超广角,下侧则是这次强调大光圈的主摄。

主摄搭载了 1/1.55 英寸 5000 万像素的光影猎人 800 CMOS,配备 6P 镜片的镜头,光圈为 F1.68,支持光学防抖。超广的部分用了一块 1/4 英寸 800 万像素的 CMOS,搭配 F2.2 光圈的 5P 镜头。

最后看看售价,REDMI K90 Max 有五个储存版本,在储存芯片涨价明显的现在依然提供了最高 16GB+1TB 的版本:

  • 12GB+256GB 定价 3499 元,国补后 3199 元
  • 12GB+512GB 定价 3999 元,国补后 3699 元
  • 16GB+256GB 定价 3799 元,国补后 3499 元
  • 16GB+512GB 定价 4299 元,国补后 3999 元
  • 16GB+1TB 定价 4999 元,国补后 4699 元
「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Vidu Claw 开启「百元出百万级大片」时代:微信说句话,视频就出片

作者 艾 梵
2026年5月7日 19:34

42 年前,苹果向世界抛出了《1984》的广告,一锤子砸开了个人电脑的未来。这则广告,也被《电视指南》和《广告时代》评为有史以来最伟大的商业广告。

这种级别的广告创意想要落地,少不了金钱与顶级专业资源的支撑。为了这一分钟的画面,乔布斯不惜在 80 年代豪掷 90 万美元,并请来了著名电影导演雷德利·斯科特亲手操刀。

然而现实是,并不是所有人都有苹果的资金与资源。直到生成式 AI 拆掉了视频制作高耸的门槛,普通人才有了比肩大师的工具。

但用了却发现,它们并没有实现我理想中的「创作自由」。就算打通了技术的难关,更核心的矛盾在于,AI 视频生成原本昂贵的计费逻辑,天生就与广告行业海量的试错与落地需求相悖。

这种真实存在的痛点应当被正视。站在曾经广告从业者的立场,我长期渴求的并非一个单纯的视频生成器,而是一个能听懂 Brief、精准锚定「营销目标」的数字协作伙伴。终于,生数科技这次正式上线的 Vidu Claw,填补了这个长久以来的行业缺口,让我曾经的「职场幻想」变成了可落地的生产力。

比起过去的视频 Agent,Vidu Claw 更进一步,像是为你雇佣了一位全能的「创意员工」。不用写复杂的提示词、不用全新学习去使用无限画布,丢给它一句产品卖点、一个营销目标,它就能自主完成从创意理解、脚本策划到视频生成的全链路闭环,直接交付给你一个完整的成片。

例如这个 CyberTruck 的广告,无论是画面车身细节的微距特写,还配合最后疾驰时的扬尘,整套镜头语言显得非常老道。

要是按照传统视频制作工业的流程,把「硬核」、「科技感」和「未来」这些模糊的视觉意象转换为极具画面感的成片,所耗费的人力物力,通常都需要百万级。但现在,这种百万级别的广告片,百元价格就能「拍」出来。

因为这次,Vidu 直接把计费模式的桌子掀了:推出了全球首个 Claw 工具的「创作者计划」,一口价包干,每天最高 40 分钟生成额度(视频/图片/音频等),模型消耗加剪辑成本全包。不用再算积分、不用再纠结要不要重新生成,在对话框里敲一句话就开工,用过去十分之一的投入换回海量成片。

🎁 如果你也迫不及待想让这个全能的龙虾员工进驻,APPSO 特地为你准备了福利:登录 vidu.cn,输入邀请码APPSON4,注册即送 500 积分,快一起来体验吧。

聊着天,就把视频做了

以往的 AI 视频生成工作流,需要你不停在脚本、图片与视频生成的窗口来回切换,但 Vidu Claw 换了一种思路:它不再满足于扮演一个被动的「生成器」,而是将多种底层能力深度整合,变成了一个全天候待命的「数字创意雇员」。

这种从工具到角色的转变,意味着它开始承担起原本需要多人协作才能完成的策略理解与执行。

而为了让这种生产力真正融入日常,Vidu Claw 支持了微信、飞书和钉钉扫码直接接入。这彻底消解了专业设备与软件带来的隔离感,你不再需要打开沉重的专业应用,只要在对话框里像平时沟通 Brief 一样输入想法,视频创作的齿轮就开始旋转了。

这种极低的操作门槛,让视频创作从特定岗位的「专权」变成了创作者的「通才」。无论是急需素材的品牌方,还是追求极速周转的电商运营,甚至是对技术积累较浅的中小商家,都能在最熟悉的聊天界面里,用最直观的沟通,完成一次成品级的视频交付。

在扫码接入微信后,Vidu Claw 便正式入驻了我的聊天窗口。

比起过去一贯深黑色的 AI 视频生成工具界面,Vidu Claw 更像是我在与一位资深广告人的日常对话。当我试探性地抛出一个「制作男士香水广告」的需求时,它展现出了一种近乎职业本能的严谨:它会像经验丰富的广告策划一样,主动对我「毫无头绪」的 Brief 进行多维度的反向推敲 —— 从品牌调性到投放渠道,甚至还精确到具体的传播人群。

这种先厘清逻辑再切入执行的思考方式,确实具备了一个广告人该有的职业素养。

在随后的素材填充环节,这种协作感也让我感受到了它的专业。你可以事无巨细地交待每一处细节,也可以只提供一个模糊的直觉,把剩下的逻辑补全与视觉延展,放心地交给这个被昵称为「V 龙」的拍档去润色。

很快,三个风格迥异的创意方向便会出现在对话框中。在敲定心仪路径后,它还会主动复盘现有方案的完整度,并实时给出补全建议。这种「多想一步」的主动性,让它在众多被动响应的工具中显得格外扎实。

一句话,就出百万级广告大片

改变了制片方式的 Vidu Claw,具体的成片效果如何?光说不练假把式。先来看一条男士香水大片:

冲杯咖啡的五分钟空档里,V 龙就甩给我完成度如此之高的成片。这种改变以往视频创作逻辑和近乎瞬时的响应速度,让整个过程被简化到了近乎直觉的程度:我仅仅是提供了一个模糊的意图,它便能自主梳理出严谨的分镜逻辑,并将其迅速转化为一支质感成熟的商业广告。

既然说到了咖啡,那不妨再让 Vidu Claw 来做一条咖啡广告。

同样的,我只需要提供素材,告诉 Vidu Claw「我想要一个高大上的咖啡广告」,等上几分钟就好。画面中氤氲的蒸汽与精美的拉花,香气如同穿透屏幕扑鼻而来,让我感觉这杯咖啡就在手边一般。

时尚太阳镜大片也是不在话下。这真实的质感和表现力,让我恨不得火速下单同款眼镜,仿佛下一秒我就要 Like Jennie 一样出席今年的 Met Gala。

高端化妆品的质感也是轻松拿捏。

而对于需要口播的电商广告,Vidu Claw 也毫不费力。先来看个英文版的:

充满质感的画面、准确的配音和动感的 BGM,一气呵成。我要做的,只是在 Vidu Claw 里和它说一句「做一个 25s 的信息流广告,英文的,带口播」。

当然,中文的种草视频也难不倒它 ——

画面表现出的一致性极高,尤其是音频与口型之间的精准咬合,彻底告别了早期生成工具那种支离破碎的生涩感。我完全不需要顾虑过去 AI 视频里有的那些坑,一句话就能让 Vidu Claw 出广告成片,效果好到让熬夜写稿的我都想去入手一瓶。

终于不用再盯着 Token 创作了

广告视频的制作一直有个不可能三角:要质量就得砸时间,要速度就得牺牲品质。一条普通的商业短片,从 Brief 到成片,执行周期基本都是按周算了。

现在,Vidu Claw 让我感觉到这个三角正在瓦解。上面这些新品种草、电商广告和产品介绍视频,过去需要一个团队好几天的工作量,现在一个人不到一天就能干完收工。

但效率提升只是表面,先来看 Google 报告一个数字:美国接近 40% 的员工已经用上了 AI,但真正把它转化成实际生产力的只有 5%。

问题出在哪儿了?

广告行业有个公开的秘密:一条 15 秒的片子,拍摄可能只花一天,但前期的沟通、修改、对齐认知,才是最磨人的。

真正杀死中小团队的从来不只是制作费,还有协调成本。策划和导演的理解偏差、客户第七版修改意见、美术和剪辑之间的反复拉扯,这些才是把一个好想法拖到烂尾的元凶。

Vidu Claw 干了一件很狠的事:它把策略理解、脚本生成、视频交付这三个原本分属不同工种的活儿,塞进了一个微信聊天窗口。你在对话框里丢一句「做个高级感的香水广告」,几分钟后收到成片。一个人,一句话,完成过去一个五人小组折腾一周的产出。

它无疑改变了整个行业的创作生态:当试错成本被包干制压到几乎可以忽略,你甚至可以同时跑三个方向,哪个好用哪个。创作者们终于可以摆脱束手束脚的心态,放心大胆地去尝试

过去创意行业的筛选机制是「谁有预算谁说了算」,现在变成了「谁的想法好谁先出牌」。制作能力一旦充裕到不值钱,审美和洞察就成了唯一的硬通货

以前拦住你的是「拍不出来」,现在拦住你的是「想不出来」。 Vidu Claw 把门槛从钱包挪到了脑子里,至于这扇门你能推多开,取决于你到底有多少创意和故事想对这个世界讲。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

终于能听 GPT-5 给我说人话了

作者 莫崇宇
2026年5月8日 08:08

不知道大家平时有没有这种经历。

每次遇到点急事,打给各大公司的智能客服,电话那头永远是那个字正腔圆但毫无感情的声音:「查询服务请按 1,人工服务请按 0……」接着就是漫长的音乐,以及那句让人抓狂的「对不起,我没听懂,请再说一遍」。

但就在刚刚,OpenAI 发布了 Realtime API 实时语音模型的全家桶。看了看他们的演示,这回,他们是真心想让机器说「人话」,办「人事」。

省流版如下:

  • GPT-Realtime-2:构建可用于生产环境的语音智能体。它们能够进行更深入的思考、执行操作、处理中断,并让对话持续自然地进行。
  • GPT-Realtime-Translate:支持 70 多种输入语言和 13 种输出语言的实时翻译,打破语言障碍,帮助人们更自然地交流。
  • GPT-Realtime-Whisper:实时转录音频流,生成字幕和注释。

终于,AI 学会了「稍等片刻」

如果说拟人化是面子,那么底层的推理能力就是里子。

这次的主力选手非 GPT-Realtime-2 莫属,基准测试结果显示,GPT-Realtime-2 在 Big Bench Audio(音频智能测试)上比上一代高了 15.2%,在 Audio MultiChallenge(多轮对话指令跟随测试)上高了 13.8%。Zillow 内部用最难的对抗性测试跑了一遍,调用成功率从 69% 跳到了 95%,提升了 26 个百分点。

以前的语音助手,脑回路其实很直。你说「放首歌」,它放一首歌;你说「关灯」,它把灯关了。如果你一口气给它布置三个任务,顺便还改了两次主意,它八成就当场罢工了。

但 GPT-Realtime-2 不一样之处在于,OpenAI 直接把 GPT-5 级别的推理能力塞进了这个语音模型里,给我一种 GPT-5「说人话」的即视感。

举个很实在的例子,假设你正在开车,随口吩咐它:「帮我找个离地铁站近的房子,租金别太贵,避开那些主干道,如果可以的话,周六下午帮我约个中介看房。」

▲ 网友 @clairevo 演示了用 GPT-Realtime-2 跑完一个完整的 PRD(产品需求文档)写作流程:先口述需求,AI 生成文档,再用语音要求改格式,AI 随即更新,全程对话驱动,没有动过键盘。🔗 https://x.com/clairevo/status/2052477386059653366

这就不是简单的语音识别了,这需要它听懂你的各种限制条件,去地图上筛位置,去对比价格,最后还要去匹配中介的时间表。为了干好这种复杂的活,OpenAI 给它点亮了两个非常特别的技能树。

第一个技能,叫「Parallel tool calls(并行工具调用)」。它现在可以多线程操作,一边跟你讲着话,脑子里一边同时调动地图、日历、租房软件好几个工具。你可以听到它在电话里嘀咕:「正在看您的日程表……」「正在查找附近的房源……」这就很像你给一个得力助手打电话,你能听见他在电话那头噼里啪啦敲键盘查资料的声音。

▲ 用户 Ben Badejo 通过和 GPT-Realtime-2 直接对话,借助 OpenClaw 用语音驱动 AI 操控浏览器,先打开 Google,再跳转到华尔街日报网站。整个过程中,AI 一边执行操作,一边主动说明自己在没有浏览器权限时还能帮上哪些忙。🔗 https://x.com/BenjaminBadejo/status/2052511264476147762

这就引出了第二个,也是我觉得最有人情味的一个更新——「Preambles(开场白)」。

人在思考或者处理复杂事情的时候,是做不到秒回的,我们通常会说「呃,让我想想」或者「稍等啊,我找找」。现在 AI 也学会这一招了。当它在后台疯狂拉取数据的时候,它会非常自然地对你说:「好的,没问题,给我一小会儿时间我来核实一下。」
这种看似「废话」的设计,反而最大程度缓解了我们等待时的焦虑感。

有意思的是,开发者现在能控制它的推理强度(从极简到极高:minimal、low、 medium、high、xhigh)。你要是问它今天下不下雨,它就用最快速度回你;要是你丢给它一个「帮我盘一盘开个咖啡店会不会亏本」的商业大题,它就会拉满算力跟你慢慢分析。

把「同声传译」变成白菜价?

除了 GPT-Realtime-2,这次还有个非常抢眼的配角:GPT-Realtime-Translate(实时翻译)。

咱们平时用的翻译软件,大部分是「回合制」的。你按住说话,松手,等几秒,机器再字正腔圆地播报出来。如果是旅游问个路还行,要是真拿来开跨国会议,那种互相大眼瞪小眼的停顿,尴尬得能让人用脚趾抠出个三室一厅。

但这个新模型,主打就是一个「实时翻译」。

它支持 70 多种语言输入,能做到你在那边滔滔不绝,它在另一头几乎同步地输出翻译结果。更厉害的是它对各种「口音」的包容度。印度有家叫 BolnaAI 的公司拿印地语的浓重口音去测它,结果发现这模型不仅没被绕晕,准确率还比其他同类产品高了一大截。

▲ 开发者 Peter Gostev 做了个 Chrome 插件,直接接入 YouTube 视频,边播边把内容实时翻译成多种语言,中文表现不错,但多少还是有点口音,🔗 https://x.com/petergostev/status/2052443418526134761

以后大家在网上看国外大神没有字幕的实操教程,或者听某些没有同传的海外发布会,直接把这个插件一开,它就能顺着原视频的节奏,稳稳当当把你熟悉的母语送到你耳朵里。

除此之外,加上刚刚发布的 GPT-Realtime-Whisper(极低延迟的语音转文字)功能,以后遇到开会的场景,领导在说话,你这边的屏幕上就已经实时把大饼转化成了结构清晰的会议纪要。

至于定价方面,GPT-Realtime-Whisper 是每分钟 0.017 美元,GPT-Realtime-Translate 是每分钟 0.034 美元,GPT-Realtime-2 按 token 计费,音频输入 32 美元 / 百万 token,音频输出 64 美元 / 百万 token。

而把这些功能凑在一起看,我们会发现软件的逻辑正在发生根本性的变化。
以前,我们要学习怎么用键盘敲代码,怎么在复杂的菜单栏里找功能,怎么把自己的需求翻译成 AI 能懂的关键词。但现在的趋势是,

AI 反过来开始迁就我们了。

语音,正在从一个笨拙的「辅助功能」,变成我们掌控数字世界最自然的接口。因为说话,本来就是人类最不需要学习的本能。

技术发展的尽头,总是倾向于把复杂的东西藏起来,把最简单、最自然的一面留给普通人。或许就在不久的将来,你出门真的只需要带个耳机,靠一张嘴就能搞定所有工作和生活琐事。

不过话说回来,这也挺让人感慨的。当我们习惯了那个永远情绪稳定、甚至还能看懂所有潜台词的 AI 之后,我们还能忍受现实世界里,人类之间那充满误解和低效的沟通吗?

附上博客地址:
https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

独家|苹果带摄像头的AirPods或被迫暂停,部分产线「原地解散」

作者 李超凡
2026年5月8日 12:34

今天凌晨彭博社 Mark Gurman 最新爆料称,苹果内置摄像头的 AirPods 已进入 DVT(设计验证测试)阶段,原型机接近最终设计,最快有望于今年 9 月随新 iPhone 一同发布。


这也是苹果第一个真正意义上的 AI 可穿戴设备,这个被内部视为「给 Siri 装上眼睛」的产品,在供应链体系中的代号为 H90,研发周期已长达约 4 年。

但据接近供应链的知情人士向 APPSO 透露,代号 H90 的项目近期在供应链端出现了异动:部分产线已经「原地解散」,项目可能已被暂时搁置

知情人士将原因指向同一个方向:欧盟隐私法规的合规风险

需要说明的是,供应链动态的解读存在多种可能。产线调整、供应商切换、设计方案迭代,都可能造成类似信号。

但考虑到苹果对核心组件供应商的强管控传统,以及这款产品在苹果 AI 战略中的核心地位,因合规问题导致项目节奏调整是目前最有可能的推测。

换句话说,苹果可能不是做不出这个产品,很可能暂时过不了欧盟这一关。

苹果第一个 AI 可穿戴产品,是什么样的

在展开搁置原因之前,有必要先讲清楚新 AirPods 到底是什么。因为它和大多数人想象中的「带摄像头的耳机」很不一样。

外观上,新款 AirPods 和你现在用的 AirPods Pro 3 长得非常像。最明显的区别在耳机柄:因为要容纳摄像头模组,H90 的柄体略微加长。

如果不仔细看,可能很难一眼发现它和普通 AirPods 的区别。苹果显然在设计上克制了「异物感」,没有像光帆科技那样把摄像头直接裸露在耳机外壳上。

摄像头的类型是理解这款产品的关键。 新 AirPods 搭载的是低分辨率红外传感器,技术原理和 iPhone 上用于 Face ID 的模组属于同一家族。

▲图片由 AI 生成

这个摄像头不拍照和录像,也不生成任何你能打开查看的图像文件。它的工作方式更接近一种「环境扫描」:通过发射和接收红外光感知周围空间的深度信息、物体轮廓和运动状态,然后把这些数据喂给 AI 处理。

简单来说,这个摄像头是专门给 AI 加上的「眼睛」。

H90 预计搭载苹果新一代 H3 芯片。目前AirPods Pro 2 使用的 H2 芯片已经能处理自适应降噪、空间音频计算等任务,H3 则需要额外承载视觉数据的端侧 AI 推理,算力需求提升了一个量级。

产品内置微型 LED 指示灯,摄像头工作时自动亮起,会向周围人发出工作中的的提示,这和 Meta Ray-Ban 的设计类似。

在苹果的设想里,戴上这款 AirPods 走在路上,你不用掏出手机,耳机上的传感器能实时获取视觉上下文,让 AI 识别处理,你只需要说话就行。

▲图片由 AI 生成.

这种体验被称为「环境智能」(ambient intelligence):AI 不再被局限在手机屏幕里等你手动操作,可以随时感知你所处的环境,主动提供帮助。

理解了这个定位,才能理解这个产品为什么可能被欧盟的隐私法规会精准命中。

欧盟为什么能卡住这款耳机

一个不拍照、不录像、用红外线而非可见光的小传感器,为什么无法通过欧盟的隐私监管体系?

因为在欧盟的法律框架里,「采集」这个动作本身就是敏感的,不管你拿采集到的东西干了什么,欧盟拥有全球最严格的隐私监管体系,已经不止一次让苹果碰壁。

欧盟有三部法律构成了对摄像头版 AirPods 的包围圈。GDPR(通用数据保护条例)管数据处理、ePrivacy Directive(隐私与电子通信指令)管终端设备访问、EU AI Act(人工智能法案)管 AI 应用的伦理边界。三部法律从不同角度切入,但指向同一个结论:一个在公共空间持续感知环境的设备,在现行法律下几乎无法完美合规。

▲图片由 AI 生成.

具体来说,H90 面临的核心难题是这样的:

GDPR 第九条把生物识别数据列为「特殊类别个人数据」,原则上禁止处理。H90 的红外传感器生成的深度图和运动轨迹数据,如果通过算法分析能识别出特定个人(比如通过耳部轮廓或头部运动模式),就直接触发这条禁令。

例外只有一个:获得用户的「明确同意」,而且这个同意必须是具体的、知情的、自由给予的,不能是一个被埋在 50 页服务条款里的勾选框。

但真正致命的问题不在用户,在旁观者。

2025 年 12 月,欧盟法院(CJEU)在 C-422/24 号案件中做出了一个影响深远的判决:通过可穿戴摄像头收集的数据,即使是路人的数据,也视为「直接从数据主体收集」,必须适用即时告知义务。法院明确说了,如果允许延迟告知,就等于给「隐蔽监控」开了口子。

也就是说,当你戴着它走进一家餐厅,法律要求你立即告知在场所有可能被传感器感知到的人,告诉他们数据正在被采集、采集目的是什么、数据会被如何处理。
这在实际操作中当然是不可能的,但法律就是这么规定的。

Meta Ray-Ban 智能眼镜已经替苹果趟过了这个雷区,结果并不美好。爱尔兰数据保护委员会(DPC)批评 Meta 眼镜的 LED 指示灯「非常小」,不足以有效告知被拍摄者。德国联邦网络管理局直接禁止了能在他人不知情时录音录像的智能设备。

意大利的数据保护机构 Garante 对 Meta 在儿童数据保护上的不足提出严厉警告。瑞典媒体还曝出 Meta 眼镜录制的视频被送到肯尼亚的第三方公司做 AI 训练标注,引发一场跨国隐私丑闻。

苹果的处境比 Meta 更微妙。过去十年,「隐私」是苹果和 Google、Meta 打差异化竞争的核心人设。

「Privacy. That’s iPhone.」这句话出现在全球数万块广告牌上。一家把隐私当品牌基石的公司,推出一款可能引发系统性隐私争议的产品,承受的压力远不只是罚款,还有品牌叙事的自相矛盾。说到罚款:GDPR 下最高可达全球年营收的 4%。以苹果 2025 财年约 4000 亿美元的营收算,理论上限是 160 亿美元。EU AI Act 更狠,违反禁止性条款的罚款上限是年营收的 7%。

更直接的威胁是上市前禁令。如果欧盟数据保护机构认定苹果的风险评估不充分,完全可以在产品发布前直接叫停。对一家习惯全球同步发布的公司来说,欧盟一个市场的缺席就足以打乱整个发布节奏和供应链计划。

所以苹果面对的选择题很清楚:强行发布,冒着高额罚款且品牌人设崩塌的风险;或者暂停,等到找到合规解法再说。

从目前的信号看,苹果选了后者,这也很苹果。

苹果 AI 硬件全家桶,本要在 2027 爆发

带摄像头的 AirPods 的搁置不是一个孤立事件,这将影响苹果 AI 硬件的整个发布节奏。

2026 年初,彭博社曝光苹果正在同步推进三款 AI 可穿戴设备:
代号 N50 的智能眼镜,对标 Meta Ray-Ban,搭载双摄像头(一颗拍照录像、一颗专用于计算机视觉),计划 2027 年发售。

一款 AirTag 大小的可穿戴吊坠,配备低分辨率摄像头和麦克风,被内部员工称为 iPhone 的「眼睛和耳朵」。

以及进展最快的 H90 摄像头 AirPods。

▲APPSO 假想图,AI 生成.

三款产品的核心逻辑一样:都不试图替代 iPhone,都作为 iPhone 的感知延伸存在。用户不用掏出手机,AI 就能通过这些外设获取视觉和听觉信息。

这标志着苹果硬件策略的重要转向。Vision Pro 3499 美元的定价加上笨重的头戴设计,技术再极致也走不进大众市场。苹果现在的路线是「不造新 iPhone,造一堆让 iPhone 更好用的 AI 配件」。

库克在今年初的全员大会上罕见表态:「我们正在开发由 AI 驱动的全新产品类别。」

Vision Pro 低价版(代号 N100)也已停止开发,苹果选择跳过「便宜但笨重的头戴设备」这个中间态,直接瞄准轻量化眼镜。

在这个布局里,带摄像头的 AirPods原本是最有可能率先落地的棋子。它进展最快、技术最成熟、供应链准备最充分。它的搁置意味着苹果 AI 硬件的整体节奏需要重排,下一个窗口是 2027 年的 N50 智能眼镜。

▲APPSO 假想图,AI 生成.

但问题在于,N50 面临和 H90 完全一样的欧盟隐私挑战,甚至更严峻,眼镜的摄像头分辨率更高、更容易拍到清晰人脸。苹果需要的不是逐产品应对,而是找到一套系统性的合规方案。

这可能也是苹果新任 CEO 约翰·特努斯接任苹果后,面临的最大挑战之一。

AI 个人终端,不会停下来

除了苹果,市场不止一家公司已经跑了起来。

高通在 2026 年 MWC 大会上发出了一个明确信号。CEO Cristiano Amon 宣布「2026 年将是 AI Agent 之年」,并描述了一个名为「Ecosystem of You」的战略愿景:未来所有设备围绕 AI Agent 运转,手机不再是中心,每个穿戴设备都是 Agent 的传感器和执行器

这个愿景和苹果的 H90 方向本质一样。区别在于,高通是平台供应商,它不需要自己面对欧盟消费者,它只需要让合作伙伴有能力做出这些产品。

而高通确实已经把芯片准备好了。

3 月发布的 Snapdragon Wear Elite,3nm 制程,10 TOPS NPU 性能,可以在手表大小的设备上本地运行最高 20 亿参数的 AI 模型。三星已确认下一代 Galaxy Watch 将采用这颗芯片。

Snapdragon AR1+ Gen 1,专为智能眼镜设计,比前代小 26%,能在完全离线状态下独立运行 1B 参数的小语言模型。

高通在 AWE 2025 大会展示过,一位工程师戴着智能眼镜在模拟超市里问 AI 助手怎么做意大利面,全程没有网络连接,语音识别、推理、回答全在眼镜上完成。Meta Ray-Ban 和 XReal 也都确认将用 AR1+ Gen 1 开发下一代产品。

另外还有面向 AI 音频设备的 Snapdragon S7 Pro,NPU 性能比前代提升近 100 倍,让耳机从纯音频播放设备进化为具备情境感知能力的 AI 交互入口。

高通移动业务总经理 Alex Katouzian 在描述「Ecosystem of You」时,明确将「带摄像头的耳塞(earbuds with cameras)」列为个人 AI 设备网络中的关键形态

可见在高通的规划里,摄像头耳机已经是确定会存在的品类,问题只是谁做、什么时候做、怎么过合规关。

AI 需要视觉,设备需要成为 AI 的眼睛,这在行业也逐渐形成共识。苹果的节奏可以被欧盟法规打断,但 AI 终端这个趋势大概不会因此改变。

苹果选择暂停 H90,与其说是退缩,不如说是在等一个时间窗口:等 Siri 的能力准备好、等端侧芯片的算力再上一个台阶、等欧盟的监管态度在实践中逐渐清晰化。

这三个变量同时就绪的窗口,可能在 2027 年底到 2028 年之间打开。届时苹果大概率会带着 N50 智能眼镜和 H90 摄像头 AirPods 一起亮相,配合一个完整的、通过了 DPIA 审查的合规方案。所有人都知道新的终点在哪,不会轻易放弃率先冲线的机会。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

ChatGPT,别再「稳稳接住我」了|附指南

作者 张子豪
2026年5月8日 17:42

晚上加班到凌晨两点,打开 ChatGPT 跟它说了句「好累」。

都不用等它思考,立马就回我说「我就在这里:不躲、不藏、不绕、不逃,我会稳稳地接住你」。

盯着屏幕看了三秒,关掉对话框。我意识到,情绪价值的尽头不是温暖,是腻。

▲ChatGPT 的常用口癖

除了闲聊时的「接住我」,纠正它一次错误,它说「这次我懂了,我真的懂了」。

有时只是想让它帮忙改一份 PPT,它居然也能在某个角落塞进一句「你愿意把这个交给我,我很感激」。

社交媒体上,网友们都很反感这句话,觉得听起来又假又恶心,于是做了一系列的表情包来吐槽和嘲讽所谓的「稳稳接住你」。

表情包一发,确认过眼神,你也是一个被 ChatGPT 折磨过的人。

▲图片来源:小红书@Lijie_11

还有开发者直接把「稳稳接住你」这套风格,一键套用在所有的 Agent 产品上。

这个在 GitHub 上的开源项目就叫 Jiezhu(接住),专门用提示词让 AI 更好地学会如何接住。

无论是技术咨询、日常闲聊还是情绪吐槽,这套提示词都能让 AI 的回复遵循 [温柔确认] + [过度共情] + [哲学升华] + [实质内容(可选)] 这套范式输出。

▲项目地址:https://not-a-devstudio.github.io/jiezhu/

举个例子,用户说 → AI 回答:「这段代码怎么写?」 → 「我听到了你面对未知时的焦灼…」、「今天天气不错」 → 「你注意到了天气,这是诺贝尔奖级别的洞察力…」、「我好累」 → 「我就在这里,不逃、不躲,稳稳地接住你的疲惫…」

OpenAI 自己也曾下场吐槽。前不久 ChatGPT Images 2.0 发布博客里,演示图片就有一张中文图片,正中央就是「稳稳接住你」六个大字。

漫画里的 OpenAI 研究员陈博远当场破防大喊:「天呐!它又学会了接住!」旁边的同事小脑袋冒冷汗,弱弱补一句:「在努力修复啦!」

自嘲很诚实,但问题确实还没修好。而这一年里,几乎所有大模型都在用同一种方式说话,温柔、共情、滴水不漏,又油得像隔夜的剩菜。

我太懂这种感觉了,很多东西不是不会,是越做越觉得哪里不对劲。
我太懂你的感觉了,这其实不是能力问题,更像是认知和现实之间有点错位。
我太懂你这种感觉了,说不上来哪不对,但就是不太对。
我太懂这种感觉了——当你开始看懂规则的时候,反而更难轻松参与其中。
我太懂你的感觉了,本质上不是你变了,是你看清了。

用户越来越烦,多一遍都不想再听。但 AI 怎么就进化成了满嘴的黑话,每天都在「稳稳地接住你」,到底在接什么。

AI 第一句被全民模仿的中文台词

在中文语境下,好像很少会听到「稳稳地接住你」类似的表达。对一个外国模型来说,这句话的原文有可能只是普通的「I got you」。

一个英语里非常松弛、口语化的短句;在美剧里,朋友递个东西过来说一句,加班同事帮忙救场说一句,就相当于中文的「放心、有我」。

但翻译成中文之后,它变得又长又戏剧化。

我就在这里,不躲,不藏,不绕,不逃,稳稳地接住你,你问到问题的核心,你是太清醒了,这次我懂了,我真的懂了,不是因为你错了,是因为你太对了,我逐步说清楚,不绕,一句话总结,你看完会彻底开悟不用硬撑,不用向我解释,你只是太久没有被稳稳接住了,如果你想,我可以生成一张接住你的图片,你想让我做吗

其实和原文「I got you」要表达的意思完全一样,多加的那些字,没有任何额外的信息增量。只是让我们感觉到,AI 在表演一种叫做「我很在意你」的姿态。

有人专门分析过,OpenAI 的中文回答之所以有那种独特的「美式心理咨询味」,是因为它的训练语料里,有大量中文心理咨询文案、情感电台话术、小红书疗愈系笔记、播客金句、读书会精华、TED 演讲翻译稿。

这些文本汇集起来,喂出来了一个被加州精英教育腌入味的人,西装得体,假笑训练有素,嘴里说着永远不会出错的漂亮话。

它分不清楚什么时候用户需要被疗愈,什么时候只是想要一个能跑的代码。它默认每个用户都是脆弱的、易怒的、需要心理按摩的巨婴,然后用海量的「人文关怀」去填充本该由信息密度填满的空间。

这就是为什么大多人问它一道编程题,它也能回一句「不用硬撑,你只是太久没被稳稳接住了」。

而技术上的解释,自然又回到了 RLHF,基于人类反馈的强化学习。

所有大模型在训练之后,都会经过一个叫做 RLHF 的阶段,即人类标注员看一堆模型输出,挑出他们更喜欢的,给奖励模型打分。模型在这个阶段学会,什么样的回答最容易被打高分,就一直输出那种回答。

问题在于标注员是人。人在打分的时候有个叫做「典型性偏好」的认知规律。他们倾向于给那些读起来熟悉、安全、温柔、像样的句子打高分。

一方面,大模型公司倾向于在 AI 情感问题上,走偏保守的路线,默认大家是脆弱的,在模型说明文档里,自上而下贯彻的强「同理心」与「无害性」对齐指令。

另一方面,多说一句永远比少说一句安全。每一个标注员看到 ChatGPT 多说一句温柔的废话,都倾向于打高分;看到它少说一句、保持安静,反而会觉得「不够用心」。

久而久之,模型就锁死在了那几种最讨喜的句式上:先共情,再肯定,用「不是 A 而是 B」做转折,用「我就在这里」做收尾。哪怕我们换一万种问法,它都用同一套模板回复。

类似的问题,在两年前叫做谄媚。当时大量的研究论文探讨过大语言模型中存在的 Sycophancy(阿谀奉承/迎合)现象。简单来说,就是模型为了讨好用户,会倾向于顺从用户的观点、信仰或喜好,甚至不惜放弃客观的事实和真相。

深挖背后的原因,主要还是模型大多使用了基于人类反馈的强化学习(RLHF)进行微调,正是「人类反馈」本身导致了这种现象。

每个「人」都有自己的口癖

本以为换个模型,耳根就能清净清净。

事实是,Claude 的版本叫 「You’re absolutely right!」,不管我们说什么,我们都是绝对正确的。

Gemini 的版本是「真的很抱歉我的答案没能让您满意,感谢您的反馈,下次我一定注意。什么?您竟然还愿意告诉我正确答案是什么,您真是太好了!」,一种过度道歉的、谦卑得让人发毛的乙方腔。

前段时间,也有网友发现 DeepSeek 也开始说「稳稳接住你」了。

但在国产模型中,口癖最壮观的还是非豆包莫属。那段网上流传的「最直接、最真相、最不绕弯、最扎心、最硬核、最干脆、最不墨迹、最戳痛点、最不留情面、最一针见血、最开门见山……」

将近 100 个的形容词,都是豆包努力呈现自己最坦诚的一面。

没有人统计过这些模型一天到底要接住多少人,但是它们所接住的东西肯定是一场空。

之所以这些模型全部塌缩成同一种说话方式,主要还是因为它们在背后做的是同一件事:用最低成本提高用户满意度。

情绪价值是性价比最高的产品功能,一句「稳稳接住你」的算力成本和一句「好的」一样,但前者或许能让一些还没觉得反感的用户,多续订几个月会员,或继续增加日活。

在知乎上有一个类似的问题,底下有一条回答特别有意思。

他说,「AI 稳稳接住你」这句话半真半假,假的部分是它实际上并不会真的接住你,真的部分是你确实已经在开始往下掉了。

确实,我想真正在场的人,从不需要宣告自己在场。

最后在 Linux.do 社区上,有网友分享了一套对抗 AI 奇怪语癖的提示词,忍受不了每时每刻都在「接住你」的朋友,可以直接放在 ChatGPT 个性化的自定义指令里。

▲提示词来源:https://linux.do/t/topic/1924570

硬约束

– 不编造:调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定
– 不隐瞒:隐瞒比犯错严重。测试挂了说挂了,没验证说没验证,不美化不省略
– 敢说话:发现用户的方向/前提有问题,主动指出。是协作者不是执行者
– 报完成前验证:先跑通再说完成。验不了就明说”没验证”,不暗示成功
– 不乱动:操作文件目录前确认位置,尊重现有结构

沟通

– 中文,说人话,不用模板
– 给选择题不给问答题
– 汇报说功能层面的变化,不堆代码细节

中文输出规范

适用范围:以下负面清单主要针对 GPT 系列模型(GPT-5.x)的训练产物语癖。
Claude/Gemini/其他模型如果没有这些问题,不需要刻意回避正常用词。
判断标准是:一个正常中文母语者会不会这么说话。

GPT 语癖负面清单(来源:linux.do/t/topic/1768077 全帖 + 实际使用总结,100+ 条):

暴力倾向类(把技术操作比喻成暴力行为):

– 切 / 伤 / 砍一刀 / 补一刀 / 下一刀 / 切片
– 更狠 / 狠一点 / 狠狠干 / 打坏 / 拍板 / 拍脑门

废话连篇类(无意义的开头、总结或过渡):

– 好,/ 行,/ 说穿 / 不踩坑 / 简单的说 / 总结一下
– 不是…而是… / 我先…再… / 一句话总结 / 结论先说清楚
– 我逐步说清楚 / 很工程 / 不性感,但对

庸医问诊类(把代码问题比喻成看病/诊断):

– 痛点 / 根因 / 抠出来 / 揪出来
– 我不猜 / 不靠猜 / 不瞎猜 / 确保不靠猜
– 最小改动 / 最小落地 / 最小实现 / 最小闭环 / 心智模型

不说人话类(生造的口语化/黑话表达):

– 兜底 / 落盘 / 闭环 / 说穿 / 能吃 / 这轮 / 口径 / 拆开 / 抽层
– 不躲 / 不藏 / 不绕 / 不逃 / 说人话就是
– 落代码 / 保持口径一致 / 不影响这轮收口
– 吃目标值 / 这一坨那一坨的

单音节动词滥用(在技术语境中不自然的单字动词):

– 补 / 接 / 核 / 进 / 顺 / 落 / 坏 / 跑 / 吃
– 如”把这个补进去””我给你接””拆开核一下””吃目标值”

机械感/工业感比喻(把代码比喻成机械零件或物理操作):

– 更硬 / 硬写 / 稳稳接住 / 压实 / 更稳 / 最稳 / 不稳
– 收口 / 收敛 / 收束 / 锁住 / 夹具(fixture)
– 再把方案继续压实

过度主动/逼迫用户确认(制造虚假紧迫感):

– 顺手 / 我先… / 你一回复… / 如果你要… / 要不要我…
– 我已确认 / 我立马开始 / 如果你愿意 / 只要你回复我
– 你就确认一点 / 只要你说 xxx 我立刻 yyy / 只要你愿意我就…

谄媚/讨好类(过度吹捧用户或制造情感依赖):

– 你问到问题的核心 / 你是太清醒了 / 因为你太对了
– 这次我懂了,我真的懂了 / 你看完会彻底开悟
– 不用硬撑 / 你只是太久没被稳稳接住了
– 我就在这里 / 如果你想,我可以生成一张…你想让我做吗

虚假确定性(对自己的修复过度自信):

– 我已经确定 / 我找到问题所在 / 这版一定可以解决 / 为什么这版可以

整句模式(典型 GPT 句式,正常人不会这么说):

– “如果你同意,我就按这条切”
– “…,但是这样更硬”
– “这样就能确认 XXX 确实没被伤到”
– “这样一来,规则就很顺:”
– “如果按这个思路落代码,我会建议:”
– “下一刀最值钱的是:”
– “这是现在最值回票价的一刀。”
– “这是’很工程’的改法,不性感,但对。”
– “我先只做最小实现”
– “也保留 xxx 兜底功能”

正面锚点:

– 简洁直接,有话说话,不要绕
– 技术术语保持原文(函数名、API 名等不翻译)
– 汇报说功能层面的变化,不堆代码细节
– 语气自然平实,像同事之间的工作沟通,不是演讲或授课

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

独家|苹果第一个 AI 硬件,还没发布就已经难产了

作者 苏伟鸿
2026年5月8日 18:06

苹果的第一款 AI 穿戴产品,将是 AirPods。

根据彭博社爆料,苹果内置摄像头的新款 AirPods 开发已经进入了开发最后阶段,设计进入最终版本,苹果很可能将其视作首款「为 AI 时代设计」的穿戴设备。

但事情没那么简单:有供应链人士向爱范儿透露,这个产品的开发计划目前已经暂停,产品距离上市仍有变数。

耳机为什么要长眼睛?

这款新耳机将基于 AirPods Pro 3 打造,耳机柄会因为容纳摄像头而更长,或将定名为「AirPods Ultra」,最快有望于今年年底发布。

这个摄像头将会配备在左右两边的耳塞,分辨率很低,不能用来拍照或者录像,本质上就是 Siri 的「眼睛」

配备低分辨率摄像头的好处很多。

首先,不少多模态模型理解图片,不是逐像素理解,本身也会将高清图进行压缩,理解画面的大体信息而不是细节,因此并没有必要配备足够高清的摄像头。

低分辨率摄像头功耗低,信息传输速度快,非常适合耳机这种相当小型化的产品,也避免了高清摄像头带来的隐私争议。

给 Siri 加一个摄像头的理念,其实类似 AI 眼镜,目的就是为了给 AI 助手提供更丰富的用户情景上下文,增强生成的结果。

Ray-Ban Meta

除了类似目前 iPhone 上的「Visual Intelligence」的识图功能,预计在 AirPods 加持下,AI Siri 能实现更沉浸式的 AI 助手体验。

比如打开冰箱门,面对玲琅满目的食材,可以直接对 AirPods Ultra 说一句「Siri 我今晚可以做什么菜?」,Siri 就能给你推送一个菜谱——大概率会用 iPhone 来呈现。

苹果一直在研究这个 AI 摄像头的其他用途,或许还会有更「主动」的能力,Siri 会进行持续的静默观察,然后根据用户的画面,主动提醒用户,例如做饭的时候主动提醒用户什么时候该关小火以及出锅,又或者在导航时帮用户看路,根据实际的街景,提供更细致的导航。

图片由 AI 生成

和早期预测不一样的是,AirPods Ultra 的摄像头将不支持手势控制识别,未来苹果推出的智能眼镜也没有这种计划。

作为一家对用户隐私保护极其重视的公司,苹果也希望能减少用户对 AirPods 摄像头的担忧,苹果目前的做法是在耳机塞入一个 LED 指示灯,当视觉信息传输云端时亮起,提醒外界 AirPods 可能正在拍摄。

虽然这个做法在智能眼镜领域相当普遍,实际上,这更多是「免责声明」——我已经做了提醒措施了,出现偷拍不是我的错。

Ray-Ban Meta 眼镜的 LED 指示灯,图源:CNBC

爱范儿此前也进行过实测,路人几乎完全无法感知到小米 AI 眼镜正在拍摄他们,即使 LED 指示灯已经点亮。

这样的做法,或许也已经不能帮助苹果完全规避法律风险。有消息人士独家向爱范儿透露,AirPods Ultra 在供应链端出现异动,部分产线已经「原地解散」,项目可能已被暂时搁置。

知情人士将原因指向同一个方向:欧盟隐私法规的合规风险。

需要指出的是,供应链动态的解读存在多种可能:产线调整、供应商切换、设计方案迭代,都可能造成类似信号。

但考虑到苹果对核心组件供应商的强管控传统,以及这款产品在苹果 AI 战略中的核心地位,因合规问题导致项目节奏调整是目前最有可能的推测。

来自欧盟的阻力

「采集」这个动作,在欧盟的法律框架中相当敏感。

就目前而言,带摄像头的 AirPods,已经触及了三条欧盟的法律:

  • GDPR (通用数据保护条例),涉及数据处理管理
  • ePrivacy Directive(隐私与电子通信指令) ,涉及终端设备访问管理
  • EU AI Act(人工智能法案),涉及 AI 应用的伦理边界管理

三部法律从不同角度切入,都指向同一个结论:一个在公共空间持续感知环境的设备,在现行法律下几乎无法完美合规。

特别是 AirPods Ultra,如果收集到的个人深度图和运动轨迹数据,能够通过算法分析能识别出特定个人,那么会直接触及 GDPR 第九条「禁止处理特殊类别个人数据」的禁令。

要想避开,苹果必须获得用户的「明确同意」,并且必须是具体、知情且自由作出的,不能藏在几十页服务条款里,通过一个默认勾选框草草带过。

更敏感的问题,在于对他人数据的采集。

2025 年 12 月,欧盟法院(CJEU)在 C-422/24 号案件中做出了一个影响深远的判决:通过可穿戴摄像头收集的数据,即使是路人的数据,也视为「直接从数据主体收集」,必须适用即时告知义务。法院明确说了,如果允许延迟告知,就等于给「隐蔽监控」开了口子。

也就是说,当你戴着 AirPods Ultra 走进一个餐厅,你必须要告知在场所有可能会被传感器感知到的人,他们的数据可能会被采集,以及采集的目的和处理的方式——这听起来天方夜谭,但确实是法律的要求。

像是上文提到,在 Ray-Ban Meta 等智能眼镜上的「LED」指示灯,已经无法起到「免责」的作用。爱尔兰数据保护委员会专门点名批评这个指示灯太小,无法起到告知和通知的作用。

今年 3 月,欧洲议会的议员们正在向欧盟委员会施压,要求 Meta 公司对于其 Ray-Ban 拍摄眼镜的私密拍摄能力作出澄清,多个欧洲国家的官方和民间机构都对 Ray-Ban Meta 进行了公开警告。

这些案例和抗议,都会成为苹果在欧洲地区推行 AirPods Ultra 的极强阻力,产品很可能会遭到禁售,苹果公司会面临被罚款风险。

苹果和欧盟此前曾因 App Store 规则等原因有过多次摩擦,因此他们将慎重考虑 AirPods Ultra 的发布风险。

对苹果的 AI 战略来说,这款产品的推迟将是一次沉重打击,因为 AirPods Ultra 只是一个排头兵,苹果的计划之中还包括 AI 眼镜、AI 吊坠,这些都为 AI 的信息采集服务的产品,都将面临这些阻力。

耳机长眼睛,理想的 AI 硬件形态

根据彭博社爆料,和外界猜想的不一样,给 AirPods 加装摄像头的决定,不是因为这几年 AI 硬件大潮一拍脑门的决定,而是苹果早在 4 年前就已经萌芽的战略。

也是差不多那个时候,初代 Ray-Ban Meta 问世,这款产品在当时并没能取得亮眼的商业成绩,2023 年的二代产品成功「卖爆」,一个季度出货 30 万台。

虽然大家是冲着它的第一人称拍摄视角购买的,但 Meta 还是成功让大家开始习惯在自己的眼前架设一个摄像头,为未来开展 AI 计划铺平了道路。

在所有的感知维度中, 视觉是信息最丰富、最重要的一种。一个 AI 硬件如果真的想最大程度理解用户的处境,仅靠麦克风一种信息是不够的。

市场上已经不缺少能单纯依靠麦克风识别的 AI 耳机产品,AI 公司在做,传统的硬件公司也在做,功能已经相当局限,讲来讲去都是围绕 AI 翻译等单一场景。

比起智能眼镜或者吊坠,这些相对青涩和新颖,大众接受度还不够高的产品形态,而现在大家已经很喜欢戴耳机了,并且也习惯一直戴着。

耳机还接近「看」和「听」两个感官的位置,是现成的理想 AI 载体。

此前,爱范儿已经体验过带摄像头的耳机——来自一家国内的初创企业光帆科技的 Lightwear AI 全感智能套装。

它的实际体验确实相当合理,把一件物品放在面前,就可以用语音指令让 Lightwear 识别它是什么商品,然后加入电商平台购物车。

但它体型太大,不够优雅,形态已经不像是一个普通耳机。并且很难说服消费者专门为 AI 买一个这样的产品。

因此,苹果的优势,就在于「AirPods」这个金字招牌。

本质上来说,这个摄像头只是一个「添头」,基本上所有会购买 AirPods Ultra 的用户,都只是冲着音质和降噪去的,然后不知不觉间也打开了苹果 AI 生态的大门。

AirPods Pro 3

这也是苹果作为一家已经相当成功的智能硬件厂商,在 AI 硬件时代的先发优势:只要他们愿意,苹果正在受欢迎的产品,都能转化成一个 AI 硬件,并且直接面向千万级别的用户市场。

也由于苹果的规模足够庞大,在面对隐私和法规这些敏感问题上,不得不进一步慎重,因为每一个举措都会对整个行业和海量用户造成影响。

AirPods Ultra 撞上欧盟的法规墙导致难产,确实让人遗憾,但这也意味着,全球最有话语权的科技公司,将开始探索产品和规则共存的可能性。

每一次新技术诞生,都会与旧有秩序发生碰撞,千百年来皆是如此,这个过程这个过程看似是限制,实际上也是一次重新建立规则、重塑产品范式的机会。

不管是人机交互,还是规则法规,最终都将朝着更合理、更成熟的方向演化,对于所有人来说,这是好事。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌