普通视图

发现新文章,点击刷新页面。
昨天以前首页

提高效率必备!Chrome 浏览器原生“视图分屏”功能开启教程

作者 兔哥
2025年12月4日 22:47
工作中频繁切换窗口非常影响效率。本文介绍谷歌 Chrome 浏览器原生的“视图分屏”功能,无需安装插件,通过简单设置即可在一个窗口内并排显示两个网页。彻底告别 Alt+Tab,让对照办公和学习更加方便快捷。

谷歌发布安卓 AI 系统,这就是苹果想象中的自己

作者 马扶摇
2026年5月13日 12:00

和去年一样,在正式的 Google I/O 开发者大会之前,谷歌为 Android 单独开了一次小型发布会。

本次 Android Show 上,谷歌几乎是一股脑将未来一年有关 Android 和整个 AI 产品生态的「宏愿」抖了出来。

除了作为基底的 Android 17 之外,我们这次还迎来了一些意料之外的平台更新和几款硬件产品的发布。

重点在于:虽然产品不多、距离 Android 17 广泛推送还有一段时间,但我们已经足以看到谷歌未来五年甚至十年,对于人工智能生态的计划了。

更要命的是,今晚的谷歌,刚好是苹果梦想里进入 AI 时代之后的自己。

操作系统到智能系统

活动刚开场,谷歌就宣布了一项意义重大的举措:

Android 将不再是一个单纯的操作系统(Operating System),而是一个智能系统(Intelligence System)。

图|Google

换句话说,曾经以「用户手动操作」为绝对主流的软硬件使用方式,在谷歌看来已经是上一个时代的符号了。

从今天起,Android 作为一个智能功能的集群,会更加主动地介入到用户操作流程的更前端,想你所想、做你所做。

图|Google

这也是为什么在本次活动上,Android 17 这个具体的系统版本出现的次数屈指可数,Gemini Intelligence 却成为了系统的代名词。

首先,Gemini Intelligence 作为谷歌 Gemini 在手机硬件上的最新形态,极大强化了它多模态、跨环境、高度整合的运行模式。

比如作为系统输入的第一入口,默认键盘 Gboard 就得到了一次功能强化。

基于 Gemini Intelligence 的多模态能力,原本在键盘功能中存在感不高的「自动填入」功能极大地拓展了它的信息来源:

图|Google

除了手动保存的各种密码之外,Gboard 还将会支持自动填入图库里面的证照信息、聊天提到的地址信息、邮件撰写的日程信息等等。

更直白地说:Gemini Intelligence 已经远超「帮忙记住密码」的水平,而是真正像个助理一样帮你记住和建议各种来源、各种类型的信息。

另一种有效利用这些多模态信息的方式,则是 Android 的桌面小组件(widget)。

在 Android 17 中,Gemini Intelligence 将会支持一项名为「Create my widget」的功能,但不是第一时间上线、而是目标今年晚些时候。

图|Google

这个新功能主要做的,就是用类似 vibe coding 的模式,根据你的指令在桌面上创建新的小组件,打破了小组件只能是 app 预置的那些。

举例来说,相比功能单一的记录卡路里的 app,我可以和 Gemini 说:做一个每周工作日向我推荐两次高蛋白餐的小组件。

图|Google

这样一来,桌面小组件就真正变成了一项复合任务的入口,本质上和人 vibe coding 一个 app 的性质是完全相同的。

此外,喜欢语音输入的用户也有福了——新版 Gboard 将会支持类似 Typeless 的高智能化语音输入功能,名字叫做 Rambler。

相比以前要亲口说「逗号…句号…」,Rambler 可以将一整段充满了「嗯嗯啊啊」的口述转译、清洗、整理成一段整洁的文字:

图|Google

另一方面,Gemini Intelligence 的自动执行功能也得到了进一步加强。

去年的 Google I/O 和发布会上,谷歌演示过给 Gemini 下命令,让它自动帮你点外卖、叫车、订票之类的操作,正式上线之后反响不错。

而在 Android 17 中,Gemini 升级成 Gemini Intelligence,这种「代操作」也支持多步骤任务了。

比如以前只支持简单的「帮我订一张票」,你现在可以在 Gemini 对话框里直接拍下旅游宣传册,和 Gemini 说「在携程上帮我找一个类似的双人团行程」:

图|Google

重点不在于 Gemini 能够执行什么任务,而是它拥有了更强大的「多做一步」的能力,有时候就是多的这一步,让 AI 从「能用」变成了「有用」。

当然 Android 17 的更新也不是 Gemini 的独角戏,谷歌同样对很多「Android 核心体验」进行了优化。

在 Android 17 中,谷歌和 Meta 达成了合作,在 Facebook、Instagram 等等 app 里支持了调用原生相机功能,比如 Ultra HDR、超级防抖、夜景视频等等。

而谷歌使用了好多年的平面风格 emoji 也迎来了一次更新——从原本的纯 2D 变成了 2.5D,在风格上更接近 iOS 使用的 emoji 了:

图|Google

而我们此前介绍过的 QuickShare 兼容 AirDrop 的功能,也将在 Android 17 上支持更多厂商的设备。

除了三星和 Pixel 之外,(国际版)OPPO、Vivo、一加和荣耀的较新机型也将在今年下半年陆续更新兼容 AirDrop 的固件:

图|Google

谷歌的 AI PC

在 Gemini Intelligence 之外,谷歌也没有忘记给这些更复杂、更强大的 AI 功能打造一套量身定制的硬件。

这个新硬件的形态,既不是吊坠,也不是耳机,更不是手表手环——而是曾经的 Chromebook。

没错,在 AI 时代,谷歌又双叒给自己的笔记本改名了。

从 Pixelbook,到 Chromebook,再到最新的 Googlebook:

图|Google

和 Chromebook 一样,Googlebook 并不是某一款具体的笔记本电脑,而是同样和第三方厂商合作、只要符合标准的都可以叫这个名字。

而 Googlebook,就是「第一款为 Gemini Intelligence 量身打造」的硬件产品。

除了上面的全新 Gemini Intelligence 功能之外,Googlebook 在日常使用最频繁的基础人机交互层面,做出了堪称革命性的创新——

在 Googlebook 上呼出 Gemini 功能,既不需要说话、也不需要按键、更不是右键菜单,只需要「摇一摇光标」就行。

图|Google

基于 Gemini Intelligence 的多模态能力,推荐的 AI 指令甚至可以根据光标下面的内容、选中的内容、屏幕上可以进行的操作等等因素自动调整。

在如今电脑端 AI 功能越来越密集、笔记本键盘空间不够充裕的情况下,Googlebook 的「魔法指针」无疑是最直观且优雅的解决方案之一。

此外,Googlebook 还解决了 ChromeOS 历史上的老大难问题:它是谷歌的产品,却跑不了 Android app。

换句话说,所有 Android 手机里面的 app,在 Googlebook 上都可以直接运行,基本看齐了如今 macOS 跑 iOS 软件的水平。

这一切的基础,就是爱范儿之前文章中提到的谷歌大力推行的 GKI(通用内核镜像)计划,正在让 Android 脱离手机的桎梏、无缝衔接到更多形态的设备上。

虽然谷歌目前没有提到这个功能的兼容情况,但我们猜测,依据处理器规格和网络状态,Googlebook 应该同时支持本地运行和画面投屏手机 app 两种方式。

图|Google

根据活动消息,首批 Googlebook 的生产厂商还是那几个熟悉的身影:宏碁、华硕、戴尔、惠普、联想等等,首批产品预计在今年内上市。

图|Google

除了笔记本电脑,Android 17 同样更新了一部分 Android Auto 车机系统的功能。

比如更像 OpenClaw 能力的 Gemini Intelligence 代操作、优化的 3D 道路画面、更加智能化的流媒体播放功能等等。

当然也支持把手机上自创的自定义 widget 显示在车机上。

图|Google

同时,原生支持 Android Auto 的品牌范围也在增加,部分型号甚至支持记忆当前车辆信息,类似后备箱尺寸、仪表盘规格等等。

这样一来,用户在使用 Gemini 问答的时候,车机就能给出具体回答,比如「能不能同时放俩 27 寸旅行箱?」或者「那个像是刺客的警示灯是什么意思」之类的。

可惜的是,这项功能目前也不会立即上线,同样预计为「今年晚些时候」才会有产品搭载。

总的来说,本次活动只是今年 Google I/O 的开胃菜,但它涉及到的理念变革却是非常根本性的——

其实在活动的开头,谷歌就指出了:好用的人工智能技术,就应该是让人感受不到的,它会融入进每一层软件和硬件的体验。

图|Google

而这正是 Gemini Intelligence 在做的。

无论是 Pixel 手机、Android Auto 车机还是 Googlebook,这些硬件最终都只是 Gemini 智能的一种体现方式而已。

值得玩味的是——谷歌今天晚上所做的,刚好就是苹果削尖脑袋想要实现的那套 AI 生态。

让 iPhone、手表和 Mac 共用一套智能体系,用户无论在哪里使用,功能和体验都是高度相似的,硬件只区分交互方式、不影响智能水平。

图|Apple

可惜的是,苹果挣扎了这么久,也没有搞定「模型」的部分,反而让自己的硬件成了别家模型的嫁衣。

将来的智能系统(Intelligence System),形式比现在更多样、但核心却比现在更加统一。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Google 重塑搜索框,进化 50 亿人的上网习惯

作者 马扶摇
2026年5月20日 16:00

在品尝过「会前甜点」Android Show 之后,真正的重头戏谷歌开发者大会 Google I/O 2026 正式揭开了帷幕。

不出所料,在时长接近两个小时的活动中,Gemini 占据了绝对的 C 位。

图|Google

除了更新基础模型和周边能力之外,Gemini 也更加深入的集成到了谷歌 app 全家桶里面,甚至还给 iOS 和 macOS 带来了一些更新。

比较可惜的是,上周亮相的 Googlebook 和 Android 17,在本次 I/O 开场活动上都没有被提及。

我们唯一看到的硬件产品,是与三星联合开发的智能眼镜:

图|Google

总之,谷歌借助本次 I/O 大会传达的信息已经很明确了:

Gemini 的能力将会越来越强、存在感将会越来越高,与全球十几亿谷歌产品用户的「物理生活」的集成也会越来越紧密。

从夸张的角度想—— Gemini 距离接管大部分人的日常工作,似乎就只差一个人形机器人了。

底层模型更新

整场活动里最重磅的,就是围绕着 Gemini 的几款底层模型的更新了。

首先是正式的 Gemini 3.5 版本发布,用户最先可以体验到的版本则是 Gemini 3.5 Flash。

它在多个维度上展现出媲美之前 2.5 Pro 的能力,并且保持了 Flash 系列的速度:

图|Google

得益于速度和性能的平衡,Gemini 3.5 Flash 最擅长的场景之一就是处理长期、大规模的智能任务,同时还能省下大量 token 开销。

同时,最新的 Antigravity 集成也让 Gemini 3.5 Flash 拥有了更丰富的输出形式——

执行分类代码、根据论文编写游戏、转换上古代码库、构建 3D 场景、交互式 Web 界面等等。

将遗留代码库转换成 Next.js|Google

此外还有规模最大的「世界模型」Gemini Omni,用谷歌的宏愿来描述 Gemini Omni 则是:

它可以根据任何输入内容,输出任何你想要的东西(Generate any output with any input)。

Omni 的首款模型产品则是 Gemini Omni Flash,除了 Gemini app,它也集成到了 Google Flow 和 YouTube Shorts 里面,支持用户使用自然语言生成「最像真的」的视频。

图|Google

相对应的,谷歌也调整了自己的 Google One 订阅模式,在原本最高等级的 AI Ultra 方案里新增了一个 100 美元/月的分类。

这个新的订阅同属于 AI Ultra 级别,包含 Gemini 3.5 Flash、Antigravity 2.0 和其他新功能的优先访问权等等。

当然,传统的 20TB 云空间和 YouTube Premium 权限也同样包含,主要面向开发者和高级创作者之类的群体。

图|Google

同时,原本 250 美元的最高等级 AI Ultra 订阅则迎来了降价,现在只需要 200 美元/月就能享受到包括最高 20 倍于 AI Pro 的使用额等等特权。

另一个重大的收费模式变革则是 Gemini app 本身。

图|Google I/O

在新闻稿里,谷歌宣布将 Gemini 的每日限额从「提示词额度」改成了「使用量计算」

这样算下来,图片、视频和代码的消耗变多、文本任务消耗量则变少,整体是一种更灵活的算力计费模式。

实际业务落地

与 OpenAI、Anthropic 之类的公司不同,谷歌最大的特点在于,它真的有一套能够直达全球十几亿用户的产品生态。

在上述基础模型之外,谷歌本次展示的策略,重点是将这些「抽象」的 AI 模型能力,整合进普罗大众每天都在使用的 app 里面。

图|SlashGear

而这种整合大体上分成三步:传统搜索业务变革手机系统智能化视觉智能融合

「搜索引擎」作为谷歌的起家业务,在今年的 I/O 上迎来了一次彻头彻尾的 AI 改造,谷歌称之为「AI 搜索的新时代」。

这种业务转变背后的逻辑很简单:相比 20 年前,人们只在搜索框里输入单词或短语,现在的人更习惯在里面输入复杂的复合指令

图|Google

换言之:谷歌把传统的搜索框(search box)变成了一个通用对话框(chatbox)。

除了搜索,用户可以在里面要求任何形式的内容。

这刚好也是本次 I/O 活动的重点更新内容——具有智能体能力的搜索。

首先,AI Mode 的基础模型会升级到 Gemini 3.5,你的搜索框会自动推荐和补全输入的内容,让你的关键词变得更详细或者更广泛。

图|Google

此外还有全新的生成式 UI(Generative UI)回答,谷歌会根据你询问的东西智能生成最合适的回答形式。

比如搜索股票走势,回答里不仅有文本,还会生成折线图;问装修灵感,回答里就生成图片……

甚至你搜索物理问题,它还能调用 Antigravity 快速编写一个互动式的 Web 演示

图|Google

使用了这么多年的「多模态搜索」之后,我们终于进入了「多模态回答」的时代。

谷歌搜索结合 Antigravity 的能力不止于此,它还可以更进一步,根据你在搜索框里输入的内容实时生成 Web 形式的仪表盘或追踪器。

用人话来说,就是谷歌搜索框为你的需求直接编写了一个专门的 app。

这种多模态能力是非常恐怖的,甚至有可能彻底改变人们检索信息的方式——

毕竟我们搜东西,大多是为了将搜索结果用在别的任务里面,而新的谷歌搜索可以直接帮你做完下一步操作。

图|Google

至于这种「代办」的具体方式,则是 Gemini Spark。

简单来说,Gemini Spark 本质上是类似 OpenClaw 的「语义理解-自动执行」功能,一个谷歌 Claw

其中 Gemini Spark 基于最新的 Gemini 3.5 模型,支持 7 天 24 小时不间断运行。

并且由于运行载体是 Google Cloud,还可以执行跨端代理操作——在手机上布置任务,在电脑上查收结果。

图|Google

Gemini Spark 目前支持所有谷歌套件 app,后续则会拓展 MCP 平台以兼容第三方 app 的内部功能,同时支持用户自己上传 Skill。

谷歌还宣布 Gemini Spark 后续会集成到 Chrome 和 Android Halo 中,为浏览器和手机带来智能体自动操作的功能。

Android Halo|Google

最后一步棋,则是 Gemini 与视觉智能的融合。

在本次 I/O 活动上,谷歌发布了首个与三星联合开发的「纯音频智能眼镜」产品,分别使用 Gentle Monster 和 Warby Parker 镜架:

图|Google

单纯从功能上讲,这个纯音频眼镜与市面上已经有的智能眼镜相差不大,主要优势是可以直接调用 Gemini 的多模态功能,用来调用前面提到的其他复杂能力。

另一方面,XREAL 与谷歌合作的那款带屏幕的智能眼镜 Project Aura 在本次活动上又有了更新。

根据介绍,Project Aura 搭载了 XREAL 自研的 X1S 空间计算芯片,并为了佩戴舒适采用了分体式的设计。

也就是说,Project Aura 的眼镜部分只负责显示,真正的处理芯片、电池包和触控板需要通过数据线连接到一个外置的随身单元上:

图|TheVerge

至于实际的生活功能方面,Project Aura 将会支持 Google Maps 沉浸式导航、巨幕/窗口化视频播放、YouTube VR 视频、WebXR 三维绘画、DP 拓展笔记本屏幕等等用法。

图|TECHEBLOG

总体来说,Android XR 是一套完全基于空间计算的视觉化的操作系统,与 Gemini 的能力搭配起来,为我们画出了一套未来智能眼镜的线路图。

更重要的是,虽然现在 Android XR 和 Android 17 是两个完全独立的系统,但就像 Android 和 ChromeOS 融合那样,它们未来大概率也会合二为一、变成一个「视觉智能系统」类似物。

Gemini 能接管一切吗

熬夜看完整场 Google I/O 之后,除了 Gemini 3.5 和它的小伙伴们带来的惊讶之外,我们难免也诧异于 AI 对于人类基础行为的革命。

无论是 Gemini 3.5 Flash、Antigravity、Gemini Spark,它们都隐藏在了一个简洁的「搜索对话框」背后,将搜索这一行为从「获取信息」进化成了「完成任务」。

图|Google Search

我们很难说这种进化在长期来看会对我们使用网络和人工智能产生什么影响,但我们至少可以从里面看到谷歌的野心——

为一套强悍的 AI 模型赋予前所未有丰富的功能,并且将这些功能集成进自己覆盖全球几十亿用户的网络产品里,共同提升这几十亿人的效率。

Gemini 同时切进所有这些网络产品,副作用是「应用」这个概念正在变薄——

Agent 越能办事,应用内部和搜索结果页的存在价值就越被稀释。

至于这层智能会把多少旧规则一起重写,现在没人能答,谷歌自己也答不上来。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

用了两天 iOS 27,我「AI」上了 Siri

作者 马扶摇
2026年6月12日 15:00

周四晚上,我在床上举着 iPhone Air,在 Siri 对话框里打下了一个从来没问过的问题:

Siri, what do you think of me?(Siri,你觉得我怎么样?)

iOS 27 的等待音响了几秒钟,Siri 就给出了回答:

I think you’re pretty great.(我觉得你很棒。)

通宵达旦的 WWDC 26 开幕式已经结束,蒂姆·库克主持的最后一场大型活动圆满落幕,留下了散落一地的大饼。

图|Business Insider

与 WWDC 24 不同的是——

在体验过最新的开发者系统之后,这些留给新 CEO 特努斯的大饼似乎是真材实料的。

这其中不仅有视觉风格优化、稳定性和流畅度修补的 iOS 27,更有第一款真正落地的「AI 级 Siri」,主打一个压轴出场:

此外,作为 Siri AI 的地基,苹果也更新了第三代 Apple Foundation Model(AFM)家族,正式承认「与谷歌合作定制开发」。

其中,3b 参数的 AFM 3 Core 和 20b 参数的 AFM 3 Core Advanced 为端侧模型,目前只有搭载 A19 Pro 处理器的 iPhone 才能用上:

图|YouTube @Apple

更大型的 AFM 3 Cloud、AFM 3 Cloud Pro 和负责生图的 ADM 3 Cloud 则部署在苹果的服务器上,收费模式已经内嵌在 iCloud+ 中了。

可惜受制于服务器容量和测试人数太多,Siri AI 很多在线功能目前还处在间歇宕机的状态。

但是不管怎么说,爱范儿编辑部里几位坚持购买外版 iPhone 的同事终于迎来了王朝。

毕竟 Siri AI 的端侧能力同样迎来了「史诗级进步」——

从 WWDC 开幕式结束到现在,我们狠狠「压力」了新 Siri 近 48 个小时,得出了一个令人满意的结论:

Siri AI 做到了像 2016 年巴西大奖赛的维斯塔潘一样,在最后 16 圈以无人料到之势,从队尾杀回了前三名。

图|Red Bull

如何更新 iOS 27

在之前的上手体验中,很多读者在评论区询问如何更新 iOS 27,在这里我们为大家提供一个粗略的更新指南。

首先,也是最重要的:

测试版系统并不稳定,如果你只有一台 iPhone 作为主力机,爱范儿不建议你盲目更新尝鲜。

总之,如果你想更新普通测试版系统,需要先前往苹果 Beta 软件计划网站,登记注册 Apple ID,才能收到 Public Beta 推送:

网址:beta.apple.com/zh-CN

而要更新 iOS 27,还需要在 App Store 下载 Apple Developer 程序。

在「账户」页面完成「报名 Apple Developer Program」的前几步,才能收到开发者版本更新。

另外需要注意,想要用上 Apple Intelligence 和 Siri AI,你还是得有一台 iPhone 15 Pro 或更新的机器才行。

也不能忽略——新 Siri AI 依然有着非常明确的区域限制。

一台非国行 iPhone、外区 Apple ID 和英语(美国)系统语言,三者都是不可或缺的。

Siri AI 体验:小 Gemini

在 WWDC 结束至今的 48 个多小时里,我们尽量「压力」了一把 Siri。

就是想看看它和去年的半成品 Apple Intelligence,以及最普通的彩色泡泡版本有什么区别。

先说结论:iOS 27 中的 Siri AI 潜力非常大,但相辅相成的,亟需解决的问题也非常多。

就拿最简单的沟通能力来说,如果你成功激活了新 Siri,第一件事就会发现 Siri 比以往健谈了许多——

换句话说,Siri 在 iOS 27 中终于不再回复干巴巴的信息或者预设模板了,而是可以把零散的信息整理成连贯的自然语言:

此外,屏幕感知和文档分析功能也终于成为了 Siri 多模态能力的一部分。

在大部分系统 app 和少数第三方 app 里,Siri 可以识别屏幕上显示的内容以及页面信息,并做出针对性回答:

而在上述功能的基础上,Siri 也一并升级了执行复合指令的能力,这在以前 Siri「人工智障」时期简直是想都不敢想的。

比如我的朋友用 iMessage 给我发了一个地址,我实在懒得手动复制粘贴,就可以直接要求 Siri:

XXX 在短信里提到了一个聚会地址,从那里导航去广州大剧院,方式选择步行。

然后就能看到 Siri 缓慢(但准确)地从 iMessage 里面搜出地址、确认附近的出发点,最后导航到广州大剧院:

要知道,在不到一个月之前,Siri 还是那个连普通命令都不一定能操作明白的 Siri。

虽然「理解复合指令」和「跨 app 执行」已经是 2026 年手机助手的标配,但 Siri 仅靠一次更新就从吊车尾的水平追上了大部队,何尝不是一种进步呢?

除了这些,让 Siri 读电子邮件更是不在话下。

由于我订阅了非常多 Newsletter,整理起来非常头疼,让 Siri 帮我总结近期的邮件已经成为了我在 iOS 27 里用得最频繁的功能:

另外还记得爱范儿之前提到的微信 A2A 吗?虽然 Siri 之前就能操作发微信,但在新 UI 和语音引擎的加持下,整个操作感觉顺滑了许多。

根据我们目前的测试,绝大部分在 WWDC 26 开幕式上演示的 Siri AI 功能基本都已经实装。

除了偶尔会出现的界面 bug 之外,整个体验已经非常接近「丝滑」了。

然而,现阶段最大的问题既不是性能、也不是 bug,而是苹果的土豆服务器。

毕竟 Siri AI 还有很大一部分能力依赖云端模型,比如搜索在线信息、上传和识别资料、对比本地和线上资料等等。

图|YouTube @Apple

然而自从 WWDC 开幕式以来,苹果的 Siri 服务器就处在间歇式上线的情况——

在测试过程中,经常出现首次操作一切正常,打开录屏准备重复的时候,Siri 就开始报错「Something went wrong」了。

这还只是 iOS 27 处在有限范围的开发者测试的情况下,等到 7 月公测上线、9 月全球上线之后,「Siri 排队要排多久」将会是个避不开的话题。

但尽管有些小坎坷,我们的结论依然是不变的——

苹果用一次更新,就让 Siri 从「人工智障」变成了「小 Gemini」,虽然测试版的体验不太稳定,但依然称得上是苹果在进入 AI 时代后最重大的一次进步。

图像 AI 体验:重定义真实

Siri AI 的另一面,落在了与影像有关的一切上——

多模态图像功能、相机里的 Siri 模式、图乐园,以及相册里的 AI 工具。

过去近十年里,苹果对影像的态度都相当克制:相机负责记录,照片负责保存,后期负责轻度修正。

哪怕 Apple Intelligence 开始进入系统,苹果也一直很小心地把 AI 生成图像放在偏插画、动画,而避免写实的「内容安全区」里。

图|9to5Mac

显然,苹果不太愿意让用户轻易生成一张看起来像真实照片的东西,因为这会触碰苹果长期坚持的一条线:

照片应该和真实发生过的事保持某种关系。

我们与苹果的专访也多次印证过这个观点,但 iOS 27 的变化,显现出苹果的态度和观点都在悄然地转变——

第一个变化,是影像与 AI 的入口的合流。

在 iOS 27 相机的底栏中,新增了一个「SIRI」模式,里面容纳了从相机控制按钮中释放的视觉智能(Visual Intelligence)功能。

在苹果的安排下,这是影像和 AI 第一次在默认相机入口里并排出现。

只可惜现在相机 Siri 和前面提到的问题一样——连接不上服务器,有时还会回报「Google is unavailable」,稳定性不如直接使用 Google Lens。

但这只是开始,图乐园 app 的更新,则让 AI 生成第一次更靠近苹果过去刻意避开的「写实影像」。

我上传了一张阴天风景照片,并用英语描述:

为这张照片添加蓝天与白云,保持真实照片风格。

图乐园生成结果的确符合要求——

蓝天、白云和原图环境融合得相当自然,整体观感也相当接近实拍照片。

但我们测试下来,目前版本的图乐园有一些算力限制:原图比例为 3:2,生成后变成了 16:9,分辨率也从 30MP 降到了约 3MP。

抛开算力的客观限制,图乐园定位的转变反而是更有意思的事——

之前,它就是个贴纸、Genmoji 和表情包生成器,使用场景主要发生在聊天软件的轻量互动里。

但到了 iOS 27,它开始支持更真实的图像生成,画质也明显提升,甚至提供了 ChatGPT 风格以及可供第三方 app 调用的 API:

也就是说,图乐园正从一个娱乐化的生成工具,变成苹果系统级的图像生成入口——

这个入口的意义,未必是让苹果去和 ChatGPT 或 Gemini 比谁生成得更好,而是让用户在需要一张图时,不必离开系统本身。

按图索骥,我们也能察觉到背后苹果对 AI 与影像态度的转变:

苹果开始接受「用户对影像的需求」不只来自镜头,也来自想象。

相册 AI 是第三个信号,也是最接近曾经苹果对于「影像边界」的部分。

在 iOS 27 的相册中,基于苹果智能的 AI 工具成为了编辑菜单的一个独立板块:

其中最有意思的,当属 Reframe,也就是「重构」功能。

点击 Reframe 后,iPhone 会先用端侧模型生成一张画质较低的预览图。我们可以调整构图、放大或缩小画面,甚至轻微改变机位视角:

确认角度后,照片才会上传云端完成最终重构——图中原有的细节会尽量保留,因视角或构图变化而产生的空缺,则由生成式 AI 补全。

从实际表现来看,重构后的图片像素依然会有一定下降,比如我们测试的 30MP 照片,重构后变成了 12MP。

难得的是,Reframe 保留了完整的生成路径,即使已经保存,仍然可以随时在相册中恢复原图

这背后的动机很现实:

用户早就习惯了谷歌、三星以及第三方工具的 AI 修图能力,苹果如果继续止步于纯手工编辑,就会白白把用户拱手让人。

但苹果的路径不是把生成式编辑一股脑地放到 Siri 首页,而是收进了相册这个更熟悉、更日常的容器里。

这样的好处在于,用户不用理解「生成式填充」这样的术语,也不用把刚拍好的照片塞进一个理智又冰冷的 app,再借助一串复杂的描述词去复刻脑中想法。

图|Imgflip

只需要知道:这张照片可以补一点边,可以换一个构图,可以让画面更接近自己当时想拍出来的样子。

苹果想打造什么样的 AI

虽然苹果已经念叨了两年多,但 iOS 27 中的 Siri,的确是我们第一次看到「接近苹果想象」的 AI 的样子。

对于 Siri 的图像能力来说,苹果当然记得「真实」,但同时也承认了一个不可回避的事实:

在 AI 大行其道下,影像的「真实」已经很难只由快门来定义。

照片可以是镜头捕捉到的现场,也可以包含用户对画面的记忆、意图和表达。

iPhone 5 宣传片《记录每一天》|YouTube @Apple

一个人拍下建筑时没有拍全,后期用 AI 补出天空和屋顶,虽然不再是传统意义上的照片,但却能更接近用户当时想留下的画面。

所以我们看到,苹果一反「集成化」的思路,把 AI 放进了影像链路的不同位置——

优化现实,交给相册 AI。理解现实,交给 Siri 视觉。创造现实,就去图乐园。

把这件事放到整个行业里看,苹果并不孤立,甚至于整个科技行业对 AI 影像已经有了一个大致共识:

AI 不再只是提升画质的幕后算法,而是正在走到前台,成为影像创作本身的一部分。

这种操作就很苹果。

它不是第一个把 AI 修图、生图、视觉理解提供给用户的厂商,但它只要开始做,就会把这些能力变成系统默认体验的一部分。

图|YouTube @Apple

类似的现象也体现在 Siri AI 本身。

虽然 Apple Intelligence 连续跳票了两年,但当我们真的看到一个接近成品的 Siri AI 之后,它的表现也符合大家积攒了两年的期待。

实际上,不止我们,绝大多数体验到了 Siri AI 的外媒都给出了相当正面的评价。TheVerge 这样描述道:

它(Siri)支持的功能相当基础……但它确实能做到宣传中承诺的一切。对于两年前曾对 Siri 做出巨大承诺却最终未能实现的苹果公司来说,这意义重大。

甚至连《经济学人》杂志都发表了看法,在标题中表示「苹果的新 Siri 是 AI 竞赛中的一匹黑马」:

据报道,苹果每年向谷歌支付约 10 亿美元的技术费用——但与自主研发大模型的成本相比,这简直是九牛一毛。

而一旦用户习惯了 Siri,苹果完全有可能更换底层模型,从而在谈判中占据绝对优势。

说人话就是,虽然 Siri AI 的底层技术来自谷歌,但与消费者的关系仍然牢牢握在苹果手里。

而这也是我们对于 Siri 未来最看好的一点——苹果和谷歌一样,是 AI 竞赛中少有的兼具软硬件业务的巨头。

而苹果的软硬件结合能力,依然是谷歌可望而不可及的程度。

比如 Google I/O 上剧透的 Gemini Spark 看着超强,却没有半点给 Pixel 手机测试的迹象。

更危险的是,Siri 已经凭借钞能力,慢慢追上总不放出测试版的 Gemini。

根据统计,目前全球有约 15.6 亿 iPhone 用户,虽然 Siri AI 只能覆盖其中一小部分,但最终数字依然是一个其他厂商可望而不可及的规模。

这几亿个真实用户产生的数据规模、购买力和传播效应,是很多 AI 厂商倒贴钱卖 token 都吸引不到的。

更有可能的是,补全了 AI 能力的 iPhone 会在国际市场上带动一波今年秋季的换机潮。

哪怕只能带动几亿用户,依然是一个非常恐怖的数字。

再回看 WWDC 里面的幻灯片,我们就能理解为什么苹果 AI 掉队了这么久,依然能拿 70 分的试卷、收获 150 分的喝彩——

图|YouTube @Apple

因为苹果真正的护城河,从来都不是某项孤立的技术,而是最中心的那一层庞大的用户基数。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

起猛了,看见 Gemini 上长了个手机

作者 马扶摇
2026年6月16日 10:30

伴随着 Android Show 与 Google I/O 开幕式的结束,我们总算见到了谷歌对于自家软件生态在未来的规划——

用 Gemini 武装一切,其中就包括我们都熟悉的 Android。

但「把 Android 从操作系统升格为智能系统」只是一个抽象的描述,这个 Gemini 风味的智能系统用起来究竟怎么样呢?

为了尝鲜,我们把手里这台 Pixel 9 Pro 刷上了最新版本的 Android 17。

带你看看谷歌画了多少大饼、落地了多少大饼,以及有什么值得我们期待的地方。

如何尝鲜 Android 17

谷歌和苹果一样,近几年都将系统测试权限扩大了很多,几乎可以说没有门槛了。

想要体验测试版 Android 系统,你不需要抽卡、不需要抢名额,更不需要参加「谷歌高考」,有一台 Pixel 手机就行。

⚠ 更新测试版系统存在风险,不要在没有备份的情况下盲目尝鲜 ⚠

只需要动动小手,在 Android Beta Program 网站上点击「选择加入」,就能直接收到测试版更新:

不过这样收到的更新,是「相对稳定」的 Android Beta QPR 版本,要求不高的话可以拿来当主力机使用。

如果想在第一时间体验到「最接近发布会」的版本,则需要在 Android Canary 网站,用浏览器线刷更新:

好在目前「相对稳定」的 QPR Beta 3 和「不太稳定」的 Canary 版本,都已经推送了 Android 17 的部分新 UI 和新功能。

而我们的后续体验,则以最新的 Canary 版本(ZP11.260417.009)为准。

新设计:总算不像玻璃

毫不意外地,Android 17 Canary 版本上手的第一观感,就是谷歌怎么叒开始乱改设计风格了?

对 UI 设计感兴趣的读者或许还记得:

去年的 Google I/O 上,谷歌发布了一款名为 Material 3 Expressive(M3E)的新设计语言。

和更早的 Material You 类似,M3E 以超高对比度的色彩、大量的图形化控件,以及彻底扁平化「完全不 Material」而著称:

图|Google Blog

结果在过去一年多的更新里,M3E 大部分的风格都没有上线,真正落地的只有新版侧边栏和悬浮按钮(FAB)等等细节元素。

到了 Android 17,哪怕整个行业的风潮都在向苹果带起的「液态玻璃」倾斜, 谷歌依然觉得:

玻璃还是太「材质」(material)了,谁规定 Material Design 一定要有 material?

正因如此,我们在 Android Show 上见到了谷歌的「又一代」新设计风格——

虚化、波浪、粒子效果和高斯模糊所构成的 Neural Expressive:

图|Google

只可惜目前 Neural Expressive 设计还没有加入那些让人眼花缭乱的失焦、渐显和内发光特效。

如往年一样,这些需要等后续逐渐 OTA 出来。

因此眼下 Canary 系统里除了更明显的高斯模糊,Neural Expressive 的主要舞台是在 Gemini app 内部。

在 I/O 活动当晚,Gemini app 就上线了粒子效果和全新的字体,只需要更新一下 app 就能体验到:

Android(左)和 iOS(右)

不得不说,看过了国产系统对液态玻璃的「群起而抄之」之后,谷歌这样抛弃材质模拟、只使用光照和虚化来构建层级的设计是相当让人耳目一新的。

Neural Expressive 目前面临的最大挑战,就是不要像 M3E 那样烂尾。

只要能在 Android 17 正式版中上线,那在我看来就是一个比液态玻璃更优秀的视觉方案。

图|Google

新模型:潜力不可估量

不过当然,参与 Android 版本测试别说在国内,哪怕在国外也是非常小众的行为爱好了。

好在最新版本的模型不需要非得 Android 17 才能享受。

Gemini 3.5 Flash 目前已经通过 Gemini app 和其他内嵌了 AI 的谷歌全家桶全球上线,直接就能用:

除了界面改版、更换新字体之外,Gemini 3.5 Flash 给人的第一印象就是「快」。

比如面对同一个开放性答案的问题「为什么苏联偏偏在 1991 年解体」,选择标准思考模式,3.5 Flash 从思考到显示首个回答字符的时间不到 10 秒

而 Gemini 3.1 Pro 从开始思考到显示首个回答字符,花了近 22 秒——并且回答质量也没有和 3.5 Flash 拉开明显差距。

这种保证质量的同时大幅提速的升级模式,对于 Gemini 3.5 所规划的使用场景无疑是大有裨益的。

图|Google Blog

毕竟无论「谷歌 Claw」自动执行任务,还是调用 Antigravity 去 vide coding,语言模型的速度都很容易成为时间瓶颈。

可惜,目前 Gemini Spark 和调用 Antigravity 2.0 的功能(比如生成式小组件、新版 AI 搜索等等)都还没上线,要等到今年夏天。

我们当下能在 Android 17 里面体验到的 AI 功能和使用场景,和 Android 16 以及 iOS 26 上能够用到的都几乎一样。

不过现在能体验到什么呢?包含最新 Omni 特性的视频生成——

全生态 Gemini 最让人期待

其实单从 Google I/O 之后更新的这一版 Android 17 来看,我们能够体验到的都是非常零星的功能,并没有什么真正「人无我有」的新东西。

目前的测试版系统,距离谷歌画饼的「全生态链 Gemini 化」还有相当长的一段路要走。

图|Google

然而真正让 Gemini 脱颖而出、和 ChatGPT 与 Claude 拉开明显差距的,恰恰就是谷歌的软硬件生态链——

谷歌根本不需要像 OpenAI 那样挖空心思去设计全新形态的 AI 硬件,它已经接入了全球近 50 亿人的电脑和手机。

只要运营得当,Gemini 完全可以变成 Chrome 那样「大到不能倒」的全球性产品,从 AI 竞赛的参赛者直接变成「场地供应商」。

图|ProAndroidDev

谷歌事实上也是这么做的:给生活中每个不可或缺的环节——手机系统、电脑浏览器、智能家具、网络服务——都加上 Gemini,自然会有用户去使用。

等到各处的 Gemini 都部署好,谷歌只需要一套最简单的互联机制,就可以串起个生态链的 AI 能力,把手机、电脑、浏览器和 app 全部收入囊中。

图|Google

到时候,哪怕你 Claude 的代码写得再好,在最终的用户环节,不还是得展示在 Android 或者 Chromium 里面?

并且在最新的 Google AI Studio 中,谷歌已经打通了从「网页 vibe coding」到「apk 导入手机」的整个链路:

图|MakeUseOf

这相当于在未来理想条件下,你的每一个个性化需求都可以通过 Gemini 找到解决方案:无论是文字回答,还是编写一个小 app 或者 widget。

正因如此,Gemini 的潜力才会显得如此之大——

它既不像 OpenClaw 那需要一定的技术水平才能用,又不像 ChatGPT 和 Claude 那样依赖别人的软件平台扩展自己的生态系统。

Gemini 不一定每项指标上都是世界第一,但互联网、智能手机、乃至现在的 LLM 都在反复证明一件事:

只要某个厂商或者技术可以提供一种尽可能「All in one」的服务模式,就能凭借人们追求省事的习惯,塑造大多数消费者的习惯。

而谷歌眼下在做的,就是 All in Gemini。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

“谷歌地球”上线飞行模拟器,玩家飞抵加沙:“美好家园全成废墟”!

作者 陈, 宇阳
2026年6月16日 10:00

【GameLook专稿,禁止转载!】

GameLook报道/6月13日凌晨,谷歌正式向所有用户开放了网页版Google Earth(谷歌地球)的“飞行模拟器”功能,这一原本用于休闲探索的更新,却意外成为了全球玩家审视战争残酷性的窗口。

在Reddit等海外社交平台上,大量玩家涌入该功能,通过驾驶虚拟飞机前往加沙地带、伊朗等地的战区上空进行“飞行游览”。当高清3D地图下那片被彻底夷为平地的废墟直观地呈现在眼前时,许多玩家在震撼之余,对战争的厌恶与对以色列行为的谴责情绪在网络上迅速发酵。

比新闻更震撼的加沙真相

谷歌地球此次更新的飞行模拟器功能,允许用户通过鼠标或键盘控制飞机,在全球范围内自由飞行。虽然官方强调该功能仅为“休闲探索”设计,并非专业的高保真度空力训练,且在极速飞行或网络不佳时可能出现画面加载延迟,但这并未阻碍玩家的热情。

与传统的新闻片段或平面卫星图不同,飞行模拟器带来的沉浸式第一视角,让玩家仿佛真的驾驶着一架飞机飞越战区上空。“上帝视角”与“驾驶舱视角”结合,极大地增强了视觉冲击力。

在众多玩家的自发探索中,前往加沙地带的飞行任务引发了最强烈的反响。

这一热潮部分源于Reddit上一个发布于去年的热门帖子,该帖子通过对比加沙战争中前后的卫星图像,展示了那片土地从繁华到废墟的巨大反差。帖子获得了超过9万的点赞和上万条评论,大量网友在帖下痛斥以色列惨无人道的军事行动。

2023年和2024年12月前后对比(俯瞰图)

2023年和2024年12月前后对比(俯瞰图)

借助谷歌地球的飞行模拟器,玩家们得以用动态的、立体的方式重访这片土地。当飞机飞越加沙上空,仪表盘下的景象不再是纽约或巴黎那样的都市景观,而是连绵不绝的废墟。

小学、住宅、医院等等建筑全部都被付之一炬,大片大片的灰色取代了他们。这种直观的视觉冲击,远比文字报道或静态图片更具震撼力。许多玩家在社交媒体上表示,亲眼目睹那被被炮火轰炸蹂躏后的地面情况后,才真正理解了战争的残酷性,对以色列“无差别轰炸”的行为感到极度反感。

被摧毁的加沙(飞行模拟器视角)

在探索过程中,玩家们也发现了谷歌地球在战区影像更新上的“潜规则”。由于战区地图的更新往往存在数月的延迟,且出于敏感性考虑,部分关键军事目标(如美军基地)可能不会显示最新状态,甚至可能出现马赛克或空白。这使得玩家很难通过该功能实时窥探最新的战况,例如伊朗近期遭受的打击痕迹在地图上可能暂时无法显现。

这也引发了关于地图数据来源的讨论。有自称参与谷歌地图卫星图供应的网友在Reddit上爆料,谷歌购买的卫星图并非最高精度的实时数据,很多时候是“别人吃剩下的”。这一说法一定程度上解释了为何战区影像往往滞后和商业地图产品在数据获取上的局限性。

结语:游戏化功能的意外之用

谷歌地球此次增加飞行模拟器,本意是通过游戏化手段提升产品的用户粘性和趣味性。然而,这一功能却意外地成为了全球玩家审视战争、反思和平的工具。当人们驾驶着虚拟的飞机飞越加沙上空,看到那片满目疮痍的土地时,娱乐的功能反而帮助远在千里之外的人们见证了现实的沉重。

❌
❌