普通视图

发现新文章,点击刷新页面。
昨天以前首页

谷歌用 AI 「杀死」谷歌,这场发布会看得人缺氧

作者 张子豪
2026年5月20日 05:52

Gemini App 月活超 9 亿,月 Token 处理量每月 3200 万亿,Nano Banana 生成超过 500 亿张图片……

在今天凌晨刚刚结束的 Google I/O 大会上,Google CEO  Pichai Sundar上来就抛出了这些数字。

过去一年,AI 成了所有行业的主旋律,Gemini 在 Google 的定位,也开始从一个独一的 App,成了所有 Google 产品里的最重要的 AI 底层能力。

这次发布会也先从模型开始,进一步带到 Coding 和 Agent 产品。

Gemini Omni 把 Google 的视频生成推向「世界模型」方向,Gemini 3.5 Flash 则是和 AI 编程工具一起推向 Agent 开发平台。

这两个能力随后进入 Google 的完整生态,搜索、Gemini App、Flow、Spark、Chrome、XR 眼镜和电商场景。

Gemini Omni 登场,视频界的「Nano Banana」时刻来了

发布会最先被重点展开的是 Gemini Omni。

DeepMind CEO 将 Gemini Omni 描述为一个能够「从任何输入创造任何内容」的新模型。它把 Gemini 的推理能力与 Google 既有的生成式媒体模型结合起来,目标是提升模型对世界的理解、多模态生成能力和编辑能力。

Google 强调,Veo、Nano Banana、Genie 等模型已经能生成视频、图片和交互式模拟,但 Gemini Omni 更进一步,开始处理动能、重力等更接近物理世界的问题。

发布会现场展示的案例包括蛋白质折叠解释视频。用户只需要输入类似「生成一个关于蛋白质折叠的黏土动画解释」的提示,Omni 就能把抽象科学概念转化成视频内容。

它还支持更自然的视频编辑。用户可以上传自己的视频,再用对话方式修改风格、加入元素、调整细节,甚至把一个普通圆形转成黑洞,把夜晚散步场景变成更具戏剧感的画面。

Google 的说法是,Gemini Omni 先从视频开始,之后会逐步走向「任意输入到任意输出」。这也是 Google 一直把 Gemini 设计成多模态模型的原因。

首个 Omni 家族模型 Gemini Omni Flash 已在上线到 Google 产品中,Omni Pro 会在之后公布更多信息。Gemini App 中的 Omni 功能也面向 Google AI Plus、Pro 和 Ultra 订阅用户开放。

这意味着,Gemini Omni 不只是一个视频生成模型。Google 想把它放进「世界模型」的叙事里:模型不仅生成画面,还要理解画面中的物理关系、运动关系和场景逻辑。

在进入 Gemini App、Google Flow 和 YouTube Shorts 这些应用之后, Omni 也会让 Google 的生成式创作工具从图片编辑扩展到视频编辑。

Gemini 3.5 Flash 上线,AI 写代码进入极速模式

如果 Gemini Omni 对应的是生成和编辑,Gemini 3.5 Flash 对应的就是速度、成本和执行能力。

Google 在发布会上推出 Gemini 3.5 Flash,称它是 Gemini 3.5 系列第一批模型之一,重点面向 agentic coding、长周期任务和真实工作流。

相比 3.1 Pro,3.5 Flash 在几乎所有基准测试中提升明显,尤其是代码能力,以及 GDPVal 这类更接近真实经济任务的评测。

Google 还强调,3.5 Flash 在输出 tokens 速度上比其他前沿模型快 4 倍,在 Antigravity 中经过专门优化后,速度可达到 12 倍。

值得一提的是,今年 3 月,Google 内部开发相关任务每天处理约 5000 亿 tokens,之后每隔几周翻倍,目前已经超过每天 3 万亿 tokens。Google 把这称为一个反馈循环,用大规模真实使用继续改进 3.5 Flash。

与模型同步推出的是 Antigravity 2.0。

它从原来的 agent powered IDE,升级为一个独立桌面应用,重点转向 agent first。用户不再只是让 AI 在编辑器里辅助写代码,而是通过 Agent 对话、Agent 产物和多 Agent 协同来完成开发任务。

Antigravity 2.0 加入完整 CLI、Antigravity SDK、Gemini 音频模型原生语音支持,并集成 Android、Firebase、Google AI Studio 等服务。Antigravity 2.0 作为独立桌面应用,也已经面向全球用户开放。

Google 在现场用一个高强度演示解释 Antigravity 2.0 的方向:让 Agent 从零构建一个可运行操作系统。这个任务由 93 个子 Agent 并行执行,持续 12 小时,发起超过 1.5 万次模型请求,处理 26 亿 tokens,从空项目生成调度器、内存管理、文件系统等核心模块。

Google 称,这件事在 Gemini 3.1 Pro 上无法完成,而使用 Gemini 3.5 Flash 消耗不到 1000 美元 API credits。

现场还演示了这个系统运行 SL 小火车程序和 Doom。由于系统最初缺少视频和键盘驱动,Antigravity 又继续生成相关代码并修复,让 Doom 能够运行。Google 还称,类似方式已经测试过照片编辑套件、实时消息应用、多用户协作平台等项目,原本需要多天的工程工作被压缩到数小时甚至更短。

Gemini 3.5 Flash 已面向所有用户开放,覆盖 Google 产品和 API。Gemini 3.5 Pro 仍在内部使用和改进中,预计下个月开放。

从搜索框到信息 Agent,Google 重做 AI 搜索

模型和开发工具之后,Google 把重点转向搜索。Google 搜索也就是 AI 搜索。

Google 表示,AI Mode 已经超过 10 亿月活,查询量自推出以来每季度翻倍。

今天起,AI Mode 升级到 Gemini 3.5。新的智能搜索框也从当天开始推送。它支持文本、图片、文件和视频输入,并在用户输入问题时给出 AI 建议。

AI Overviews 和 AI Mode 也被合并成更连续的 AI 搜索体验。用户可以先在主搜索结果页看到 AI 回答,再进入 AI Mode 继续追问,上下文会被保留。这个新搜索体验已在发布会当天面向全球桌面端和移动端上线。

更大的变化是搜索 Agent。

Google 表示,用户今年夏天可以在 Search 中创建信息 Agent,让它持续跟踪某类信息。例如,用户可以让它监控市盈率低于 15、现金流为正、负债较低的大型生物科技股票;也可以让它长期跟踪租房信息、球鞋联名和商品上新。当条件变化时,Agent 会给用户发送综合更新。

Google 还把 Antigravity 的 agentic coding 能力带入搜索。

之后搜索不只返回网页、摘要或卡片,也能为具体问题生成交互界面。比如用户问「黑洞如何影响时空」,Search 可以生成一个交互式视觉组件;继续追问「双黑洞如何产生引力波」,Search 会重新生成一个可调参数的动态界面。Generative UI with Antigravity 将在今年夏天面向所有用户免费推出。

更复杂的自定义体验也在路上。

Google 现场展示了一个周末计划器,Search 会结合天气、地图、用户偏好、Gmail、Calendar 等信息,生成一个可以继续修改、分享和同步日历的小型工具。这类自定义体验将在未来几个月先面向订阅用户开放。

关机也能跑,Gemini Spark 把 Agent 能力搬进个人生活

消费端最重要的新产品是 Gemini Spark。

Gemini Spark 是一个个人 AI Agent,运行在 Google Cloud 的专用虚拟机上,可以全天候执行任务。它由 Gemini 3.5 和 Antigravity harness 驱动,支持长时间后台任务。

用户关掉电脑后,Spark 仍能继续工作。它先接入 Google 自家工具,未来几周会通过 MCP 接入第三方工具。

发布会展示了 Spark 的几个典型场景。

用户可以让它汇总过去一周 Gemini Live 的发布和进展,从 Docs、Gmail 和聊天记录里提取信息,再用个人写作风格生成团队邮件。也可以让它管理街区派对,维护 Google Sheets RSVP 表格,跟踪谁带了什么东西,给没报名的邻居生成提醒邮件草稿,并自动生成 Google Slides 宣传页。

Spark 还支持手机端语音输入。

用户可以一次说出多项任务,比如把所有与 Sundar 的会标成亮粉色,给新邻居写邀请信,创建孩子学年结束前待办文档。Spark 会把这些内容分成多个独立任务,并在后台执行,结果可以在手机和电脑之间同步。

Gemini Spark 本周面向可信测试者开放,下周以 beta 形式面向美国 Google AI Ultra 订阅用户推出。

Google 同时推出每月 100 美元的新 Ultra 计划,并把最高档 Ultra 计划从每月 250 美元降至 200 美元。今年夏天晚些时候,Spark 将进入 Chrome,成为能在网页中执行任务的智能体浏览器。

Gemini App 大改版,还有 Google 版「AI 晨报」

Gemini App 本身也迎来了一次脱胎换骨的大改版。

Google 引入了全新的设计语言 Neural Expressive,加入流体动画、鲜艳色彩、新字体和触觉反馈。

新版 Gemini App 不再把回答呈现为大段文字,而是会根据内容实时生成更适合阅读和操作的布局,包括交互图片、时间线、嵌入式视频等。Neural Expressive 现在已经在 Android、iOS 和网页端全球推送。

Gemini Live 也被重做,打开后可以直接进入实时对话。区域口音选择将在未来几周推出。

Gemini App 还加入 Daily Brief。这是一个面向早晨使用的个性化摘要 Agent,会综合 Gmail、Calendar、Tasks 等信息,整理用户当天需要关注的事项,并给出下一步行动入口。

Daily Brief 今天起面向美国 Google AI Plus、Pro 和 Ultra 订阅用户推出。

在更大的 Gemini 叙事之外,Google 也更新了几个日常产品。

Google Maps 最近完成十年来最大升级,并加入 Ask Maps。它允许用户提出更长、更复杂的问题。例如,发布会举了一个场景:孩子掉进鸭塘,婚礼 30 分钟后开始,用户想知道哪里可以步行买到新裙子。

Docs 也获得新的语音创建能力。用户不需要输入精确提示词,可以直接用语音把想法说出来,让 Gemini 从 Drive 调取简历,从 Gmail 找到活动信息,再生成 Google Docs 草稿。这个能力将在今年夏天面向 Pro 和 Ultra 订阅用户推出,同类语音能力也会进入 Gmail。

生成能力升级后,内容来源识别也变得愈发重要。

Google 称,SynthID 推出三年来,已为超过 1000 亿张图片和视频,以及相当于 6 万年时长的音频加上不可见水印。接下来,SynthID 和内容凭证验证会扩展到 Search 和 Chrome。

用户可以通过圈选搜索,或者在 Chrome 中右键询问内容是否由 AI 生成,系统会显示内容来自 AI、相机,还是曾被生成式 AI 工具编辑。

Google 还宣布,OpenAI、Kakao 和 ElevenLabs 将采用 SynthID 2。此前英伟达已经加入 SynthID 体系。对 Google 来说,SynthID 不只是安全功能,也是争取 AI 内容透明标准的一部分。

Google 创作全家桶,开始围攻图片、设计和视频

在创意工具领域,Google 密集发布了多款重磅产品。

Google Pics 是 Google Workspace 中的新图片创建和编辑产品,面向派对海报、信息图、宣传图等场景。用户可以从一张基础图开始,删除元素、调整对象大小、编辑文字和翻译文字。Pics 生成内容会带有 SynthID 水印。Google Pics 将在今年夏天推出。

设计产品 Stitch 也迎来更新。用户可以通过一句 prompt 生成网站或应用界面,再通过文字或语音继续修改,比如放大标题、调整菜单、突出更多披萨选项。Stitch 支持把设计导出为代码,或直接发布网站,相关更新现已发布。

Google Flow 的更新尤为关注。Gemini Omni 进入 Flow 后,用户可以基于原始视频改变环境、添加视觉效果、加入新角色,同时尽量保留原有表演。

Flow 还加入新 Agent,支持一次执行多个动作。比如从单张图片生成 16 个不同机位的视频,或把一组清晨场景批量改成深夜场景。

Flow Tools 则允许用户在 Flow 中创建自己的创意工具,比如视频特效、手绘动画和文字分层工具,并支持分享和 remix。

Google Flow Music 可以把一段钢琴 riff 扩展成带风格方向的音乐 demo。Google Flow 和 Google Flow Music 的这些新功能已上线。

押注智能眼镜,Google 再闯下一代入口

硬件部分,Google 也把 Android XR 这个操作系统级平台,从头显、XR 设备,进一步扩展到智能眼镜形态。

Android XR 是 Google 与三星合作,并针对 Qualcomm Snapdragon 优化的平台。

Google 表示,AI 眼镜会分成两类:一类是带小型镜片的显示眼镜,另一类是音频眼镜。显示眼镜去年已在 I/O 展示,今年首批开发者已经开始创建显示体验,可信测试者计划将在今年晚些时候扩大。

更早上市的是音频眼镜。

Google 宣布,首批音频眼镜将在今年秋季推出,由三星参与硬件和体验构建,Warby Parker 与 Gentle Monster 负责眼镜设计。这些眼镜连接手机,支持 Android 和 iOS。Gemini 的回答通过耳机私密播放,而不是显示在镜片上。

发布会上,演示者可以通过眼镜让 Gemini 导航到上周和朋友见面的地方,中途加入咖啡店;也可以让 Gemini 打开 DoorDash 自动下单咖啡,等待用户确认;

还可以让它总结静音消息,并把家庭晚餐写入日历。眼镜还可以与手表配合,让用户拍摄现场照片,并用 Nano Banana 生成卡通图像,再在手表上预览。

发布会最后,Gemini 的使用场景也延伸到了网络安全场景。

Google 介绍了 CodeMender。它是一个代码安全 Agent,能够自动寻找和修复关键软件漏洞。Google 将邀请一批专家测试 CodeMender API,之后会更广泛推出。

整场发布会看下来,信息量大到让人有些缺氧。只是当这些 AI 功能真正开放给几千万、几亿人使用时,一个最现实的算账问题就直接摆在了面前:这笔庞大的算力开销,Google 要怎么挣回来?

过去二十多年,Google 代表的是一种典型的免费互联网模式。用户用注意力和数据换服务,Google 用广告和分发赚钱。这套模式让 Google 成为互联网时代最强的基础设施公司。

但大模型推理的成本,和查询一次搜索结果完全不在一个量级。

长上下文记忆、多模态生成、跨应用 Agent、企业级自动化,这些能力背后都是持续运行的算力消耗。AI 越深入,Google 越难继续用「免费功能升级」的方式来消化成本。

这就是为什么整场发布会下来, Google I/O 看似讲的是体验升级,背后指向的却是订阅、企业合同、算力账单和长期服务费。

免费入口当然不会消失,因为那仍然是 Google 获取用户、数据和生态位置的基础。但在这些入口之上,Google 正在叠加一个新的智能服务层:更强的模型、更长的记忆、更深的系统权限、更复杂的任务执行,以及更稳定的企业级服务。

换言之,Google 正在从免费互联网服务公司,进一步变成 AI 订阅基础设施公司。

只是,问题也随之而来,用户愿意为搜索付费吗?通常情况下,不会。

可是,如果这是一个能替你全天候处理邮件、统筹任务、分析报表、接管智能家居,甚至还能帮你写代码开发 App 的「超级全能助理」呢?你愿意为它每月掏出几十上百美元吗?

这,正是今年 Google I/O 迫切想要验证的核心商业命题。而环顾如今狂热的市场,答案似乎早已不言而喻。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Google 大舉擴張 Gemini for Home 提供公版設計加速智慧家庭生態系

作者 Mash Yang
2026年5月22日 20:45

Google 推出全端 AI 解決方案,向硬體廠商提供公版參考設計,加速 Gemini 內建裝置量產,企圖複製 Android 成功模式。

為了讓生成式AI徹底融入你我的居家生活,Google 正在祭出更具侵略性的硬體擴張策略。Google宣布,旗下「Gemini for Home」訂閱方案已經正式升級為全端AI (Full-stack AI)解決方案,並且全面擴大「Google Home Gemini built-in」計畫。

透過向合作夥伴提供包含系統單晶片 (SoC)、感測器與麥克風在內且經過全面驗證的「公版參考設計」,Google試圖讓第三方廠商能直接跳過漫長的研發階段,快速量產內建Gemini的智慧攝影機與智慧音箱。

當AI大戰從雲端伺服器打到消費者的客廳與臥室,Google顯然不打算只靠自家的Pixel或Nest設備單打獨鬥,而是準備複製Android的成功模式,用「公版硬體+AI軟體」打一場漂亮的生態系團體戰。

加速硬體落地:從「大腦」到「公版設計」一手包辦

過去,傳統家電或保全廠商若想在設備中加入最先進的AI語音助理,往往需要投入數年的研發資源進行軟硬體整合與調校。

為了解決這個問題,Google這次將Gemini的功能與Google Home API進行深度整合,轉變為一套全端AI方案。更具破壞性的是,Google直接向電信商、ISP網路服務供應商以及保全公司,提供了一套可擴展的「公版參考設計」 (Reference designs)。

這套設計由Google合作夥伴打造,內建符合Gemini運算標準的晶片、感測器陣列與麥克風。硬體製造商只需套用這套設計,就能快速大規模量產具備高階AI控制能力的智慧攝影機與智慧音箱。

Nest Aware訂閱方案走入歷史,全新AI訂閱服務上線

除了降低硬體製造門檻,Google也正積極推動這些合作夥伴,將其硬體設備與Google全新的智慧家庭訂閱服務綁定。

過去廣為人知的雲端監控訂閱服務「Nest Aware」,目前已經正式更名為「Google Home Premium AI」,並且加入多項基於Gemini模型的新功能:

• 家庭簡報 (Home Brief):當使用者外出時,AI會自動彙整家中的活動與異常狀況,生成精簡的摘要報告。

• 進階嚇阻 (Advanced deterrents):當系統偵測到家中無人時,能透過AI自動化連動燈光與音響設備,模擬出「有人在家」的假象,進而嚇阻潛在的入侵者。

訂閱費用方面:

• 標準版 (Standard tier):每月10美元或每年100美元。若使用者已經是Google AI Pro (每月20美元)的訂閱戶,將直接免費包含此標準版方案。

• 進階版 (Advanced tier):費用為標準版的兩倍 (每月20美元或每年200美元)。而每月要價高達250美元的頂規Ultra訂閱用戶,則涵蓋此進階版服務。

強勢推進:Home App全面擁抱Gemini

Google將Gemini推向所有產品線的決心已無庸置疑。去年在全球發布的全新改版Google Home App中,介面設計已經完全以AI助理為核心。App內新增醒目的「Ask Home」 (詢問家庭)按鈕,如果使用者仍習慣使用過去未具備生成式AI能力的Google Assistant,系統也會不斷跳出提示、鼓勵,甚至半強迫用戶註冊、升級至Gemini AI體驗。

用「Android 模式」包抄智慧家庭戰場

從這次的發布可以看出,Google在智慧家庭領域的戰略已經發生根本性的轉變。

Google明白,要讓Gemini真正成為「無所不在」的AI管家,單靠自家第一方硬體 (Nest系列)的普及速度太慢了。透過提供「公版參考設計」,Google實際上是在降低硬體製造門檻,吸引大量的白牌廠商或傳統保全業者加入Google Home陣營。這與當年用Android系統免費授權加上公版晶片,迅速淹沒全球智慧型手機市場的打法如出一轍。

對於不想被Google綁架隱私的使用者來說,市面上仍有蘋果HomeKit或開源的Home Assistant等相對強調本地端控制的選擇。但無可否認的是,當「擁有頂級AI能力的智慧攝影機」製造成本被Google大幅壓低後,未來市面上恐怕很難再找到未內建Gemini的平價智慧家庭設備了。

Google 執行長揭示代理型 AI 戰略 直面「零流量」隱憂

作者 Mash Yang
2026年5月27日 12:52

Google 暨 Alphabet 執行長 Sundar Pichai 於 Google I/O 2026 後表示,代理型 AI 將顛覆搜尋引擎運作,並強調優質內容仍有價值,但低品質流量將被過濾。

在今年Google I/O 2026開發者大會落幕後,Google暨Alphabet執行長Sundar Pichai接受The Verge網站專訪,不僅詳細剖析Google為了迎戰AI時代所進行的底層組織重整,更深入探討由Gemini驅動的「代理型AI」 (Agentic AI)將如何徹底顛覆搜尋引擎的運作邏輯。而面對出版商與媒體業日益嚴峻的「Google零流量」 (Google Zero)恐慌,以及DeepMind執行長直言人類已經站在「奇異點山腳下」 (Singularity)的破釜沉舟之語,Google展現出前所未有的強勢與野心。

從「搜尋優先」到「AI優先」的痛苦重組

面對ChatGPT掀起的生成式AI浪潮,Google過去兩年經歷劇烈的內部重組。Sundar Pichai在訪談中坦言,為了讓這艘科技巨艦能以「AI優先」 (AI-first)的姿態全速前進,必須做出幾項極為關鍵且艱難的決策。

首先,是將兩大頂尖研究團隊Google Brain與DeepMind合併為Google DeepMind,藉此集中研發火力。其次,設立統一的AI基礎設施團隊,並且指派首席AI架構師來統籌全局。

在消費端產品線,搜尋部門也迎來新的高層重組,並且導入嚴格的每週AI產品高階審查機制。Sundar Pichai強調,在這種規模的企業中,決定組織靈活度的往往不是決策有多完美,而是「做決策的速度」。

代理型AI佈局:從企業端全面走向消費市場

回顧上個月在拉斯維加斯Google Cloud Next 2026大會現場所見,Google企圖透過AI代理 (AI Agents)重塑企業工作流程的野心已經展露無遺。而從這次訪談可以看出,這股浪潮正全面推向廣大的消費端市場。

Sundar Pichai指出,我們正處於將語言模型從「單純對話」推向「工具調用與任務執行」的過渡期。未來的Google搜尋將不再只是給予「藍色連結」,而是會透過底層的Gemini Spark與Antigravity等代理工具,直接幫使用者完成任務。

當你搜尋「規劃一趟旅行」時,AI將在背景默默調度多個代理程式,為你生成專屬的應用介面與行程。Sundar Pichai認為,這些散落在各處的AI體驗,最終都將無縫收斂在同一個使用者介面下。

「Google零流量」的媒體夢魘,Sundar Pichai如何接招?

隨著Google搜尋結果頁面頂端大量出現「AI總覽」 (AI Overviews),已經讓出版業與內容創作者的焦慮達到頂點。指標性媒體集團康泰納仕 (Condé Nast)執行長近期甚至悲觀地向內部喊話:「要把Google帶來的搜尋流量當作『零』來制定商業計畫」。

面對「Google零流量」的質疑,Sundar Pichai的回應顯得相當強硬且自信。他反駁搜尋流量將歸零的說法,並且指出資訊生態系正在劇烈演變,使用者現在會透過短影音、Podcast等更多元的管道獲取資訊。

Sundar Pichai強調,Google依然致力於將使用者導向優質的網路內容,系統甚至會根據使用者的「付費訂閱紀錄」,優先推播該媒體的內容。但他也坦言,隨著AI技術進步,「低品質的點擊」 (Bounce clicks)將被自然過濾。這意味著,未來只有具備極高不可替代性的原創內容,才能在AI搜尋引擎的過濾網中存活。

分析觀點:奇異點逼近,與網路流量的重新分配

在這場訪談的尾聲,Sundar Pichai附和DeepMind執行長Demis Hassabis的觀點,即認為人類目前正站在「奇異點 (AGI,通用人工智慧)的山腳下」。雖然Sundar Pichai不願給出AGI實現的具體時間表 (如3年或5年),但他明確表示:「時間表已經不重要了,因為我們面對的系統即將變得『非常、非常強大』」。

從產業鏈的角度來看,Google正在利用其無可匹敵的基礎設施與算力,進行一場重新分配網路權力的豪賭。

當AI代理接管使用者的任務需求,傳統網站的「首頁」與「流量變現模式」將遭到毀滅性的打擊。Google試圖告訴外界,他們並沒有要殺死開放網路,而是要讓網路變得「更有用」。

但殘酷的現實是,在這個由Gemini代理人主導的新世界裡,內容創作者與企業若不能將自己的數據與服務,轉化為能夠被AI輕易讀取與調用「資料」,就極有可能在這場「奇異點」的演進中,徹底從使用者的視線中被抹除。

❌
❌