阅读视图

发现新文章,点击刷新页面。

Open Minis:可能是 iOS 端最强 AI Agent

在此前《软件 AI 化,势不可挡|AI Agent 是什么?》的文章里,详细总结了下 AI Agent,青小蛙觉得可以更简单的理解:

AI Agent,就是 AI 代理人:它替人类工作,帮你操作电脑,自己决定怎么做,并持续执行,就像牛马一样,给定目标,完成目标。

Open Minis:可能是 iOS 端最强 AI Agent 47

Open Minis 是什么?

几天前,论坛中接连有人介绍 Open Minis,非常棒的一款免费应用,它有点类似 OpenClaw,在 iOS 里控制一套完整的 iSH (Alpine Linux) 虚拟机,有终端,有浏览器。

获取

一起来看下这两篇文章:

@RavelloH【免费】可能是 iOS 端最强 AI Agent App:Minis

你或许听说过或用过 Manus,它能在其云端运行虚拟机或者有头浏览器,并且能自己运行命令或者操控网页。

Manus、Claude Code 和 Codex

在 Manus 同期,实际上像是 Claude Code 或者 Codex 这样的 AI Agent App 也能靠 PlayWright 来达到类似的效果,这样你就可以在本地来让 AI 进行作业了。

之后 OpenClaw 其实是在这个基础上,集成了各类渠道,这样你就可以用聊天软件直接发消息让 bot 执行命令。

但这终究有局限性,你会发现这些方式都不能很好的和你的手机进行交互,你的手机只是一个给 AI 发消息的工具,AI 却不能反过来使用你的手机。

我最近发现了一个比较好的软件: Open Minis

Open Minis 能通过在本地模拟运行一个 Linux 虚拟机(魔改 iSH),并通过命令行工具来读取 iOS 的设备端功能,例如地图、照片、日程、闹钟等。

Open Minis 可以:

  • 执行 Linux 命令
  • 下载其他命令行工具
  • 操控浏览器等

并且也有 skills记忆的支持,你可以认为 OpenClaw 能做到的,它也能做到。并且由于能读取设备端能力,所以可能实际体验要更好。

多说无益,上图

Open Minis:可能是 iOS 端最强 AI Agent 48
Open Minis:可能是 iOS 端最强 AI Agent 49
Open Minis:可能是 iOS 端最强 AI Agent 50

此外,也支持使用快捷指令执行定时任务。或者,你可以这样将其改成使用 Action Button 即可触发的全局 ai 助手:

Open Minis:可能是 iOS 端最强 AI Agent 51
Open Minis:可能是 iOS 端最强 AI Agent 52

Open Minis上架了,手机端“龙虾lobster”,解锁Agent能力

@RachelSherman 同学说:AI帮我写的文案,味道有点大,轻喷,我不是开发者,觉得很好用,分享一下

青小蛙手动总结一下吧:

  • iOS 系统里内完整的 iSH (Alpine Linux) 虚拟机。
  • 安装各种 Linux 工具
  • 运行 Skills(支持 node 和 python)
  • 读写文件
  • 调用命令行和 API
  • 接入 iOS 原生应用
  • 两种 API 接入方式:登录 / API
  • 自带环境变量
Open Minis:可能是 iOS 端最强 AI Agent 53
Open Minis:可能是 iOS 端最强 AI Agent 54
Open Minis:可能是 iOS 端最强 AI Agent 55
Open Minis:可能是 iOS 端最强 AI Agent 56

原文:https://www.appinn.com/open-minis/

非常不错的应用,开发者更新频繁,并且 TestFlight 测试版本还有名额,想尝试的同学不要错过哦。


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例)

你有没有试过这样一种感觉:有些事情,你明明知道 iPhone 能做,但就是懒得打开 App,一步步操作。
现在不太一样了,创建日历、记录咖啡摄入、自动生成视频……
iPhone 开始可以自己把这些事做完了。

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 42

昨天介绍了:Open Minis:可能是 iOS 端最强 AI Agent 之后,看到开发者这些天陆陆续续转发的一些案例,非常有趣,也很实用。

青小蛙总结了 11 个 iPhone 开启 Open Minis 后能做的事情,它只有 49.8 MB 的大小。

你觉得还能做什么呢?

不用打开日历:分享一下内容,就自动帮你创建日程

将带有时间、地点、事件的内容直接分析给 Minis,就可以创建日历:(via

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 43

直接读取健康数据:你的身体情况,它比你更清楚

让 Minis 直接读取并分享健康信息:(via

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 44

用 Apple Watch 数据,帮你分析心脏状态

直接让 Minis 读取 Apple Watch 中的数据,分析健康情况(via

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 45

不用打开 Spotify:一句话搜歌、切歌播放

将图片发给 Minis,让他通过 Spotify Skill 搜索歌曲、切歌播放。

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 46

自动帮你剪视频:从素材到成片,一步完成

这个看起来有点离谱了,流程大概是这样的:(via

  1. 分析了两位B站Up主的历史视频
  2. 分析播放量较大的科技、AI类视频博主,他们的共同特性
  3. 策划视频(TTS 口播稿、图片类视频)
  4. 可以直接看成品视频

刷到 TikTok 好歌?一键整理成 YouTube Music 歌单

这个效果也不错,将 TikTok 评论截图发给 Minis,并最终导出到了 YouTube Music 歌单中:

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 47

早上不用设闹钟了:自动读新闻 + 生成语音叫你起床

这也是一个很有趣的流程,你可以根据自己感兴趣的内容来源,让他帮你自动生成音频,在早上的时候播放出来,替代闹钟。

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 48

群消息不用盯:自动检测重点内容并加入提醒

这是开发者 @Ethan 自己的用途,它的社群消息有非常多的用户反馈,使用 Minis 读取反馈,整理信息,最终写入系统提醒应用中。

后续,当修复了 Bug 之后,还会自动对照代码库,标记完成。

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 49

打开网页 → 自动整理成一份可用的笔记

这里有一个例子,将 xiaohongshu-cli 的 GitHub 页面直接给它,让他整理为笔记文档,最终在 iOS 笔记应用中,看到了整理后的使用笔记:(via

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 50

拍一杯咖啡 → 自动记录你的咖啡因摄入

青小蛙觉得,数字化人生在这一刻才变的有意义。(via

直接拍照两颗胶囊咖啡,然后让它记录到健康中。再结合之前的自动分析健康数据,闭环了。

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 51

批量设置复杂的闹钟提醒

对于一些复杂的重复性操作,交给 Minis 简直太爽了。(via

比如这个例子中,让 Minis 设置了很多个起床闹钟,自动,不动手。

如果是以往,你需要一个一个手动处理,还容易出错…

iPhone 已经能替你干活了:不用打开 App,剪视频、分析健康数据、整理歌单(11 个案例) 52

获取免费的 Open Minis


原文:https://www.appinn.com/iphone-automation-11-real-use-cases/


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

当 AI Agent 走向无处不在,MediaTek 想做的不只是手机芯片

如果说大模型最早带来的冲击,是让用户开始习惯和机器进行自然语言对话,那么 Agent 的下一步,则是让 AI 从「回答问题」走向「完成任务」。它不再只是一个聊天窗口,而是可以理解场景、拆解任务、调用应用、协同设备,并在更长周期里记住用户偏好的系统级能力。

对于许多人来说,AI 是一个 ChatBox,更是一个 AI Agent。

过去,手机、平板、PC、汽车、耳机、手表等设备,更多是在各自的硬件形态和操作系统里提供功能;而在 Agent 普及之后,终端之间的边界会被进一步打散。用户真正需要的,不一定是打开某个 App,完成某个孤立操作,而是在一个连续的生活场景里,让手机、汽车、IoT 设备和云端服务协同起来,主动给出更合适的服务。

过往二三十年的时间里,智能设备的芯片从决定最主要的运算任务,变为决定跑分、功耗、游戏和影像能力的底层硬件,现在,芯片也需要成为 AI 体验的入口、算力底座和生态接口。

这就是 MediaTek 在天玑开发者大会 MDDC 2026 上想要传递的核心信息:一方面通过手机、汽车、IoT 和 AI 基础设施等全栈产品组合,提供覆盖多场景的算力底座;另一方面,则通过天玑 AI 智能体化引擎、AI 开发套件、汽车平台和游戏技术,向开发者开放更多能力。

天玑 AI:从端侧算力,到系统级 Agent OS

在 AI Agent 的落地过程中,手机仍然是最关键的终端之一。

原因并不复杂。手机拥有最密集的用户数据、最高频的使用场景,以及最成熟的应用生态。它既是个人信息的入口,也是跨设备协同的枢纽。因此,当 Agent 从应用层走向系统层,手机很自然会成为智能体化体验的第一现场。

过去三年,天玑 AI 生态圈实现了明显增长:生态伙伴成长量提升至 240%,天玑 AI 开发套件下载量提升至 440%。MediaTek 也提到,智能体自主任务量已经从 2025 年每日 1.2 亿次,增长至 2026 年每日 8.7 亿次,一年增长 7 倍。这些数据至少说明,Agent 已经不再只是概念层面的未来叙事,而是开始进入开发者和用户体验的增长通道。

为了应对这一趋势,MediaTek 在大会上发布了天玑 AI 智能体化引擎 2.0。

相比 1.0 版本更多由用户指令驱动、通过 App 独立执行单一任务,2.0 版本的关键变化在于主动感知驱动。借助天玑 SensingClaw 技术,天玑平台可以提供低功耗的全时感知能力,让设备制造商打造具备主动感知和跨应用驱动能力的 Agent OS。

换句话说,未来的 AI 助手不只是「你说一句,它做一步」,而是能基于视觉、听觉、位置、环境状态等信息,提前理解用户所处的场景,并调动不同应用和设备完成更复杂的任务。

在大会现场,MediaTek 公布了与 OPPO、Xiaomi 和传音的合作案例。

天玑能力将赋能 OPPO 小布助手,打通系统级原生应用数据,并结合小布记忆建立用户专属记忆数据库。它可以完成体检报告解读、自动规划健身计划并导入日历等任务。小米这边,重点放在跨端智慧体验上,用户通过一句指令,即可调用全场景设备执行任务,实现任务在多设备之间的流转。传音则更强调 Always On 主动感知能力,比如 AI 助手可以在免唤醒、自运行的状态下,完成查物流、比价等复杂任务。

三家头部手机品牌的案例其实都在说一件事,AI Agent 不再只是手机里的一个应用,而是正在成为系统层能力的一部分。它既需要芯片端提供足够高的 AI 算力,也需要端侧持续感知能力,还需要隐私、安全和应用生态之间的协同。

开发套件 3.0:让端侧 AI 更容易落地

如果说 AI 智能体化引擎面向的是系统级体验,那么天玑 AI 开发套件 3.0 则是面向开发者的工具箱。芯片平台企业一直强调端侧 AI 的价值:响应速度更快、隐私保护更好、离线能力更强,也能降低对云端资源的依赖。

不过真正把模型放到手机、平板、车机等终端上,并不是简单的「搬运」,开发者往往要面对模型压缩、算子兼容、功耗控制、内存占用、部署效率等一系列工程问题。天玑 AI 开发套件 3.0 正是为此而来。

3.0 版本首先支持 LVM 模型可视化部署,从命令行升级到 GUI 模块化,参数设置可以实时生效,模型部署和调优效率提升 50%。对于很多应用开发者来说,这降低了从模型到终端运行之间的门槛。

新增的 Low Bit 压缩工具包,可以降低生成式 AI 模型压缩过程中的设备内存占用,在相同质量下模型压缩率提升可达 58%。这对于端侧大模型尤其关键,因为终端设备的内存、功耗和散热空间都更加有限。eNPU 开发工具包可以帮助开发者充分发挥天玑芯片中超能效 NPU 的优势,让常驻轻载 AI 模型功耗节省 42%。对于 Always On 感知、语音唤醒、环境识别等场景来说,低功耗比峰值算力更重要。AI 要真正做到随时在线,就必须先解决「一直运行」带来的能耗问题。

天玑 AI Partner 作为一站式模型端侧转换助手。它可以支持模型分析、调整、验证等流程自动化,帮助开发者将原本可能需要 5 天的模型转换工作压缩到半天左右,端侧 LLM 模型部署耗时节省可达 90%。

从这些升级可以看出,MediaTek 并不只是把 AI 算力作为芯片参数来展示,而是在试图补齐开发流程中的关键环节。对于开发者来说,端侧 AI 的真正门槛并不只有「芯片够不够强」,还包括「工具链够不够顺」「模型适配够不够快」「优化成本能不能降下来」。

汽车平台:从智能座舱,到 AI 定义汽车

过去几年,「软件定义汽车」已经成为行业共识。智能座舱、智能驾驶、整车 OTA 和车云服务,让汽车从一个以机械结构为核心的交通工具,变成了持续更新的智能终端。而随着大模型和 Agent 技术进入车内,行业又开始进入「AI 定义汽车」的新阶段。

在 MediaTek 的判断里,汽车正在从单纯的交通工具,进化为懂用户、预测用户需求、无缝融入生活的智慧第三空间。MediaTek 车用平台已经与全球 20 家以上头部车企开展深度合作,在手项目超过 190 个,累计出货量达到 3500 万套,近 5 年出货量增长接近 4 倍。这说明 MediaTek 进入汽车领域并不是从零开始。它把手机芯片平台中积累的性能、能效、连接、影像、AI 和生态经验,迁移到了更长生命周期、更高安全要求的汽车场景中。

在天玑智能座舱方案中,MediaTek 将未来座舱的能力分为几个关键方向:全模态交互、主动式服务、并发指令执行和端云协同。

这与传统车机语音助手有明显差别。过去的语音助手往往是被动响应,用户说一句,它执行一个固定任务;而未来的智能体座舱,需要能识别车内人员、理解环境状态、判断用户意图,并把导航、社交、地图、餐饮、支付等服务串联起来。

比如在大会案例中,工作日早上用户带孩子上车后,系统可以自动识别乘车人员,并主动询问是否需要先送孩子上学再去公司,甚至根据时间推荐顺路买咖啡。这类场景的价值,不在于单点功能有多新,而在于车机从「工具」变成了「上下文理解者」。

要实现这样的体验,底层平台必须解决三类问题。

第一是平台层。车端需要高效运行大参数 AI 模型,还要支持多模型、多任务并行。MediaTek 提到,天玑旗舰座舱平台可以提供最高 400 TOPS 的 AI 算力,并通过软硬协同架构,将 AI 平台需求压缩 90%。在五屏重度渲染场景下,仍可流畅运行双大模型,速度超过 50 token/s。

第二是模型层。汽车的生命周期往往长达 6 到 10 年,但 AI 模型的迭代周期可能只有几个月。如何让车辆在整个使用周期内持续用上新模型,是智能座舱必须解决的问题。天玑座舱 7 系列直接集成 NVIDIA GPU 资源库,支持基于 CUDA 开发的新模型和算法迁移到座舱平台;天玑座舱 S 系列则支持天玑 AI 开发套件,帮助主流模型及其衍生模型更快完成适配。

第三是应用层。天玑软件平台提供场景映射、智能模型加载、端云协同和系统调优等工具。比如端云协同可以在复杂任务需要云端处理时,由端侧先完成需求预处理和筛选,只上传关键 token,在保护隐私的同时降低云端成本。

汽车 AI 并不等于把手机助手搬进车机,车内是一个多用户、多模态、多屏幕、高安全要求的环境。它既要理解驾驶员,也要理解乘客;既要提供娱乐,也要避免干扰驾驶;既要依赖云端能力,也要保证本地响应和隐私安全。因此,汽车 AI 的挑战比手机更复杂,也更考验平台级能力。

游戏技术:移动端正在靠近主机级体验

在 AI 之外,游戏仍然是天玑平台展示性能和生态能力的重要场景。

移动游戏的体验升级,过去主要围绕高帧率、高画质和低功耗展开。现在,随着移动 GPU 能力提升,以及游戏内容向 3A 化发展,移动端开始追求更真实的光影、更精细的模型、更低延迟的音频和更长时间的稳定运行。

本次大会上,MediaTek 重点介绍了 Ray Tracing Pipeline,也就是 RTP 移动端光线追踪技术。与传统光追方案相比,RTP 的目标是跨端适配 PC 与 Mobile 的渲染管线,实时呈现复杂游戏光影效果,包括动态物体、骨骼动画,以及视野外环境和物体反射。

MediaTek 已经与腾讯《三角洲行动》项目组合作预研新的 RTP 技术方案。它的意义在于,如果 PC 端渲染管线可以更顺畅地迁移到移动平台,那么跨端 3A 游戏的开发周期和适配成本都有机会被降低。

另一个重点是虚拟几何体技术。MediaTek 天玑与团结引擎深度适配 Virtual Geometry,依托天玑移动平台 GPU 渲染能力,在移动端环境下实现超过 10 亿级三角面渲染,并在 1.5K 高分辨率下持续输出 1 小时满帧体验。这意味着手机游戏在模型精细度上的限制,有机会进一步被突破。

音频方面,天玑 LE Audio 低延时技术通过全链路优化,在天玑旗舰移动平台上带来 32 ms 的低延迟蓝牙立体声表现。该技术已经在《和平精英》测试服中落地,用于降低音频延迟。对于竞技游戏而言,音频延迟并不是感知层面的微小差异,而可能直接影响玩家对敌方位置和操作节奏的判断。

此外,天玑平台还展示了 GPU Dynamic Cache、天玑倍帧技术 3.0、自适应调控技术 5.0,以及面向安卓游戏开发者的一站式分析和调优工具 Dimensity Profiler 2.0。

GPU Dynamic Cache 架构允许 GPU 同时调度系统缓存和内存,让开发者可以通过系统缓存传输关键游戏数据,节省带宽并降低功耗。目前,该技术已与《逆战:未来》《暗区突围》等游戏合作。

天玑倍帧技术 3.0 则新增 Depth 等选项,可以更好预测并生成高质量虚拟帧,支持 165 帧和 144 帧,也支持 UE、Unity 等引擎插件接入,并覆盖手机、平板和座舱平台。《王者荣耀》可借此解锁 144 帧低功耗体验,《明日方舟:终末地》也获得更高流畅度和更低功耗表现。

自适应调控技术 5.0 新增智能帧控和场景预判功能,可以让芯片、游戏和屏幕之间的信息流动更细。以《鸣潮》为例,合作后 1% low 帧和功耗指标都有明显优化;《和平精英》等游戏也能在重载场景下实现 CPU 和 GPU 负载降低。

这些技术共同说明,移动游戏的优化已经不再是芯片厂商单方面拉高性能,也不是游戏厂商单方面压缩画质,而是软硬件协同越来越深入。芯片、引擎、游戏内容、调优工具和开发流程,都在被重新打通。

MediaTek 还将端侧 AI 引入游戏场景。大会现场公布了天玑 AI Play 与《三角洲行动》的合作成果,借助天玑移动平台的端侧 AI,让游戏内 CC 语音智能伴侣响应更快,相比云端延迟大幅降低 56.7%。这意味着,AI 在游戏中的角色,不只是 NPC 或剧情生成,也可以进入语音交互、实时陪伴、战术辅助等更即时的体验场景。

过去谈移动芯片,行业更习惯讨论 CPU、GPU、NPU、影像 ISP、制程工艺和功耗表现。但在 AI Agent 和多终端协同的趋势下,芯片平台的竞争正在变得更复杂。它既要有足够强的底层算力,也要有开发套件、模型工具、跨端能力、系统接口和合作伙伴网络。

这也是为什么 MediaTek 在大会上反复强调开发者与生态。

AI Agent 的落地不会只由芯片厂商完成,系统厂商需要把 Agent 变成原生能力,应用开发者需要把功能重新智能体化,终端厂商需要解决跨设备流转,汽车厂商需要把 AI 与车内传感器、座舱系统和云端服务结合起来,游戏厂商则需要在高画质、高帧率、低功耗之间找到新的平衡点。

未来用户评价一台手机、一辆车,甚至一个 IoT 设备时,可能不再只看硬件参数,也会看它能不能理解自己、能不能主动完成任务、能不能在不同场景之间自然流转。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Hermes Desktop 讓 Windows 直接就能安裝使用 Hermes Agent!初學者也能自己搞定

近期因為穩定且具備自我進化能力的開源 AI Agent 專案:Hermes Agent,深受廣大使用者喜歡,但 […]

The post Hermes Desktop 讓 Windows 直接就能安裝使用 Hermes Agent!初學者也能自己搞定 appeared first on 電腦王阿達.

💾

前陣子為大家介紹了 OpenClaw(龍蝦),相信不少人遇到它容易忘記步驟、把自己搞掛,甚至每次更新就出現嚴重 BUG 的窘境 。這集影片為大家帶來全新的救星:Hermes Agent !它是由美國 AI 公司 Nous Research 所開發,操作體驗幾乎跟龍蝦一模一樣,還能直接繼承龍蝦的設定與技能 。更棒的...

AI Agent 爆發時刻:Andrej Karpathy 說「我現在幾乎不再自己寫 code」

OpenAI 早期工程師、前 Tesla AI 總監 Andrej Karpathy 日前接受知名 AI 播客 […]

The post AI Agent 爆發時刻:Andrej Karpathy 說「我現在幾乎不再自己寫 code」 appeared first on 電腦王阿達.

💾

Source:https://www.youtube.com/watch?v=kwSVtQ7dziU在這集訪談中,Andrej Karpathy 深入分享他近期對 AI Agent、Coding Agent、自動研究、開源模型與未來軟體開發的觀察。Karpathy 提到,從 2024 年底開始,他自己的寫程式工作...

黃仁勳盛讚 AI 代理是下一個 ChatGPT 親解 Vera Rubin 量產進度

NVIDIA 執行長黃仁勳提前抵台,首場活動聚焦 OpenClaw 與代理式 AI 發展,並強調 Vera Rubin 將是電腦史上最大規模量產,展現硬軟整合的市場競爭策略。

原先外界預期將於5月27日抵台的NVIDIA執行長黃仁勳,結果行程意外大幅「超車」,提前於今日 (5/23)下午4點30分便飛抵台北松山機場。而剛下飛機,黃仁勳便馬不停蹄地直奔南港瓶蓋工廠,參加NVIDIA台北開發者大會「Meet‑A‑Claw」活動。

在今年的COMPUTEX 2026正式開展前,黃仁勳的焦點不再只是侷限於硬體算力,而是全面轉向代理式AI (Agentic AI)應用發展。在接受媒體聯訪時,黃仁勳針對下一代Vera Rubin伺服器平台的出貨狀況、中國市場策略,以及AMD日前宣布對台投資100億美元的舉動作出回應。

全民「養龍蝦」:OpenClaw成為代理型電腦的新OS

黃仁勳抵台的首個公開行程「Meet‑A‑Claw」,完全聚焦於今年在全球開發者社群爆紅的開源AI工具OpenClaw,以及NVIDIA在今年3月順勢推出的企業級代理平台NemoClaw,協助企業建構專屬、安全的代理式AI工作流。

在聯訪中,黃仁勳更分享其私底下的AI使用習慣,透露自己平常在工作上會使用Anthropic的Claude來協助處理任務,而他的兒子更是將AI代理技術應用在家庭中,透過設定多個AI代理來自動管理家務與日常排程。

▲NVIDIA台北開發者大會「Meet‑A‑Claw」活動

Vera Rubin準備就緒:電腦史上最大規模的產品量產

針對外界高度關注的下一代AI伺服器平台「Vera Rubin」,黃仁勳表示Vera Rubin平台將是NVIDIA史上最成功的產品世代,更是電腦歷史上最大規模的產品量產。面對近期市場傳出HBM記憶體成本上漲與良率的挑戰,黃仁勳強調NVIDIA已經透過強大的供應鏈管理與台積電緊密合作克服難關,並且預告Vera Rubin將引入更先進的矽光子 (Silicon Photonics)技術,解決巨量資料傳輸的功耗與頻寬瓶頸。

▲AI伺服器平台「Vera Rubin」

此外,針對近期市場上關於LPU (語言處理單元)是否將取代GPU成為推論主流的爭論,黃仁勳也強調GPU在通用性、軟體生態系 (CUDA),以及處理複雜多模態代理任務上的絕對優勢,是單一功能晶片無法輕易取代的。

而在此回應的另一個層面,黃仁勳顯然更認為以ASIC設計的運算元件雖然在特定推論應用佔據優勢 (例如Google的TPU),但在放長遠的運算佈局來看,GPU無論是在加速運算、通用運算依然有更高性能與彈性表現。

回應競爭與地緣政治:AMD的100億美元投資與中國市場佈局

面對AMD執行長蘇姿丰日前宣布將在台灣投資100億美元建置AI基礎設施與先進封裝,黃仁勳則展現身為市場霸主的從容。

黃仁勳回應指出,AI市場的大餅正以驚人速度擴大,歡迎任何有助於推動整體運算生態系發展的投資,但他強調NVIDIA與台灣供應鏈 (從台積電的晶圓代工、先進封裝到各大伺服器ODM廠)的合作早已是「深植骨髓」的共同體,更強調NVIDIA在過去多年以來已經多次投資台灣,只是並未特別聲明。

目前NVIDIA的市場佈局,已經不再只是提供單一晶片,而是透過一整套涵蓋NVLink互連技術、CUDA軟體到Nemo框架等解決方案,乃至於目前的「機架級」 (Rack-scale)完整運算平台,藉此建構完整的市場競爭優勢,同時背後也以深厚的資金在台灣等地建構生態系統。

對於目前敏感的中國市場,黃仁勳重申NVIDIA的立場:公司將持續遵守美國政府的出口管制規範,但絕不會放棄這個龐大市場。NVIDIA正致力於在合規的框架內,為中國客戶提供量身定制的降規版AI晶片,確保在全球地緣政治的夾縫中,維持市佔率的最大化。

軟硬通吃的NVIDIA,試圖囊括AI代理的底層基礎設施

黃仁勳這次提早抵台,並且將首站選在以開發者為主的「Meet‑A‑Claw」大會,戰略意義極為深遠。

NVIDIA很清楚,當AMD試圖用100億美元與LPDDR等硬體規格來拉近差距時,NVIDIA必須將戰場拉高到「軟體與生態系」的層次。從硬體端來看,Vera Rubin平台結合矽光子技術,將進一步拉開算力差距;而從軟體端來看,NVIDIA全力擁抱OpenClaw與NemoClaw,意味著它正試圖成為代理式AI時代的底層標準。

當未來的電腦不再是等著你輸入指令的機器,而是一個個像「龍蝦」一樣能在背景自動幫你寫編碼、整理郵件,甚至成為管理家務、工作事項的AI代理時,誰能掌握這些代理AI運作的底層框架與硬體最佳化,顯然就能掌握下一個十年的科技霸權。

接下來一週的「兆元宴」與6月1日在台北流行音樂中心展開的主題演講,黃仁勳預期將端出更多讓對手難以招架的AI組合攻勢。

Salesforce Headless 360 讓 AI 代理人無需登入就能跨平台調用企業數據

Salesforce 推出 Headless 360 解決方案,讓 AI 代理人無需登入系統,即可在 Slack、Teams 等平台直接調用企業數據與工作流,打破 AI 應用的系統藩籬。

當「AI代理人」 (AI Agent)不再只是個會聊天的機器人,而是真正開始幫你審核表單、更新客戶資料、甚至自動化推進專案時,企業面臨的最大痛點,往往是這群虛擬員工「水土不服」——它們無法輕易跨越不同系統間的高牆。為了解決這個瓶頸,Salesforce今日 (5/25)正式在台介紹全新推出的「Salesforce Headless 360」解決方案,將Salesforce平台能力轉化為API與MCP模型上下文協定工具,讓AI代理能夠「無頭」運作,亦即無需登入Salesforce介面,就能在Slack、Teams、WhatsApp,甚至ChatGPT中,直接調用企業最核心的商業邏輯與客戶數據。

為何需要「無頭」?打破AI的操作藩籬

在傳統的軟體架構中,若員工或自動化程式要更新客戶關係管理 (CRM)系統中的資料,通常需要登入該系統的專屬介面 (也就是所謂的「頭部 / UI」)。

但在AI時代,使用者希望能在任何他們習慣的介面上工作。Salesforce台灣總經理徐嘉聲指出,AI代理人的價值不僅取決於底層模型,更在於其背後是否具備完整的「企業脈絡」與「信任機制」。

「Salesforce Headless 360」的核心概念,就是將Salesforce系統中強大的Data 360 (數據基礎)、流程自動化與治理規則,全部打包成開發者與外部AI代理人 可直接調用的底層服務。意味企業可以打造一個AI代理人,讓業務員只需在WhatsApp裡用語音下達指令,或是讓客服在Slack中點擊一個AI生成的簽核卡片,背後的Headless 360就會自動完成Salesforce系統內的資料更新與跨部門流程觸發。

三大核心創新:從開發、互動到治理的全面升級

為了讓企業能更快且更安全地部署這些跨平台AI代理人,Salesforce Headless 360帶來了三大關鍵功能:

• 開發模組 (Coding Skills)加速佈署:

為了解決開發者的痛點,Headless 360提供超過60個全新MCP工具與30多個預設的開發技能模組。這讓使用Claude Code、Cursor或Windsurf等新世代AI開發工具的工程師,能直接在其開發環境中存取Salesforce的資料與邏輯,大幅縮短建置AI代理人的時間。

• 跨介面互動體驗 (Agentforce Experience Layer):

AI代理人的回應不再侷限於單純文字。透過此功能,AI可以在不同的介面 (如Teams或自家的專屬App)中,以豐富的UI形式呈現,例如彈出簽核通知卡片、決策選項按鈕或是資料視覺化版面,讓員工在不離開當下工作介面的前提下完成複雜任務。

• 全生命週期治理 (Lifecycle Governance):

「失控的AI」是企業最大的夢魘。Salesforce強化AI的行為監管機制,包含上線前的「測試中心」能檢視代理人是否有違規的邏輯漏洞;上線後則提供可觀測性 (Observability)、工作階段追蹤 (Session Tracing)與A/B測試,幫助企業即時追蹤AI代理人的決策軌跡,確保其行為符合企業安全與治理規範。

用API與MCP穩固「數據核心」霸權

面對OpenAI、Google與微軟等底層大模型廠商不斷推出自家AI Agent框架的挑戰,Salesforce選擇不正面與他們爭奪「誰的AI比較聰明」,而是轉向確保「所有的AI都必須透過我來拿資料」。

透過擁抱MCP協定並推動Headless架構,Salesforce實際上是在告訴企業客戶:無論你未來選擇使用哪一家的AI模型、偏好在哪個通訊軟體上辦公,Salesforce都將是你企業中最核心、最安全且不可或缺的「數據與商業邏輯引擎」。這招「隱形入底層」的策略,不僅延續其在CRM領域的統治力,更讓Salesforce在這波代理式AI浪潮中,穩穩抓住企業數位轉型的心臟。

Meta 20 億美元併購遭卡關 Manus 籌 10 億美元贖身轉戰香港 IPO

Meta 併購中國 AI 新創 Manus 的 20 億美元交易遭中國監管當局以國家安全為由叫停,Manus 創辦人決定籌資 10 億美元回購公司,並計畫轉向香港交易所掛牌。

去年底,Meta宣布以超過20億美元天價收購中國AI新創團隊Manus,創下中國境內AI新創被大型科技業者併購的最快紀錄。而這場轟動業界的交易,卻在今年4月27日正式遭中國國家發改委以「國家安全」為由強硬叫停。面對被迫從Meta體系中剝離的絕境,Manus三位創辦人並未放棄,近期傳出正積極籌集10億美元資金,試圖從Meta手中「買回」公司控制權,並且計畫重組為合資企業後,轉向香港交易所 (HKEX)掛牌上市。

踩中技術出口紅線,Meta補齊代理式AI的美夢碎裂

回顧Meta當初為何如此急迫地以20億美元買下Manus,答案在於「代理式AI」 (Agentic AI)的戰略價值。

當OpenAI與Google在底層模型激烈廝殺時,Manus憑藉「大型語言模型 + 雲端虛擬機」的架構,打造出能真正跨端執行複雜任務、從指令到交付可完全封閉循環運作的AI產品。而上線後僅八個月,就使年度經常性收入突破1億美元,成為Meta亟欲補齊的應用層拼圖。

不過,這場交易最終撞上中國《外商投資安全審查辦法》的高牆。不僅成為該法規自2021年正式實施以來,首例公開針對AI領域祭出「禁止」決定的案件,更確立一個嚴格的監管標準:「實質重於形式」。

即便Manus事前已經將總部遷至新加坡,並且在組織上進行國際化調整,藉此避開中國監管法規的限制,但只要其核心技術研發、數據累積與源頭來自中國,就無法規避技術出口的審查。

砸10億美元「贖身」:不僅是商業決策,更是生存本能

對Manus團隊而言,併購案遭撤銷是一場不折不扣的災難。因為在今年初,Manus的百名員工已經實質進駐Meta新加坡辦公室,並且被編入Superintelligence Labs部門,技術與數據早已深度嵌入Meta生態。

要把這一切「退回原點」,終止雇傭關係並撤銷系統權限,操作難度極高。但創辦人肖弘、季逸超、張濤卻選擇扛下巨大的資金壓力,試圖籌資10億美元回購公司。原因無他:如果不自己買回來,Manus失去大型業者庇護後,價值將迅速蒸發。

更殘酷的是,在Manus被併購又遭阻擋的這段空窗期,AI代理應用賽道已經發生翻天覆地的變化。

包含智譜推出具備雲端手機與電腦控制權的AutoGLM 2.0,字節跳動的Coze也持續擴張;此外,近期爆紅的開源框架OpenClaw更是直接衝擊所有通用代理AI產品的門檻。Manus曾經擁有的先發優勢正在被快速追平,回購公司且重回戰場,成為他們證明自身價值的唯一機會。

香港交所:AI獨角獸的終極避風港與黃金登陸點

回購成功後,Manus的下一步明確指向香港IPO。這是一個充滿戰略算計的最佳選擇。

2026年的香港資本市場,正在迎接史無前例的AI上市狂潮。從年初的壁仞科技、智譜到MiniMax,港股投資人對於「高成長、高研發虧損」的AI企業給予極端寬容的定價。

以MiniMax為例,不到8000萬美元的年收入就能撐起千億港元市值;相比之下,Manus去年底就已達成1億美元經常性收入,極有機會在港股獲取超越當初Meta開出的20億美元估值。

透過與新投資方在中國境內設立合資企業,Manus或許能重新回到中國監管體系內合法營運;而透過香港上市,則能運用其成熟的再融資 (配售)機制,為未來無底洞般的AI算力與研發成本持續輸血。

Dcard 跨足企業級 AI 市場成立 GNTC,推出 AI 代理解決方案搶商機

Dcard 今日宣布成立企業 AI 代理事業 GNTC,推出 EntryDesk 與 VibeHost 兩大解決方案,協助企業整合既有系統、重塑人機協作模式。

隨著生成式AI從單純的對話對答,全面進化為具備自主執行任務能力的「代理AI」 (Agentic AI),企業如何將其無縫融入既有工作流程已成為當前最大挑戰。台灣社群平台Dcard今日 (5/28)宣布跨足B2B企業市場,成立全新的企業AI代理事業「GNTC」,藉由將過去一年來內部全面推行「Agent-Native」 (AI代理原生)的實戰轉型經驗產品化,GNTC首波推出EntryDesk與VibeHost兩大核心解決方案,協助企業在兼顧資安防護與資料治理的框架下,重塑新世代的人機協作營運模式。

不僅是導入工具,而是重塑價值鏈的實戰經驗

GNTC的誕生,很大程度上源自於Dcard自身的數位轉型陣痛與成果。自2025年起,Dcard內部便開始全面推動Agent-Native轉型。這並非單純發放AI帳號給員工,而是從底層建置跨工具的代理平台,從財會、廣告、產品到行銷團隊,員工自主建立數百個AI應用場景。

以Dcard自家的廣告團隊為例,透過導入自動化流程與AEO (Answer Engine Optimization)優化能力,團隊能將過去必須仰賴人工上架的廣告素材處理、資訊蒐集與提案產出全面排程自動化,整體流程處理時間驚人地縮短超過80%。

Dcard創辦人暨執行長林裕欽指出:「過去一年,我們重新梳理每個部門的工作流程,找出真正能被AI代理賦能的價值鏈。GNTC的目標是把這套從內部實戰累積出的經驗,變成企業可以直接導入的解決方案」。

兩大核心產品:打通企業內部系統的任督二脈

針對企業導入AI代理時常遭遇的「系統破碎化」與「產出難以分享」兩大難題,GNTC這次端出具備高度針對性的雙箭頭產品:

• EntryDesk:企業級調度層 (Enterprise Harness Layer)

EntryDesk定位為企業導入AI代理的「整合樞紐」。它能直接串接企業既有的內部系統,並且統一管理資料權限與工作流程。員工不再需要於多個AI工具與內部系統間痛苦切換,透過跨平台 (涵蓋網頁、iOS、Android、macOS、Windows與CLI)的一致性介面,即可跨系統查詢資料、排程任務。

更重要的是,它能共享企業內部的「情境層」 (Context Layer),讓AI代理真正讀懂公司的運作脈絡;同時內建權限控管機制,確保機敏資料的合規性。

• VibeHost:AI原生代管層 (Agent-Native Hosting Layer)

這是一款以Agent Experience (AX)優先思維設計的佈署與協作平台。當AI產出網站、內部簡報、商業提案或互動程式後,使用者只需一道指令,幾秒內就能生成專屬私有連結進行安全分享。

VibeHost提供CLI、MCP與Chrome 擴充套件等多元介接方式,並且支援密碼保護與權限驗證,徹底解決過去AI生成物難以在團隊間快速流轉、審閱與協作的痛點。

瞄準高機敏產業:「地端佈署」與FDE顧問戰隊雙管齊下

除了常見的雲端佈署外,GNTC的解決方案全面支援地端佈署 (On-premise),這對於資料絕對不能上雲的金融、醫療、法務及政府等高機敏產業而言,無疑是極具吸引力的敲門磚。

此外,GNTC並非只賣軟體授權,更同步成立前線佈署工程師 (Forward Deployed Engineer, FDE)顧問團隊。這支戰隊將直接深入企業內部,協助盤點既有工作流程、客製化設計AI代理應用情境,並且從系統架構層面推動實質的AI雙軌轉型。

❌