普通视图

发现新文章,点击刷新页面。
昨天以前首页

iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用

作者 青小蛙
2026年4月15日 15:42

现在,通过 Google 的开源应用 Google AI Edge Gallery,已经可以直接在 iPhone 和安卓手机上运行 Gemma 4 E2B、E4B 两个模型了,不消耗任何 Token,能离线使用。
而且不只是对话,还支持图片、语音,甚至加入了 Skills。

不用等啦,现在就能用。

iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用 55

Google AI Edge Gallery

Google 开源了 AI Edge Gallery,并且发布了 iOS 与 Android 版本:

iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用 56

目前支持直接下载这几个模型:

  • Gemma-4-E2B-it(2.54GB)
  • Gemma-4-E4B-it(3.61GB)

直接下载

Google 推荐使用 E2B,可以更流畅一些。

iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用 57

当然了,运行大模型会让手机卡顿,青小蛙也是运行了一会,换回 E2B 了。

这款开源应用更多的还是用来展示 Gemma 4 能力。

另外 AI Edge Gallery 里还带了两个极限小模型:

  • Tiny Garden(270MB)
  • Mobile Actions(270MB)

Tiny Garden 是经过微调的模型,可为语音控制的互动游戏提供支持。

Mobile Actions:它能翻译用户输入(如 “创建午餐日历事件”、”打开手电筒”)转化为触发 Android 操作系统工具的函数调用。


原文:https://www.appinn.com/google-ai-edge-gallery/


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

用苹果 M5 Max 跑大模型真的省钱吗?有人算了一笔账

作者 青小蛙
2026年5月20日 10:52
用苹果 M5 Max 跑大模型真的省钱吗?有人算了一笔账 50

先上结论:

使用 14寸 MacBook Pro M5 Max 高配,64GB 内存的情况下,速度比云端大模型慢、实际成本也比云端大模型贵…

推荐:直接向大模型厂商付费充值使用。

一些数据

这是来自 williamangel 的一组数据,文章主要在计算「本地跑 LLM 到底贵不贵」,使用了 Google Gemma 4 31B 模型,把电费、硬件折旧、tokens/s 这些数据摊开之后,结论是:

很多情况下,本地 Apple Silicon 跑模型,成本已经高于直接调用在线 API。

电费成本

功耗每小时电费每日电费(24小时满载)
50W$0.009$0.216
100W$0.018$0.432
文中取整后估算~$0.02~$0.48

M5 Max MacBook Pro 硬件成本

设备配置官方价格
Apple 14′ MacBook ProM5 Max + 64GB RAM$4299

按设备寿命摊销后的硬件成本

使用寿命年成本每小时硬件成本
3 年$1433$0.16358
5 年$860$0.09815
10 年$430$0.04908

本地 LLM 综合成本(电费 + 硬件)

使用寿命每小时总成本(约)
3 年~$0.18/h
5 年~$0.11/h
10 年~$0.07/h

最终:Token 成本估算

方案百万 tokens 成本速度
本地 Apple Silicon 推理~$1.50 / 百万 tokens数十 tokens/s
在线 OpenRouter 同级模型约为本地的 1/3约 2 倍速度

原文:


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论

[ 点击前往获取链接 ]


❌
❌