普通视图

昨天以前首页

小众软件
iPhone、安卓现在就能跑 Gemma 4 了：Google 开源 AI Edge Gallery 应用
2026年4月15日 15:42

iPhone、安卓现在就能跑 Gemma 4 了：Google 开源 AI Edge Gallery 应用

作者青小蛙

2026年4月15日 15:42

现在，通过 Google 的开源应用 Google AI Edge Gallery，已经可以直接在 iPhone 和安卓手机上运行 Gemma 4 E2B、E4B 两个模型了，不消耗任何 Token，能离线使用。
而且不只是对话，还支持图片、语音，甚至加入了 Skills。

不用等啦，现在就能用。

iPhone、安卓现在就能跑 Gemma 4 了：Google 开源 AI Edge Gallery 应用 55

Google AI Edge Gallery

Google 开源了 AI Edge Gallery，并且发布了 iOS 与 Android 版本：

iPhone、安卓现在就能跑 Gemma 4 了：Google 开源 AI Edge Gallery 应用 56

目前支持直接下载这几个模型：

Gemma-4-E2B-it（2.54GB）
Gemma-4-E4B-it（3.61GB）

能直接下载。

Google 推荐使用 E2B，可以更流畅一些。

iPhone、安卓现在就能跑 Gemma 4 了：Google 开源 AI Edge Gallery 应用 57

当然了，运行大模型会让手机卡顿，青小蛙也是运行了一会，换回 E2B 了。

这款开源应用更多的还是用来展示 Gemma 4 能力。

另外 AI Edge Gallery 里还带了两个极限小模型：

Tiny Garden（270MB）
Mobile Actions（270MB）

Tiny Garden 是经过微调的模型，可为语音控制的互动游戏提供支持。

Mobile Actions：它能翻译用户输入（如 “创建午餐日历事件”、”打开手电筒”）转化为触发 Android 操作系统工具的函数调用。

原文：https://www.appinn.com/google-ai-edge-gallery/

用苹果 M5 Max 跑大模型真的省钱吗？有人算了一笔账

小众软件

作者青小蛙

2026年5月20日 10:52

先上结论：

使用 14寸 MacBook Pro M5 Max 高配，64GB 内存的情况下，速度比云端大模型慢、实际成本也比云端大模型贵…

推荐：直接向大模型厂商付费充值使用。

一些数据

这是来自 williamangel 的一组数据，文章主要在计算「本地跑 LLM 到底贵不贵」，使用了 Google Gemma 4 31B 模型，把电费、硬件折旧、tokens/s 这些数据摊开之后，结论是：

很多情况下，本地 Apple Silicon 跑模型，成本已经高于直接调用在线 API。

电费成本

功耗	每小时电费	每日电费（24小时满载）
50W	$0.009	$0.216
100W	$0.018	$0.432
文中取整后估算	~$0.02	~$0.48

M5 Max MacBook Pro 硬件成本

设备	配置	官方价格
Apple 14′ MacBook Pro	M5 Max + 64GB RAM	$4299

按设备寿命摊销后的硬件成本

使用寿命	年成本	每小时硬件成本
3 年	$1433	$0.16358
5 年	$860	$0.09815
10 年	$430	$0.04908

本地 LLM 综合成本（电费 + 硬件）

使用寿命	每小时总成本（约）
3 年	~$0.18/h
5 年	~$0.11/h
10 年	~$0.07/h

最终：Token 成本估算

方案	百万 tokens 成本	速度
本地 Apple Silicon 推理	~$1.50 / 百万 tokens	数十 tokens/s
在线 OpenRouter 同级模型	约为本地的 1/3	约 2 倍速度

原文：