普通视图

发现新文章,点击刷新页面。
昨天以前首页

CanIRun.AI – 你的电脑能跑哪些本地 AI 大模型?这个网站打开就能看到

作者 青小蛙
2026年3月17日 10:21

AI Token 很贵,而且没完没了,这是所有 AI 重度用户迟早会面对的问题。
于是越来越多人开始尝试本地大模型——只要电脑能跑,就相当于拥有“无限 Token”。

但关键问题是:你的电脑到底能跑哪些 AI 模型?

前几天分享了一款软件:llmfit – 1秒测出:你的电脑能跑哪些 AI 大模型,它可以测出你的电脑硬件配置,再显示出当前配置下,能跑哪些大模型。

  • 优点:硬件识别准确、可选模型多。
  • 缺点:就是需要下载一个软件

那么,有没有不需要下载软件也能识别的呢?

CanIRun.AI 就是为了解决这个问题而诞生的。

这是一个可以自动获取你的电脑硬件信息,主要包括 CPU、显卡、内存(大概)信息,然后给你可用的大模型列表的网站。

CanIRun.AI – 你的电脑能跑哪些本地 AI 大模型?这个网站打开就能看到 37

进入详细大模型页面后,还有更详细的内容,包括:

  • ollama 安装命令
  • HuggingFace 下载链接
  • 下载次数/爱心统计
  • 量化选项
  • 详细参数等
CanIRun.AI – 你的电脑能跑哪些本地 AI 大模型?这个网站打开就能看到 38

为什么它能知道你的硬件信息?

关于这个问题,青小蛙也去研究了一下,于是有了这个网站:

这是青小蛙让 AI 写的一个用浏览器检测用户硬件信息的页面,包括 CPU、内存、显示器信息、显卡信息、存储、预估带宽等信息,简单易用。


原文:https://www.appinn.com/canirun-ai/


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用

作者 青小蛙
2026年4月15日 15:42

现在,通过 Google 的开源应用 Google AI Edge Gallery,已经可以直接在 iPhone 和安卓手机上运行 Gemma 4 E2B、E4B 两个模型了,不消耗任何 Token,能离线使用。
而且不只是对话,还支持图片、语音,甚至加入了 Skills。

不用等啦,现在就能用。

iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用 55

Google AI Edge Gallery

Google 开源了 AI Edge Gallery,并且发布了 iOS 与 Android 版本:

iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用 56

目前支持直接下载这几个模型:

  • Gemma-4-E2B-it(2.54GB)
  • Gemma-4-E4B-it(3.61GB)

直接下载

Google 推荐使用 E2B,可以更流畅一些。

iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用 57

当然了,运行大模型会让手机卡顿,青小蛙也是运行了一会,换回 E2B 了。

这款开源应用更多的还是用来展示 Gemma 4 能力。

另外 AI Edge Gallery 里还带了两个极限小模型:

  • Tiny Garden(270MB)
  • Mobile Actions(270MB)

Tiny Garden 是经过微调的模型,可为语音控制的互动游戏提供支持。

Mobile Actions:它能翻译用户输入(如 “创建午餐日历事件”、”打开手电筒”)转化为触发 Android 操作系统工具的函数调用。


原文:https://www.appinn.com/google-ai-edge-gallery/


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降

作者 青小蛙
2026年4月24日 12:05

DeepSeek V4 终于发布了,带来了 1M 上下文,代码能力明显提升,推理进入第一梯队,但知识类能力仍落后于头部闭源模型。

最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降 29

最重要的是:「DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。

算力需求比 V3.2 降低 3~10 倍

最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降 30

右侧显示,单 token 计算量(FLOPs)对比:

  • V4-Pro 比 V3.2 降低 3.7 倍
  • V4-Flash 比 V3.2 降低 9.8 倍

也就是说,同样的显卡和显存,可以处理更多的请求了(利好大模型提供商)

与同行对比

指标GPT-5.4Claude Opus 4.6Gemini 3.1 ProDeepSeek V4 Pro-Max
MMLU-Pro87.589.191.087.5
SimpleQA45.346.275.657.9
GPQA Diamond93.091.394.390.1
HLE39.840.044.437.7
LiveCodeBench88.891.793.5
Codeforces316830523206
Apex Shortlist78.185.989.190.2

另外,今天更新了 GPT-5.5,也是同一天啊,ChatGPT 中已经可用。

降价了吗?

降了,也没降:

模型输入(缓存命中)输入(未命中)输出上下文
V3.20.2 元2 元3 元128K
V4 Flash0.2 元1 元2 元1M
V4 Pro1 元12 元24 元1M

V4 Flash 降价,V4 Pro 全面涨价。

值不值?

V4 Pro 比 V3.2 贵了这么多,值不值:

类别指标V3.2V4-Pro提升情况(Pro)
知识MMLU-Pro65.573.5↑ +8.0
知识C-Eval90.493.1↑ +2.7
知识MultiLoKo38.751.1↑↑ +12.4
事实问答SimpleQA28.355.2↑↑ +26.9
事实问答FACTS27.162.6↑↑ +35.5
推理BBH87.687.5
推理HellaSwag86.488.0↑ +1.6
推理WinoGrande78.981.5↑ +2.6
代码HumanEval62.876.8↑↑ +14.0
数学MATH60.564.5↑ +4.0
数学GSM8K91.192.6↑ +1.5
长上下文LongBench-V240.251.5↑↑ +11.3

现在就能用啦

目前 DeepSeek 官网以及 API 都上线了 V4。


原文:https://www.appinn.com/deepseek-v4/

能自己部署吗?

应该是不能的,Flash 最低也要200GB内存往上了。


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论

[ 点击前往获取链接 ]


从智能驾驶到「智能一切移动」,卓驭想做移动物理 AI 的底层基座丨北京车展

作者 刘学文
2026年4月26日 17:13

过去几年,智能驾驶行业的关键词一直在快速变化。

从高精地图到无图 NOA,从感知、预测、规划、控制的模块化架构,到端到端模型,再到最近行业频繁讨论的 VLA、世界模型和物理 AI,智能驾驶已经不再只是「让汽车自己开」这么简单。它正在成为一个更大的技术问题:AI 如何理解真实物理世界,并把这种理解转化为稳定、可靠、可泛化的移动能力。

汽车只是其中最早、也最复杂的载体之一。因为车辆必须在开放道路中面对行人、车辆、红绿灯、施工、极端天气和不同国家的交通规则,它需要同时处理感知、决策、控制和安全冗余。也正因为如此,智能驾驶过去几年积累的技术、数据和工程能力,正在向商用车、无人物流、Robotaxi,甚至更广义的移动机器人外溢。

在 2026 北京车展上,卓驭科技以「智能一切移动」为主题举办发布会,正式推出面向移动物理 AI 的原生多模态基础模型,并展示了其在乘用车、商用车、无人物流和 Robotaxi 等多个垂类的规模化落地进展。相比单纯发布一套智驾方案,这次发布会更像是卓驭对自身定位的一次更新:从智能驾驶供应商,继续向移动物理 AI 公司延展。

原生多模态基础模型,把智能移动能力做成通用底座

智能驾驶进入下半场后,一个关键问题开始浮现:系统能力能否从单一车型、单一城市、单一场景,迁移到更多载体和更多区域。

早期的小模型方案,主要依赖感知模型、高精地图和规则算法。它可以在特定区域做到相对稳定,但每进入一个新城市,都需要大量适配工作。后来端到端模型提升了通用基础能力,减少了规则依赖,也让 NOA 的体验更加接近人类驾驶习惯。不过,面对海外市场、商用车、无人配送车、Robotaxi 等不同垂类时,端到端系统仍然需要大量重新泛化。

卓驭这次发布的原生多模态基础模型,正是试图解决这一问题。按照卓驭的说法,这套模型面向「移动物理 AI」构建,在底层完成对物理世界通用规律的预训练,支持视频、文本、动作、语音、地图等多模态统一表征。它的训练数据不只来自智能驾驶,还覆盖互联网数据和各类移动机器人第一视角数据,并注入跨领域、跨国家知识。

这意味着,卓驭希望把移动智能的能力从「车」抽象到「移动载体」。当模型具备对物理世界更底层的理解后,不同国家、不同道路、不同平台之间的适配成本有机会被降低。它的目标,是实现 Zero Shot 零数据知识迁移,做到跨垂类开箱即用,或至少大幅减少泛化工作。

这也是它与部分 VLA 方案的区别。常见 VLA 路径往往需要从传感器输入到语义理解,再到动作输出,中间存在显式语义翻译环节。卓驭强调,其原生多模态基础模型是在统一框架下完成训练,避免语义翻译带来的延迟和信息损耗,让语义理解与物理理解更紧密地结合在一起。

从行业角度看,这一路径的价值不只在于提升智能驾驶体验,更在于为多种移动机器人提供统一能力底座。乘用车、重卡、客车、无人物流车和 Robotaxi 面对的场景差异很大,但它们都需要理解空间、运动、规则、风险和目标。如果底层模型可以沉淀出通用能力,智能移动的规模化部署将不再完全依赖逐一项目制适配。

当然,基础模型只是第一步。真正进入量产,还需要后训练、蒸馏、部署、芯片适配、传感器融合和安全冗余。卓驭此次开放了原生多模态基础模型的乘用车试乘体验,体验车基于英伟达 Thor 平台,采用 11V 视觉方案与激目 2.0 系统。按照规划,该模型将于今年内推送至乘用车与商用重卡,并作为卓驭智能驾驶出海的基础模型。

从乘用车到重卡、客车和 Robotaxi,规模化交付决定技术上限

如果说原生多模态基础模型代表技术趋势,那么卓驭这次在北京车展上展示的另一条主线,是规模化交付。

智能驾驶行业过去并不缺概念,真正稀缺的是把技术放进量产车、真实道路和长期使用场景里的能力。卓驭在 2025 年提出「移动智能基座」构想,本质上就是希望通过软硬一体方案,把智能驾驶能力做成可以跨车型、跨价位、跨场景复用的基础设施。

在乘用车领域,卓驭目前累计量产车型超过 50 款,定点车型达到三位数。它强调的是「油电同智、中外同频、舱驾同芯、行泊同优」:无论燃油车还是新能源车,自主品牌还是合资品牌,都能共享同一梯队的智能化体验。

这背后也反映出一个变化:智能驾驶正在从高端新能源车型的专属配置,逐步向更大价格带、更大车型范围下沉。卓驭基于高通 8775 芯片打造了单芯片舱驾一体方案,试图用更高集成度降低智能化部署门槛。今年 4 月起,所有搭载高通 8650 和 8775 芯片的车型,将陆续升级至高悟性端到端 4.0;搭载 TI TDA4-VH 芯片的中低算力平台,也将逐步升级至高悟性端到端 3.0。

商用车是卓驭这次发布会的另一个重点。重卡对智能驾驶的需求很实际:安全、油耗、长途驾驶疲劳和运营效率。卓驭已经与中国 TOP 6 商用车品牌建立合作,搭载高悟性端到端 4.0 商用重卡版的车型,将于今年 6 月起陆续量产交付。

重卡方案中,卓驭引入了激目 2.0 系统,也就是舱内激光视觉前融合方案。它针对重卡尺寸大、清洁维护不便、安全冗余要求高等特点设计,可以在不同速度场景下调整感知能力:低速城区场景覆盖更大范围交通参与者,高速场景则提升远距离探测能力和点云密度。搭载该方案的车型计划于今年 9 月正式量产交付,功能覆盖高速 NOA、城区 NOA 和自主泊车。

客车方面,卓驭已与宇通客车达成战略合作,双方将联合开发面向商用客车的 NOA 智能驾驶解决方案。该方案搭载激目 2.0 系统、自研自产补盲激光雷达「知周」、基于英伟达 Thor 芯片的高性能控制器,并应用下一代原生多模态基础模型。对于客车而言,智能驾驶的优先级并不只是效率,更关乎公共交通场景下的安全和稳定。

无人场景也在同步推进。卓驭计划于今年 7 月启动无人物流车试运营,并与生态伙伴推进 L4 级 Robotaxi 系统落地,预计今年下半年开启试运行。Robotaxi 将搭载下一代原生多模态基础模型,并配备卓驭自研自产、基于双英伟达 Thor 芯片打造的三冗余 L4 级控制器。

截至目前,卓驭已携手 34 家客户,合作车型突破 130 款。这个数字的意义不只是客户规模,更在于真实道路数据和工程反馈。对智能驾驶公司来说,模型能力往往来自数据闭环,工程能力则来自量产压力。只有经历不同品牌、不同车型和不同用户场景,技术路线才有机会持续迭代。

本次发布会上,卓驭还宣布与中国一汽达成深度战略合作。在乘用车领域,红旗与卓驭联合开发的红旗司南组合驾驶辅助已在红旗 HS6、天工 05、天工 06 等车型量产,高悟性端到端 4.0 模型将在今年上半年通过 OTA 升级上线。车展亮相的红旗天工 S 概念车,则采用基于卓驭原生多模态基础模型的新一代架构,并搭载 L3 / L4 智驾解决方案。

商用车领域,一汽解放与卓驭的合作也已进入产品落地阶段。基于激目 2.0 系统与高悟性端到端 4.0 模型打造的解放 J7、鹰途和 J6 重卡高速 NOA 产品,将于今年下半年上市。

从这些布局来看,卓驭想讲的并不是单一智驾版本升级,而是一个更大的移动智能网络:乘用车提供规模,商用车验证高强度运营,Robotaxi 和无人物流探索无人化边界,车载无人机则把移动载体从地面进一步扩展到近地空间。

智能驾驶过去常常被看作汽车行业的一项配置,但从北京车展释放的信息来看,它正在变成一类新的基础能力。未来,竞争的焦点会逐步从「某个城市能不能开」转向「能不能跨场景、跨品类、跨地区复用」。谁能把能力做成底座,谁就有机会进入更大的移动机器人时代。

对卓驭而言,原生多模态基础模型只是这条路径上的起点。真正的挑战在后面:如何把模型能力稳定部署到不同算力平台,如何在真实道路中保持安全边界,如何在海外市场减少泛化成本,如何让商用车、无人物流和 Robotaxi 都形成可持续商业闭环。

当 AI 开始进入物理世界,移动会是最先被重塑的领域之一。汽车、卡车、客车、配送车、无人机,本质上都在回答同一个问题:机器如何理解世界,并安全地抵达目的地。卓驭这次提出「智能一切移动」,野心正在于此。能否真正做到,还要由量产规模、用户体验和长期安全表现共同验证。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

用苹果 M5 Max 跑大模型真的省钱吗?有人算了一笔账

作者 青小蛙
2026年5月20日 10:52
用苹果 M5 Max 跑大模型真的省钱吗?有人算了一笔账 50

先上结论:

使用 14寸 MacBook Pro M5 Max 高配,64GB 内存的情况下,速度比云端大模型慢、实际成本也比云端大模型贵…

推荐:直接向大模型厂商付费充值使用。

一些数据

这是来自 williamangel 的一组数据,文章主要在计算「本地跑 LLM 到底贵不贵」,使用了 Google Gemma 4 31B 模型,把电费、硬件折旧、tokens/s 这些数据摊开之后,结论是:

很多情况下,本地 Apple Silicon 跑模型,成本已经高于直接调用在线 API。

电费成本

功耗每小时电费每日电费(24小时满载)
50W$0.009$0.216
100W$0.018$0.432
文中取整后估算~$0.02~$0.48

M5 Max MacBook Pro 硬件成本

设备配置官方价格
Apple 14′ MacBook ProM5 Max + 64GB RAM$4299

按设备寿命摊销后的硬件成本

使用寿命年成本每小时硬件成本
3 年$1433$0.16358
5 年$860$0.09815
10 年$430$0.04908

本地 LLM 综合成本(电费 + 硬件)

使用寿命每小时总成本(约)
3 年~$0.18/h
5 年~$0.11/h
10 年~$0.07/h

最终:Token 成本估算

方案百万 tokens 成本速度
本地 Apple Silicon 推理~$1.50 / 百万 tokens数十 tokens/s
在线 OpenRouter 同级模型约为本地的 1/3约 2 倍速度

原文:


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论

[ 点击前往获取链接 ]


❌
❌