普通视图

发现新文章，点击刷新页面。

昨天以前未分类

DeepSeek 要用蜜雪冰城的打法，做中国版 Claude Code

爱范儿

作者莫崇宇

2026年5月25日 17:33

DeepSeek 之于大模型，就像蜜雪冰城之于奶茶。你不必纠结性价比，因为它的本事你挑不出毛病，你的钱包它也从不为难。

最近，DeepSeek 官方宣布，DeepSeek-V4-Pro 模型 API 将永久降价。同时，DeepSeek 表示，API 已完成输出提速与服务扩容，速度更快，服务更稳定，默认支持 500 并发，企业用户可以在线申请更高并发。

发布模型，再给出折扣，接着降低缓存命中价格，最后把临时优惠变成长期价格。大模型 API 的价格基准正在被重新改写，而低价模型背后的下一站，很可能是 Agent。

DeepSeek 永久降价，梁文锋把 Token 价格打骨折了

让我们先来简单梳理一下 DeepSeek 的降价时间线：

4 月 24 日，DeepSeek V4 预览版正式发布。
4 月 25 日，DeepSeek 宣布 V4-Pro 开启 2.5 折优惠。
4 月 26 日，DeepSeek 宣布缓存命中价格调整为首发价的十分之一。
4 月 28 日，DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日。
5 月 22 日，DeepSeek 宣布 V4-Pro 永久降价为原价的四分之一。

时间线的关键之处，在于临时折扣变成了永久降价。调整之后，DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元，输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元；

输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后，官方 API 对开发者和企业的吸引力进一步提高。

▲ https://api-docs.deepseek.com/zh-cn/quick\_start/pricing

而价格下调最直接的影响，是把任务成本推到开发者决策的更前端。

在代码场景里，一次任务可能要读取项目文件、分析日志、多轮修改、反复运行测试，Tokens 消耗很容易放大。

长上下文、代码库分析、批量重构、自动测试、Agent 多轮执行这些高消耗场景，开始更接近个人开发者和小团队的预算范围。

过去，开发者选择 Claude、OpenAI 或 Gemini，主要看模型能力、稳定性、生态和使用习惯。DeepSeek 打骨折的永久降价，也意味着在绝对的性价比面前，开发者使用习惯也是可以轻易改变的。

顺着这条线，DeepSeek 一贯的市场角色也更清楚了：用低价、开源和强推理能力，持续建立大模型市场的价格优势。对国内模型厂商来说，V4-Pro 永久降价相当于重新划了一条 API 定价线。

智谱、MiniMax、月之暗面这类同样依赖 API 收费、又面向开发者和企业客户的模型，压力可想而知。反观 Claude、OpenAI、Gemini 等海外头部模型，由于市场、客户结构和生态位置不同，短期冲击则相对有限。

但如果 DeepSeek 后续推出类似 Claude Code 的编码工具，再用低 token 成本支撑高频调用，价格敏感的开发者群体会更容易被吸引过来。

梁文锋此前对 DeepSeek 定价哲学的解释，也能放到今天理解。

早在 2024 年 DeepSeek V2 降价时，梁文锋就提到，DeepSeek 只是按照自己的节奏做事，核算成本后定价，原则是不贴钱，也不赚取暴利。他还说，降价一部分来自下一代模型结构探索带来的成本下降，另一部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。

比起把 API 当成高毛利收费入口，DeepSeek 则更像是在用过硬的 Infra 实力压低推理成本，再用低价吸引开发者、应用和下游生态进入自己的轨道。

X 平台博主 @bookwormengr 最近在一篇题为《DeepSeek’s 10 trillion USD grand strategy（DeepSeek 的十万亿美元棋局）》的长文中，给出了一个更激进的解释。

他认为，DeepSeek 的真正目标未必是和智谱、月之暗面、MiniMax 竞争，也不是急着补齐多模态、语音、视频这些产品线，而是通过持续降低训练和推理的资源需求，推动一套更便宜、更分散的 AI 硬件生态成形。

在他看来，DeepSeek 的长期价值不只在模型本身，而在于让更多国产存储、GPU、ASIC、网络芯片和异构硬件进入大模型训练与推理体系。

这个判断未必能完全兑现，但它解释了 DeepSeek 一系列选择背后的方向：

MoE、MLA、DSA、GRPO、RLVR、KV Cache 压缩、Dual Path、TileLang，表面上看是模型架构和推理工程优化，往深处看，都是在降低对高端 HBM、顶级 GPU 和 CUDA 生态的依赖。

一系列降价公告里，最值得关注的不只是输出价格下降，还有缓存命中价格下降。

在大模型推理过程中，KV Cache 是一个关键成本项。模型处理长上下文时，需要把历史 tokens 对应的 Key 和 Value 存起来，后续生成时反复使用。上下文越长，需要保存和读取的缓存越多，对显存、带宽和存储系统的压力也越大。

普通聊天里，缓存压力不一定明显，但在进入代码、长文档和 Agent 任务后，成本结构会迅速变化。@bookwormengr 在长文里专门算了一笔 KV Cache 账。

他以 100 万 tokens 上下文、8 bit KV 精度和 16 bit 索引精度为前提，估算 DeepSeek V4 只需要约 5.48GB HBM，而 GLM5 约为 60GB，Qwen3-235B-A22B 约为 89GB。

长上下文和 Agent 任务真正贵的地方，不只是模型生成本身，还有缓存、显存、带宽和重复上下文搬运。

一个 Code Agent 处理项目时，可能要反复读取同一个代码库结构、同一批文件、同一段任务历史、同一套系统提示词和同一批测试日志。若每一轮都按完整上下文重新计费，长任务很快会变贵。缓存命中价格下降后，重复上下文的成本会明显变低。

DeepSeek 近年来在 MoE 架构、长上下文、KV Cache 压缩和推理效率上持续投入的表现有目共睹。降价是技术迭代后的必然结果，也将彻底搅动 AI 编程市场格局。

为什么必须做中国版「Claude Code」？

最先被牵动的，是 AI 编程工具的订阅模式。

市面主流 AI 编程工具均推出 Coding Plan 月付订阅，为用户提供代码补全、模型调用、Agent 执行等权益。在轻量化补全时代，单次调用消耗极低。

但 AI 编程已从单次补全迭代为全流程 Agent 自动化编码，模型可独立完成代码修改、测试运行、报错修复，单次任务 Token 消耗大幅提升。

当底层 API 又同时大幅降价，Coding Plan 也必须找到新的支撑点。这个支撑点，更可能落在工程能力上——比如能不能更好地读懂项目结构，能不能精准选择上下文，能不能控制 tokens 消耗，能不能稳定修改代码，能不能处理 Git、终端、CI/CD，能不能在企业环境里管理权限和审计记录？

同样要重新定位的，还有 API 中转站。对个人开发者来说，便宜和好用仍然重要。但对企业来说，稳定、可审计、可控、可迁移更重要。

沿着这个逻辑继续看，Coding Plan 和中转站的改变只是表层。低价之后更值得追问的，是开发者入口究竟掌握在谁手里。

Google CEO Sundar Pichai 最近接受了《Hard Fork》采访，他首次公开承认，Google 在文本、多模态、语音、推理和整体智能上都很有竞争力，但在 agentic coding 这一类能力上，尤其是工具调用、指令跟随和长周期任务，目前还有差距。

他还提到，更关键的是把模型放到真实世界里使用，让数据回流，继续迭代。Pichai 特别说到，coding 是一个需要接触 data flows（数据流）的领域。

终端工具能看到开发者如何提出任务，如何追问，什么时候接受建议，什么时候放弃，什么时候要求模型继续修复。它还可以通过测试结果、终端日志、文件变更和 Git 提交，判断一次 Agent 执行是否完成任务。这类数据，对 coding model 和 Agent 产品都非常有价值。

从公开招聘动作看，DeepSeek 近期围绕 Agent 的动作也变得密集。

我们也可以看到岗位里出现了 Agent 深度学习算法研究员、Agent 数据策略工程师、产品经理、研发工程师等角色。更关键的是，DeepSeek 资深研究员陈德里直接发出招聘信息，提到要从零开始构建 Code Harness。

如其所说，Model + Harness = Agent，在 Agent 产品中，模型负责理解和生成，Harness 负责把模型能力带入真实工程环境，相当于模型外面那套「执行系统」。

DeepSeek 版 Claude Code 不能只给开发者一个对话框，而要给开发者一个能持续执行任务的工程系统。

崔添翼加入 DeepSeek 后受到关注，也和 Code Agent 的工程属性有关。

公开信息显示，崔添翼本科毕业于浙江大学计算机系，曾因信息学竞赛保送浙大，6 次获得 ACM 亚洲区域赛金牌，之后在 Jane Street 工作 9 年，并联合创立 TSY Capital。

Code Agent 的难点不只是生成代码，还要在真实项目里持续执行任务。量化交易系统长期强调低延迟、稳定性、自动化执行和风险控制，这些经验放到 Agent Harness 上，至少在工程范式上是相通的。

而 Agent 工具的产品能力，不只包括写代码，也包括权限、审计、数据隔离和安全策略。

这反过来给 DeepSeek 这样的国产模型提供了机会。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业级权限控制结合起来，它在政企、金融、制造、能源等对数据敏感的行业里，会有更强的替代价值。

DeepSeek 做中国版 Claude Code 的逻辑也正在于此：低价 tokens 把更多开发者吸引进来。低缓存价格让 Agent 任务运行成本下降。Code Harness 让模型进入开发环境。真实工作流又会反过来帮助 DeepSeek 改进模型和产品。

就像滚下坡的雪球，越滚越大，滚得越快。降价只是推下山的第一把力，往后它会自己越滚越沉，谁也拦不住。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

用 Codex 优化网速狂飙 900Mbps？实测之后我发现了新的隐藏玩法

爱范儿

作者张子豪

2026年5月26日 11:47

昨天，Codex 再一次重置了额度，我们的账号从剩余 10% 又回到了剩余 87%。

Codex 负责人 Tibo 在 X 发文，

有些用户注意到 Codex 中的缓存限制消耗得更快，我们发现根本原因是之前的一个优化措施，该措施在长时间运行的会话中进行压缩时会影响缓存命中率，我们已将其回滚。

我们已修复此问题，并已重置所有账户的使用限制。祝您周末愉快。

于是又想着还可以用 Codex 来做点什么，刚好就在 X 上刷到了「我用 Codex 提升了我的电脑网速，从 400Mbps 到 900Mbps。」

内容真的很有噱头，用 Codex 竟然能优化本地的网络？网速不应该是受限于路由器，或者网络服务提供商 ISP 这些上层设备吗？

这则推文的评论区也有不少网友提出了质疑，「所以 Codex 最终改变了电脑上的什么配置？」、「鉴于如今 AI 的强大技术，我真的无法判断这是否是诱饵。」

博主做出解释，Codex 帮助他把电脑上的 auto tuning level 从关闭调回了 normal 正常。auto tuning level 是说系统会根据网络延迟、带宽和拥塞情况，动态决定一次能接收多少数据，从而提高网络的速度。

他还给出了自己用的提示词。

嘿，我朋友说他的网速提高了，情况是这样的。你能帮我看看我们家的网络有什么可以改进的地方吗？我的网络供应商说他们提供的带宽是 1.2k Gbps，而我实际的网速是硬件问题。我现在只有 55Mbps，请帮我解决这个问题，别出错了。

我的目标很简单，就是让我的互联网速度更快。
问题已诊断：首先运行了 speedtest-cli。
检查了 DNS 解析时间，
检查了 MTU、丢包率、Wi-Fi 信号/干扰情况。
发现 3 个问题。
已删除过时的网络位置/配置文件。
终止或限制占用大量带宽的后台进程。
优化 mDNS。
进行了测试前后的速度测试和延迟检查。

这套提示词来自另一个 X 博主@cjzafir，他分享了自己使用 Codex + GPT 5.5 的实际案例，里面提到了 Codex 5.5 让他的网速变快了，本地运行的 6B 小语言模型速度更快了，以及 Macbook Pro 运行速度也像新的一样快等等。

我们也拿着这套提示词发给 Codex，在要求 Codex 处理网速问题前，先用中国科学技术大学测速网站 https://test.ustc.edu.cn/ 看了一下大概的速度，基本上下载速度在 100Mbps 左右，上传是在 200 Mbps 左右。

Codex 确实按照这些诊断，从 DNS 解析时间，数据包、网络配置等方面，检测并修复了对应的问题，累计处理时间超过五分钟。

最后 Codex 得出的结论是「我检查并做了能安全完成的修复。」它找到了 3 个存在的问题，分别是 DNS/缓存异常、负载延迟很高，以及有线千兆网卡没有在用，Wi-Fi 不能作为 1Gbps 的验收依据。

再次测试，发现似乎并没有很明显的网速提升。

有人问那位博主，是不是使用的 Mac 电脑，他回复说是 Windows，底下还有网友科普，Mac 的网络配置都是固定了，Codex 一般是无能为力。

所以这次轮到 Windows 用户来享受 Codex 网速提升服务了？还有 Linux。

有评论说，「以为是用 Codex 入侵了网络服务提供商，然后提高了流量限制」，结果只是 Codex 帮忙清理了一下 DNS 缓存。

但也有网友分享照着这个方法，成功复现了，Codex 确实让它的网速变快。

大家要是感兴趣也可以试试，不过 Codex 修改这些网络配置还是有一定的风险，评论区还有人提到 Codex 把他原有电脑的网络配置都删掉了，然后 Codex 跟他说，删掉它们是为了让网速更快。

这些涉及到 Computer Use 的使用案例，大概都会有类似的问题，除了每一次更细心的看懂允许 Codex 执行的是什么命令，还可以在提出任务时，就要求它解释清楚它要做的每一步。

如果不做修改，只是让 Codex 去诊断一些可能存在的网络配置问题，我想也比那个一直停留在进度条的自带 Windows 诊断要强。

开始了，Codexmaxxing

当大家都在讨论 Codex 是否能真的提升网速时，也有网友提到这种用法其实是一种启发。

他说这种做法的核心价值在于靠案例驱动，让 AI 直接参考成功的经验，再针对自己的具体情况进行精准诊断和优化，而类似的提示词技巧在 Agent 产品上将非常有效。

这很像 Codex 里面的 /goal 命令，给他一个目标，这个目标可以是我们自己设置的，也可以是其他用户已经有的成功案例，Codex 照着这个目标，自己去摸索可以实现的路径。

在社交媒体上，也有很多人开始分享这些写目标的模板，以及 OpenAI 的工程师也专门写了一篇文章来讲清楚什么是目标，如何用好目标来发挥 Codex 的最大价值。

/goal <期望的最终状态>，通过 <具体证据> 验证，同时保留 <约束条件>。使用 <允许的输入、工具或边界>。在各次迭代之间，如果受阻或没有剩余有效路径。

也有人认为这只是 Codex 的早期阶段，所以我们才需要学习这么多的提示词技巧，无论是使用案例驱动还是使用 /goal 命令，本质上都是为了让 AI 能更好的理解人类的需求。

就像 Midjourney 、Nano Banana 刚推出时，我们都热衷于找各种公开的提示词；而现在使用 GPT Image 2 在大多数的生图场景下，基本上都不需要专门的提示词格式，就能得到不错的效果。

等到 Codex 越来越好用，我们或许也不再需要这些官方使用模板。但从另一个角度来看，或许就是在这种模仿使用的过程中，我们才会更知道 AI 是如何提升我们的生活和工作效率。

因此，除了提升网速，我们还看到了一些 Codex 的其他玩法。像是使用 Codex 的定时任务，让它每天早上自动产出一份对应行业的日报；还有让 Codex 也能获得自我进化，从过去的对话里面提取出有用的技能；以及直接构建一个 macOS 应用；把 DeepSeek 接入 Codex 客户端等。

▲ 图片来源：X@hqmank

我们也继续尝试了一下那套让 Codex 自进化的提示词，它花了 7 分钟，帮我们创建了 3 个 Skills。

▲ 提示词来源：https://x.com/reach_vb/status/2058538305872949490

感觉这套提示词不仅仅可以用在 Codex 里面，几乎所有的 Agent 产品，都可以用它总结出一些可复用的流程，以子 Agent、Skill，或者自动化的形式重新编排。

回顾我最近 30 天的工作，若历史记录不足则查看所有可用历史，并识别值得打包的重复性手动工作流。

按以下顺序使用可用证据：
– 最近的 Codex 会话和任务摘要。
– Codex Memories 和 rollout 摘要，用于寻找跨会话重复出现的模式。
– 如果启用了 Chronicle，用它发现 Codex 之外的重复工作。Chronicle 仅用于发现；重要细节尽量回到相关源系统确认。
– 现有技能、自定义智能体和自动化，优先复用或扩展已有内容，避免重复建设。

广泛寻找那些重复、耗时、容易出错、依赖上下文，或适合标准化流程的工作。范围包括编码、研究、写作、规划、沟通、运营、分析，以及个人事务管理。

只有满足以下条件时，才把候选项纳入：
– 至少出现过两次，或明显会重复出现且重复成本高；
– 输入稳定、步骤可重复，并且输出或结束条件明确；
– 能明显提升速度、质量、一致性或可靠性；
– 当前还没有被充分覆盖。

选择最小且合适的形式：
– Skill：可复用的工作流或操作手册。
– 自定义子智能体：适合委派的、有边界的专项角色或调查任务。
– 自动化：定时或周期性的检查、报告、提醒或监控。
– Skip：过于一次性、模糊、敏感，或证据不足，不适合打包。

先输出一个简洁候选清单，包含：
– 重复工作流
– 支持证据与日期
– 频率 / 置信度
– 推荐形式：skill、subagent、automation、扩展已有内容，或 skip
– 为什么值得或不值得创建

然后只创建高置信度且当前缺失的项目。保持范围狭窄、实用、了解数据来源，并且容易验证。不要创建猜测性的、重叠的，或过于宽泛的资产。

最后总结：
– 你创建或扩展了什么
– 你刻意跳过了什么
– 哪些内容还需要更多证据后才能打包」