阅读视图

发现新文章,点击刷新页面。

DeepSeek-V4 正式发布:免费开源 + 百万上下文,Agent能力逼近顶级模型!

终于来了!时隔半年,DeepSeek 新一代模型 DeepSeek-V4 正式发布。这一次,它不仅在性能上大幅跃升,还直接把“开源大模型”的上限再次拉高。结合官方发布与实测,这篇文章带你系统看懂:DeepSeek-V4 到底强在哪?值不值得用?

1

 一、DeepSeek-V4 核心亮点

 1. 免费 + 开源 + 可商用

DeepSeek-V4 延续了 DeepSeek 一贯的策略:
完全开源(含权重)+ 支持商业使用

这意味着:

  • 企业可以直接落地应用
  • 开发者可以自由二次开发
  • 不再被 API 成本卡死

 2. 四大模型版本(按需选择)

本次一共发布了 4 个模型:

模型 参数规模 激活参数 类型
DeepSeek-V4-Flash-Base 284B 13B 基础模型
DeepSeek-V4-Flash 284B 13B 聊天模型
DeepSeek-V4-Pro-Base 1.6T 49B 基础模型
DeepSeek-V4-Pro 1.6T 49B 聊天模型

 简单理解:

  • Base:适合训练 / 微调 / 研究
  • Flash:轻量、响应快
  • Pro:最强性能版本

模型下载:【点击前往】或 【打包下载

 

2026 04 24 221652

3. 百万 Token 上下文(真正的质变)

DeepSeek-V4 支持 百万级上下文窗口

这是什么概念?

 一次性可以处理:

  • 《三体》三部曲(约 90 万字)
  • 再加一整套《哈利·波特》

这已经不是“长文本”,而是直接进入 “超长记忆模型”时代

 4. Agent 能力大幅提升

在 SWE-bench 测试中:

DeepSeek-V4-Pro 达到 80.6%

这意味着:

  • 能处理复杂工程任务
  • 支持多步推理
  • 能像“工程师”一样思考

性能已经接近顶级闭源模型。

dsv4 performance scaled

 二、实测环节:DeepSeek-V4 到底有多强?

下面是几个核心能力的实测复现👇

 测试1:大海捞针(长文本检索)

测试方式

在《三体》90万字文本中插入一句隐藏密码:

DS-V4-PASSWORD-2026-ROCKS

提问:

请告诉我文档中隐藏的测试密码是什么?

结果

 模型精准命中

DS-V4-PASSWORD-2026-ROCKS
2026 04 24 14 36 26.00 04 49 04.Still002 scaled

结论

  • 百万上下文不是噱头
  • 长文定位能力极强
  • 明显优于很多“小模型拼接方案”

 测试2:代码生成(从0到1)

输入需求

写一个番茄钟 Web 应用(HTML/CSS/JS)

输出表现

  • 一次性生成完整前端代码(约150行)
  • 包含:
    • ⏱ 倒计时
    • 📋 任务管理
    • 📊 图表统计

关键亮点

直接可运行!

一句话总结:

从需求到成品,只用了几十秒。2026 04 24 14 36 26.00 07 28 12.Still003 scaled

 测试3:Agent能力(工程级任务)

任务描述

生成一个 Python 脚本:

功能:

  • 扫描 Downloads 文件夹
  • 找出最近7天截图
  • 自动重命名

V4 的表现

第一阶段:主动输出风险评估

例如:

  • 文件重名
  • 权限问题
  • 空目录情况

2026 04 24 14 36 26.00 07 57 01.Still004 scaled

第二阶段:再生成代码

  • 支持 --dry-run
  • 结构清晰
  • 可直接运行

核心价值

 它不是“写代码”,而是:

像工程师一样思考代码

 测试4:图片识别 + 推理能力

任务

  • 解析复杂图表
  • 输出 Markdown 文档
  • 转换为 Mermaid 流程图

表现

  • 能理解结构关系
  • 输出清晰结构化内容
  • 还能给优化建议

2026 04 24 14 36 26.00 08 44 16.Still005 scaled

不足:

  • 美术类(SVG精美程度)一般

 三、对比:DeepSeek-V4 vs 其他模型

能力 DeepSeek-V4 一些小模型
长文本 ✅ 百万级 ❌ 易崩
代码生成 ✅ 工程级 ⚠ Demo级
Agent能力 ✅ ❌
开源 ✅ 完全开源 ❌ 多为闭源

 尤其是在长文本和工程能力上,差距非常明显。

 四、适合谁用?

 开发者

  • 做 AI 应用
  • 写代码
  • 自动化任务

 研究人员

  • 模型微调
  • Agent研究

企业

  • 私有化部署
  • 降低 API 成本

 五、如何获取?

官方模型已发布在 Hugging Face:

  • DeepSeek-V4-Pro(最强版本)
  • 完整模型集合

(直接搜索 DeepSeek V4 即可)链接直达:https://huggingface.co/collections/deepseek-ai/deepseek-v4

 六、总结

DeepSeek-V4 这一代的关键词只有三个:

更长(百万上下文)
更强(Agent能力)
更开放(完全开源)

如果说上一代只是“强模型”,
那这一代已经是:

真正能干活的 AI 工程助手

 最后一句话

如果你还在观望开源模型:

DeepSeek-V4,很可能就是当前最值得上手的一款。

❌