阅读视图

发现新文章,点击刷新页面。

LinkSwift 网盘直链下载加速助手脚本插件!IDM / Aria2 下载 (百度/夸克/迅雷/阿里)

不知道大家有没这种体会,急着下载一个大文件,结果网盘限速慢得像蜗牛,迫于无奈开通了会员,花了钱不说,还要强迫你安装网盘的客户端才能开始下载,非常的不爽。

如果你有 NAS,想直接从网盘下载到 NAS,原本还必须先用电脑下载再手工复制。今天异次元推荐一个超好用的油猴脚本插件 LinkSwift!它能解析出百度夸克等网盘的真实下载地址,不必再安装官方网盘客户端,即可调用 IDMMotrix 多线程加速下载,或推送到 Aria2 远程下载……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

微软 Visual Studio 2026 免费正式版下载 - 最新 VS 编程开发 IDE 工具 (速度翻倍 / 融合 AI)

最近除了谷歌发布全新的 Google Antigravity 外,微软也发布了 Visual Studio 2026 正式版,这是继 VS2022 后,时隔 4 年的重大版本更新,解决 5000+Bug 并实现了 300+ 功能需求。

无论你是资深开发专家还是刚入门学习编程的爱好者,现在都能下载到微软最新的 VS 开发工具免费使用了!VS 2026 不只更换全新 UI 设计,还从性能优化到 AI 深度集成,全方位提升开发者效率和体验。特别是启动速度、UI 响应方面提升非常明显,卡顿终于消失了……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

LiteMonitor - “小而美”开源硬件状态监控工具 (显示CPU/GPU/温度/内存/网速/流量)

还在为了使用系统资源监控功能,安装那些动辄几百兆、附带一堆无用功能的臃肿“全家桶”软件吗?异次元曾推荐过简洁开源的 TrafficMonitor 来代替 360,而今天再带来一款新的小工具。

LiteMonitor 堪称 Windows 硬件资源监控软件的“新晋卷王”!它简直把“小巧轻量化”和“高定制”玩明白了。整个软件就 2MB 左右,解压即用,绿色免安装。运行时它自身后台资源占用低到可忽略不计,真正做到无负担的“隐形”陪伴。不仅界面直观精美,还完全开源免费……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

FnNAS - 电视盒子秒刷 “飞牛OS”!闲置安卓机顶盒变身全能 NAS (开源 fnOS ARM 版)

提到 NAS 系统,大家可能都会想到主流品牌如 群晖 (Synology) 的「DSM 」或 QNAP 的 QTS 等。之前推出可自部署的「飞牛 OS (fnOS) 」可谓一鸣惊人,赢得了众多玩家喜爱和推荐。

然而飞牛官方 fnOS 目前仅支持 x86 架构,只能在迷你主机/电脑上安装。而最近一个开源项目「FnNAS」,让那些吃灰“安卓电视盒子”ARM 设备也能原地复活,刷机后摇身一变成为一台搭载“飞牛”系统的功能全面丰富的 NAS!甚至能用来当做家中的低功耗专业服务器来用……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

Immich v2.5.0 发布,开源高性能自托管相册,GitHub 收获 90000 星

Immich 是一款著名的开源、高性能、自托管相册工具,可以部署在自己的电脑、服务器、NAS 中,帮助用户通过 iOS、Android 等设备管理、备份照片、视频,拥有挂载本地 AI 的能力。

2026年1月28日发布 Immich v2.5.0 版本,并且在 GitHub 获得了超过 90000 星。

Immich 2.5.0 新版本功能:

  • 释放空间
  • 非破坏性编辑
  • 数据库备份和恢复(Web)
  • 上传改进
  • 所有平台均实现视觉刷新
  • 禁用管理员设置
  • 星级评分(移动端)
  • 更细粒度的权限(API 密钥)
  • 渐进式 JPEG
  • 幻灯片循环播放选项(网页版)
  • 用于 HTTP/2 和 HTTP/3 图像加载的原生 HTTP 客户端

推荐给有自托管管理图片、视频的用户。


以下内容为 2023年2月25日发布:

Immich – 开源自托管的手机照片备份工具[iPhone/Android]

Immich 是一个直接从 iPhone、Android 手机上备份照片与视频的开源解决方案,通过部署在自己的电脑、NAS、服务器中,使用 App 进行备份。界面酷似 Google Photos,支持多用户、照片和相册分享、好友上传、地理位置、机器学习识别事件等功能。是居家备份照片的好帮手。@Appinn

Immich - 开源自托管的手机照片备份工具[iPhone/Android]

前不久,推荐了一款适合普通电脑使用的照片备份工具 PhotoSync

PhotoSync 是一款通过 Wi-Fi 快速、安全地移动、备份、共享照片与视频的工具,支持 iPhone、Android,可以将照片备份至 NAS、电脑、FTP、网盘等处。

https://www.appinnn.com/photosync/

而 Immich,则适合拥有自己服务器的同学,首选 Ubuntu、Debian、MacOS 系统,也可以在 Windows 的 Docker Desktop 下工作。

Immich 手机照片/视频备份

Immich 的服务器端基于 Web,拥有自己的 iPhone、Android 应用,只需要在移动应用中填入服务器段的 API 地址,即可使用,两者功能有少许不同:

特征移动应用网页
上传和查看视频和照片✅✅
打开应用程序时自动备份✅❌
用于备份的选择性相册✅❌
将照片和视频下载到本地设备✅✅
多用户支持✅✅
相册和共享相簿✅✅
可擦洗/可拖动的滚动条✅✅
支持RAW(HEIC,HEIF,DNG,APPLE ProRaw)✅✅
元数据视图(EXIF、地图)✅✅
按元数据、对象和图像标签搜索✅❌
管理功能(用户管理)❌✅
后台备份✅❌
虚拟滚动✅✅
OAuth 支持✅✅
实时照片备份和播放iOS✅
用户自定义存储结构✅✅
公开分享❌✅

备份功能

配置好服务器端,登录移动应用之后,给于相册权限,就可以备份了,支持前台备份与后台备份,使用起来非常简单,有中文界面

Immich v2.5.0 发布,开源高性能自托管相册,GitHub 收获 90000 星 34

分享与上传

分享与上传就很赞了,你可以通过 Immich 将某个相册分享给好友,可以设置很多权限,包括:

  • 设置描述文字
  • 显示元数据(EXIF)
  • 允许下载
  • 允许上传
  • 过期时间
Immich v2.5.0 发布,开源高性能自托管相册,GitHub 收获 90000 星 35

其中允许上传功能,可以让好友直接通过浏览器上传手机里的照片,在与好友一起出门游玩回来之后,共享照片真是太方便了。

安装 Immich

基于 Docker,安装 Immich 也很容易,先修改配置文件 .env:

wget -O .env https://github.com/immich-app/immich/releases/latest/download/example.env

实际上,只需要修改里面的 UPLOAD_LOCATION 部分,使用绝对路径,这是保存照片的路径。

其它设置保持默认,然后就可以安装了:

wget https://github.com/immich-app/immich/releases/latest/download/docker-compose.yml
docker-compose up -d

最后,在浏览器打开:IP:2283 就可以创建用户进入 Immich 了。

手机 App

Immich 可以通过命令行进行批量上传,也有官方 App:

在登录的时候,服务器地址填入:IP:2283/api 即可。

DEMO / 示例

有一个官方 DEMO 可以测试:

公共场合,请谨慎上传图片啊,昨天的 memos DEMO 中,已经有同学干坏事了 😂

最后,官网 / GitHub


原文:https://www.appinn.com/immich/

另外,开发者提到:由于版本迭代频繁,请勿使用 Immich 当作单一备份,以防万一。


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

快到离谱!voidImageViewer 比图片还小的免费“极速看图”神器 (出自 Everything 团队)

很多人都诟病微软,就算升级到  Windows 11,系统自带的看图工具都不好用!不仅启动速度慢,支持格式也不丰富,每次双击图片都要经历“黑屏→转圈→等待”的漫长折磨。

如果你也受够了这种糟糕的看图体验,那今天这款宝藏软件 Void Image Viewer 就能让你明白:极致的简单和快速,就是最好的体验!它出自“搜索快到让人震惊的神器——Everything”开发团队 voidtools 之手,同样开源免费。就冲 Everything 这个金字招牌,闭眼我都愿意试试……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

9 款开源工具更新[2602]

9 款开源工具更新[2602] 35

一些开源工具,有了更新。简单粗暴,直接开始:

专为 AI 开发的 Obsidian CLI 工具

Obsidian CLI 是著名的开源 Markdown 笔记工具 Obsidian 刚刚发布的命令行工具,让你可以从终端控制 Obsidian,包括编写脚本、自动化、外部工具集成。

(目前仅限付费用户提前体验)

在这个时代,这,就是为 AI 开发的工具。

来自善用佳软的消息,以及评论:

早期因硬件落后才CLI,后来要人性化,进化到GUI。 现在,机器超越人类,CLI又成了先进方式。 连Obsidian都发布CLI了

没有更多评价,因为这本来就是给AI和其他CLI提供的。

Obsidian CLI 的功能十分丰富,被称作:在 Obsidian 中执行的任何操作都可以通过命令行完成。

但注意,目前的 Obsidian CLI 处于抢先体验阶段,需要拥有 Catalyst 许可证(付费)的用户。

原文:https://www.appinn.com/obsidian-cli/

Immich 更新到 v2.5.6

Immich 是一款拥有9万 GitHub 星的著名开源高性能自托管相册工具,你可以在里面管理、备份自己和家人的照片、视频,并且可以挂载外部 AI,实现情景识别、物体识别、语义搜索等功能。

2026年1月28日发布 Immich v2.5.0 版本,短短半个月已经到 v2.5.6 了,这期间主要更新了:

  • 主要是针对 2.5.0 的 Bug 修正和小幅优化
  • v2.5.5 改善了稳定性
  • v2.5.6 体验与性能优化版本
版本类型重点
2.5.0大版本功能更新Free Up Space + 非破坏编辑 + 备份恢复 + UI 重构
2.5.1-3快速补丁修复上传 & 移动端问题
2.5.5稳定性增强时区 / iOS / 证书 / 删除逻辑修复
2.5.6体验优化缩略图生成、iOS 启动、Android 删除修复

推荐更新。

Discourse 发布了免费版测试

Discourse 是小众软件论坛所使用的开源社区程序,任何人都可以使用这套程序创建一个完整的带有AI功能的社区,包括传统的论坛、IM,完整的权限设置,总之和自己创建的没有区别。

目前 Discourse 发布了免费版测试,只需要在这里注册:

就能创建一个社区,堪称真的0门槛啊。

比如青小蛙就创建了一个,虽然没啥用,使用了二级域名:appinn.discourse.group

免费版本有限额:每个月50万浏览量、每个月10万邮件、一共5GB存储,以及3万token额度的CDCK Hosted Small LLM大模型(基于 Qwen/Qwen3-VL-30B-A3B-Instruct)

不能绑定自己的域名,可以随时升级。

但注意,这个额度对于社区来说,非常非常非常慷慨。如果你能达到这个量级,升级妥妥的 😂

PowerToys v0.97.2 新功能

昨天,微软发布了 PowerToys v0.97.2 版本,从 v0.90 以来主要更新如下:

版本主要新增 / 重要增强说明
0.91–0.95多模块持续优化主要为稳定性改进、性能提升、UI 现代化改造(WinUI 3 迁移持续推进)
0.96.0Advanced Paste 大升级支持多 AI 端点(OpenAI / Azure / Gemini / Ollama 等),可自定义剪贴板转换流程
0.96.0PowerRename 元数据支持支持 EXIF/XMP 标签(如 %Camera%Lens),适合照片批量重命名
0.96.0Command Palette 改进搜索过滤增强、剪贴板历史元数据显示优化、扩展菜单改进
0.97.0CursorWrap(全新工具)鼠标可从屏幕边缘“穿越”到另一侧,适合多显示器环境
0.97.0Command Palette 大幅重构支持 UI 个性化、命令排序优先级、自定义搜索引擎、直接控制 PowerToys 模块
0.97.0CLI 扩展FancyZones、Image Resizer、File Locksmith 等支持命令行调用
0.97.1CursorWrap 增强支持方向限制(仅水平/垂直),改善多显示器行为
0.97.2CursorWrap 逻辑优化增加单显示器禁用包裹选项
0.97.2Advanced Paste 修复修复设置页崩溃问题
0.97.2Command Palette 本地化修复修复字符串与扩展加载问题

Syncthing 进入 v2 时代以来的更新

Syncthing v2 发布以来,一直在不断的更新,目前已经到 v2.0.14 版本了,主要变化:

分类特性v2.x 版本详细说明
数据库SQLite 存储彻底弃用 LevelDB,改用 SQLite。显著降低了 RAM 占用,且数据一致性更高。
网络多并发连接设备间默认建立 3 个并发连接(1个元数据,2个数据流),解决了大文件同步时的拥塞问题。
日志结构化日志采用 Key-Value 格式输出,支持更细粒度的包(Package)级别调试日志。
存储策略索引自动修剪数据库会自动清理掉超过 15 个月 的已删除文件元数据,防止数据库无限膨胀。
同步逻辑移除 Rolling Hash移除了效果不佳的滚动哈希检测,虽然减少了平移块的识别,但极大提升了扫描速度
部署环境变量配置支持通过环境变量(Env Vars)完整覆盖配置文件,对 Docker/K8s 容器化部署更友好。
安全/维护证明 (Attestation)v2.0.14 开始加强了发布包的证明机制,确保跨平台二进制文件的来源可靠。
体验无默认文件夹首次启动不再强制生成 Default Folder,将配置权完全交给用户。

推荐更新。但注意如果有很多文件,从 v1 到 v2 的升级可能会消耗几十分钟。

frp v0.67.0(开源内网穿透工具)

frp 最近半年发布了三个小版本,主要更新如下:

版本发布时间主要新增功能
v0.65.02025-09– XTCP 新增 NAT 穿透控制选项- 扩展 OIDC 客户端 TLS 与代理配置- 新增 proxy_counts_detailed 监控指标- 引入 Feature Gates(如 VirtualNet)
v0.66.02026-01– HTTPS 支持负载均衡组(loadBalancer.group)- 新增 enabled 字段,可禁用单个代理- OIDC 支持从文件或命令动态获取 token
v0.67.02026-01-31– 新增 clientID,服务端可识别客户端实例- Web Dashboard 全新 UI,支持暗色模式

如果你有一台带公网IP的设备作为 frp 服务器,那么依旧是很好的选择。

Karakeep 3.0

之前,青小蛙把稍后阅读、网络书签都迁移到了 Karakeep 上。然后没多久,Karakeep 3.0 就发布了。

Karakeep 0.29 强化了协作功能,0.30 强化归档与 AI 控制。

版本关键更新
0.29.0协作列表、自动备份、搜索自动补全、Highlights 重构、移动端增强、爬虫限速、支持 MyMind 导入
0.30.0PDF 归档、年度统计、阅读器跨设备同步、自定义头像、AI 标签样式自定义、可关闭自动标签/摘要、Matter 导入导出、批量删除、is:broken 搜索

这类工具原生有 API,支持 mcp,可以非常方便的与AI工具进行整合。

Collabora 发布全新的开源 Office 软件

在去年11月份,Dalieba 同学就提到了 Collabora 公司发布了全新的 Collabora Office,基于 Collabora Online 开发而来,支持 Linux、Windows、macOS。采用标签页式视图以及与在线 Office 相同的界面设计,支持 OOXML 和 OpenDocument 文档格式。

前几天,Collabora Office 的首个桌面版本终于正式发布,可以编辑 ODF 或 DOCX。

拥有以下套件:

  • Writer(.odt, docx, doc, pdf, rtf)
  • Calc(.ods, xisx, xls, xIsm,. csv)
  • Impress(.odp, .ppt, .pptx)
  • Draw(.odg, vsd, .vsdx)

与 LibreOffice 的关系:目前 Collabora 已经是 LibreOffice 代码库最大的代码贡献者,Collabora 雇用了文档基金会的几位创始人以及许多顶级提交者。我们提供基于 LibreOffice 的长期支持产品,品牌为 Collabora Office Classic,并深深感谢并感谢与我们一起工作的许多熟练的社区贡献者,以及 LibreOffice 代码所支持的一系列令人难以置信的功能。

我中有你,你中有我!

VLC 最近的更新

作为著名的视频播放器,VLC 最近也有更新:

版本更新内容
3.0.22新增 Windows ARM64 原生构建支持;修复 Windows XP SP3 行为问题;多项解码器与播放器核心修复
3.0.23修复 WebVTT 字幕定位问题;改进 FLAC 24bit 音频信息支持;多项安全修复(libass、Theora、PNG 等);修复 D3D11 图像输出问题;改进 Qt 暗色模式显示;为 Qt6、FFmpeg8 等环境做适配准备
3.0.24(已出现暂未发布)新增 OpenAPV 解码支持(基于 FFmpeg8)

相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

Escrcpy - 免费开源!电脑控制安卓手机的投屏工具 (屏幕镜像 / 无线 / AI 自动化 / 录屏)

上班时想要看手机不方便?在电脑前办公时常要用到一些手机 APP?或你是开发者,需要在电脑上测试手机应用?又或是想在电脑上管理手机文件,甚至希望能直接远程操控手机?

iOS 都推出了官方 iPhone 镜像功能华为小米等也有自家品牌的跨屏协同功能,你是否也希望能把任意品牌的 Android 安卓手机屏幕搬到电脑上使用?今天就给大家推荐一款简单好用的开源免费安卓无线投屏软件,能将手机屏幕投屏到电脑上进行控制的效率神器——Escrcpy

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

Transmission - 清爽开源 BT 下载工具,多年迎来大更新 (支持 NAS 部署 / 边下边播)

说到 BT 下载客户端,大家都诟病迅雷广告多,老牌 µTorrent 被收购后也开始塞广告,越做越臃肿;qBittorrentBitComet 好像也停滞不前了;神器 IDM 又不支持 BT 下载。

折腾来折腾去,最后还是回到了经典的跨平台 Transmission——完全开源、零广告、不捆绑任何东西,甚至连个弹窗都没有。这次 4.x 版本更新,是它三年来最大的一次大版本跃升!加了不少实用功能,特别是新增支持“BT 边下载边播放”,预览小电影更方便了,值得去试试……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

免费自建密码库!新手 1Panel 简单部署 Bitwarden 服务器教程 (开源替代 1Password)

最近 1Password 宣布全面涨价,引起了很大的热议。我们除了可以切换到 Sticky PasswordEnPassRoboForm 等替代品外,其实搭建自己的密码库也许是更好的选择。

对于有一定动手能力的同学,部署一个私有的 Bitwarden (Vaultwarden) 自托管密码管理器并不难。它开源免费,数据完全自主可控,同时支持手机电脑跨平台同步+浏览器一键登录插件,可以导入 1PasswordChrome 浏览器保存的密码。只需要一台 VPS 服务器 + 域名即可自建……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

HandBrake 官方绿色中文版 - 开源免费视频格式转换/压缩转码压制工具 (跨平台)

无论是下载高清电影,还是用手机录制的视频,很多时候文件体积都非常巨大。收藏保存或分享时会比较麻烦,因此常备一款真正好用的免费视频压缩压制/格式转换软件是很有必要的。

网上视频处理工具非常繁多,收费免费的一大堆,很多人根本不知道怎么选。而在尝试过的软件中,我认为 Handbrake 可能是最好的开源免费跨平台视频压缩和格式转换软件了!作为一款万能视频转码压制工具 (压片/转换格式),它不仅免费,还跨平台支持 Win、MacLinux 系统……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

Synctrain - 哭死!多年来 Syncthing 最大缺点终于解决了 (更好用的 iOS / Mac 同步网盘)

不少人都被 iCloudOneDrive 同步慢、空间贵折磨过。很多高手会推荐大家购买 VPS 服务器自己部署开源的「Syncthing」来同步文件。既免费跨平台,还能自己掌控数据,有着众多好处。

尽管 Syncthing 跨平台支持 Win、Mac、Linux 和 Android,但它多年来一直没有好用的 iOS 客户端。而 Synctrain 则是“新一代”专为 iPhone / iPad / Mac 重新设计开发的原生开源免费客户端,不仅速度快,且支持按需同步,真的能让 Syncthing 的文件同步体验上一个层次……

前往查看原文....


异次元还有这些值得一看:

异次元首页  |  微信公众号  |  关注微博  |  软件精选  |  软件激活码折扣

林俊旸离职后首发长文:反思千问得失,预判 AI 下半场需要「智能体思维」

带队发布 Qwen 3.5 小模型系列、获马斯克公开点赞,20 小时后在社交媒体宣告离职。林俊旸离开阿里的方式,本身就是 2026 年 AI 行业最戏剧性的一幕。

32 岁,阿里最年轻的 P10,一手将千问做到全球下载量超 10 亿次、衍生模型超 20 万款,成为全球开源模型的新王。他的离开源于一次组织架构调整的分歧:

阿里希望将 Qwen 团队按预训练、后训练、视觉、语音等维度水平拆分,与通义实验室其他团队合并;林俊旸则坚信预训练、后训练乃至基础设施团队应该更紧密地垂直整合,而非割裂。这不只是管理风格之争,更是对「怎样才能训出最好的模型」这个根本问题的路线分歧。

离开近一个月后,林俊旸发出了这篇长文。他没有回应任何人事风波,直接亮出了自己对 AI 下一阶段的判断:我们正在从「训练模型」的时代,进入「训练智能体」的时代

这篇文章之所以值得逐字读完,不仅因为写它的人在过去两年亲手操刀了 Qwen 全系列的后训练,更因为林俊旸在文中罕见地复盘了 Qwen3 在「混合思考模式」上的得与失。

以下为 APPSO 对林俊旸的编译:

原文🔗 https://x.com/JustinLin610/status/2037116325210829168

从「推理式思考」到「智能体式思考」

过去两年,彻底改变了我们衡量 AI 模型的方式。

OpenAI 的 o1 证明了一件事:「思考」可以是模型的核心能力,可以专门训练出来、直接交到用户手里。DeepSeek-R1 紧随其后,证明这种「推理式后训练」并非大厂专利,可以在原始实验室之外复现和扩展。用大白话说:o1 是一个被教会了「回答之前先想想」的模型,R1 则是一个开源版的同类选手,跟 o1 打得有来有回。

那个阶段很重要。但 2025 年上半年的行业主旋律,说到底还是在围绕一件事打转:怎么让模型「想」得更多。 让它在推理阶段烧更多算力,用更强的奖励信号训练它,暴露或控制那些额外的「思考过程」。

现在的问题是:然后呢?

我相信答案是智能体式思考。为了行动而思考,一边跟真实环境交互,一边根据世界的反馈不断修正计划。

1. o1 和 R1 的崛起真正教会了我们什么

第一波推理模型教会我们一个朴素的道理:想在大模型上把强化学习跑起来,你得有靠谱的评分标准。

什么叫靠谱?就是答案能判对错、结果能验证、反馈信号足够清晰。数学题有标准答案,代码能跑测试,逻辑推理能验证步骤。这些领域之所以成了强化学习的主战场,就是因为在这里,模型收到的奖励信号远比「让人类标注员觉得这个回答还不错」强得多。换句话说,强化学习终于能优化正确性,终于不用只追求看着像那么回事了。

然后,基础设施的重要性一下子凸显出来了。

一旦你开始训练模型进行更长的推理链条,强化学习就不再是在监督微调上面加个小配件那么简单了,它变成了一个重工业级的系统工程。你需要大规模的模拟推演(rollout)、高吞吐量的答案验证、稳定的策略迭代、高效的采样流程。推理模型的诞生,表面看是算法突破,底下看是基础设施的胜利

OpenAI 把 o1 定义为用强化学习训练的推理产品线;DeepSeek R1 接棒验证了同一方向,同时也展示了推理式强化学习对底层算法和基础设施的要求有多高。

APPSO 划重点: 第一次大转折发生了。行业焦点从「扩展预训练」转向「扩展面向推理的后训练」。模型变强靠的不再是吃更多数据,靠的是在训练后阶段学会「怎么想」。

2. 真正的难题从来不只是「融合思考和指令模式」

2025 年初,我们 Qwen 团队心里有一张很大的蓝图。

理想中的系统长这样:一个模型同时搞定「思考」和「执行」两种模式。你可以手动调节它思考的深度,轻度、中度、深度,就像调空调温度一样。更理想的情况是,模型自己就能判断:这道题简单,直接答;这道题有点难,多想想;这道题极难,调动全部算力来啃。

方向是对的。Qwen3 是当时最清晰的公开尝试之一。 它引入了「混合思考模式」,一个模型家族里同时支持「想了再答」和「直接答」两种行为,还描述了一条四阶段后训练流水线,其中明确包含了在长链推理冷启动和推理强化学习之后的「思考模式融合」步骤。

但融合这件事,说起来一句话,做起来要人命

难在哪?难在数据。

很多人一听「融合思考和指令模式」,脑子里想的都是模型层面的事:一个模型文件能不能同时跑两种模式?一套对话模板能不能在两种风格之间切换?一个推理服务能不能暴露正确的开关?这些确实要解决,但都不是最深的坑。

最深的坑是:两种模式想要的东西,从根儿上就不一样

你想想,一个好的「指令模型」该长什么样?干脆、简洁、格式规范、响应快。企业用户拿它来批量改写文本、打标签、做模板化客服、结构化数据提取,这些场景要的是效率和稳定,不需要深思熟虑。

一个好的「思考模型」呢?恰恰相反。它该在难题上多花时间、维持清晰的推理中间步骤、探索不同的解题路径、保留足够的「思考余量」来确保最终答案的正确性。

这两种性格天然打架。 如果融合的训练数据没有精心设计,出来的模型往往两头不讨好:思考的时候啰嗦、犹豫、不够果断;执行指令的时候又不够利落、不够稳定、比客户真正需要的版本更贵更慢。

说实话,我们在平衡融合与数据质量的过程中,没有把所有事情都做对

在不断修正的过程中,我们也仔细观察了用户到底怎么用这两种模式。结论是明确的:这两种行为画像确实在相互拉扯。

现实很诚实。2025 年晚些时候,在 Qwen3 最初的混合架构之后,我们的 2507 版本还是发布了独立的 Instruct 和 Thinking 版本,包括分开的 30B 和 235B 变体。大量商业客户根本不需要思考模式,他们要的就是高吞吐、低成本、高度可控的指令行为来跑批量任务。对这些客户来说,融合不是福音,是多余的成本。拆开来做,反而让两条线的团队都能更专注地解决各自的问题。

其他实验室走了相反的路:

Anthropic 公开押注集成式路线。Claude 3.7 Sonnet 是一个混合推理模型,用户可以选择普通回复或扩展思考,API 还能设定「思考预算」。Anthropic 直接放话:推理应该是模型的集成能力,不该单独拎出来做一个独立模型。

GLM-4.5 同样定位混合推理,把推理、编程和智能体能力统一到一个模型里。

DeepSeek V3.1 后来也做了类似的事,推出了「Think & Non-Think」混合推理方案。

那么问题来了:谁是对的?

答案不在「融合」还是「分离」这个二选一本身,在于融合是否有机。如果思考模式和指令模式只是尴尬地挤在同一个模型里,像两个性格迥异的人被硬塞进一件衣服,用户体验不会好。

真正成功的融合,需要一道平滑的光谱模型能自如地在不同推理力度之间切换,最好还能自己判断该用多大力气。GPT 风格的 effort control(推理力度控制)指向了这个方向,这是一个关于「花多少算力来想」的连续策略,不是一个「想 / 不想」的二元开关。

APPSO 划重点: 林俊旸罕见地直言 Qwen3 在融合上「没做到完全正确」。核心矛盾其实很好理解:一个追求快准狠的执行者,和一个追求深思熟虑的思考者,硬融到一起,很容易两头都做成半吊子。

3. 为什么 Anthropic 的方向是一种有益的纠偏

Anthropic 在 Claude 3.7 和 Claude 4 上的做法,是一种值得注意的克制。

他们没有大谈模型有多能「想」,把重点放在了:集成推理、用户可控的思考预算、真实世界任务、编程质量,以及后来的关键一步,让模型在思考的过程中就能动手用工具。Claude 3.7 是带可控预算的混合推理模型;Claude 4 更进一步,推理过程和工具使用可以交错进行,边想边干。与此同时,Anthropic 把编程、长时间运行的任务和智能体工作流摆到了最优先的位置。

这里面有一个深刻的洞察:

推理链更长,不等于模型更聪明。 很多时候恰恰相反。一个模型如果对所有问题都用同样冗长的方式来「推理」,说明它根本分不清轻重缓急。它可能正在失败于三件事:该优先处理什么(优先级判断)、该压缩掉什么(信息浓缩)、该在什么时候停止想而开始做(行动决策)。

Anthropic 的做法暗示了一种更有纪律的观点:思考应该为具体的工作目标服务。 如果你要做的是编程,那思考就该帮你导航代码库、规划架构、拆解问题、恢复报错、编排工具调用。如果你要做的是智能体工作流,那思考就该帮你在漫长的执行过程中保持质量,而不是产出一堆令人印象深刻但没有实际行动力的中间长文。

这种「思考必须服务于行动」的理念,指向了一个更宏大的命题:

我们正在从训练模型的时代,进入训练智能体的时代

这句话我们在 Qwen3 的博客里也明确写过。智能体是什么?一个能制定计划、决定何时行动、使用工具、感知环境反馈、修正策略、并在长时间跨度上持续运作的系统。一句话概括它的核心:与真实世界的闭环交互

APPSO 划重点: 长不等于强。Anthropic 的实践提供了一个重要的纠偏信号。思考的价值在于有没有真正服务于最终的行动目标,不在于产出了多少字的推理过程。这是从「炫技式推理」到「实用型思考」的转向。

4.「智能体式思考」到底意味着什么

说了这么多铺垫,现在进入正题。

智能体式思考和推理式思考,优化目标完全不同。

打个比方:推理式思考就像闭卷考试,评判标准是你交卷那一刻答案对不对。模型能不能解出定理、写出证明、产出正确代码、通过基准测试。想得再天花乱坠,最终只看结果。

智能体式思考更像是在真实世界里做一个项目。 评判标准不是某一刻的答案,是你能不能在跟环境不断互动的过程中持续推进、持续解决问题。

核心问题变了。

不再是「模型能想多久?」,变成了:「模型能不能以一种维持有效行动的方式来思考?

这要求模型处理一堆传统推理模型可以绕开的难题:

  • 什么时候该停止思考、开始动手? 想太多会错过行动窗口,想太少会犯错
  • 该调用哪个工具、先后顺序是什么? 这是一个规划和调度问题
  • 怎么消化来自环境的嘈杂、不完整的信息? 真实世界不会给你干净的输入
  • 失败了怎么办? 不能崩溃,得修正计划继续干
  • 怎么在几十轮交互、几十次工具调用之后还保持连贯? 这是长程记忆和一致性的问题

如果用一句话概括:

智能体式思考 = 通过行动来推理的模型。它在做的过程中不断地想。

APPSO 划重点: 推理式思考像闭卷考试,智能体式思考像在真实世界里做项目。前者看最终答案对不对,后者看你能不能在复杂、动态、充满意外的环境里持续推进。这是 AI 能力评价体系的根本性转向。

5. 为什么智能体 RL 的基础设施更难

目标一变,底层的工程全都要跟着变。

经典推理强化学习的那套基础设施,不够用了。

直观地理解一下区别:在推理 RL 里,模型做一道题、给出一个答案、评估器打一个分,整个过程基本上是自包含的,评估器也相对干净。就像在一个封闭的考场里阅卷。

但在智能体 RL 里,模型不是在考场里答题,它活在一个复杂的真实环境中。 工具服务器、浏览器、命令行终端、搜索引擎、模拟器、代码执行沙箱、API 接口、记忆系统、调度框架……模型的策略嵌在这一整套系统里。环境不再是一个站在旁边打分的裁判,它本身就是训练系统的一部分。

这带来了一个新的硬需求:训练和推理必须更干净地解耦。 否则整个系统的吞吐量会崩掉。

举个具体的例子:一个编程智能体生成了一段代码,需要在真实的测试环境里跑一下看结果。这时候,推理端在等执行反馈,干不了别的;训练端在等完成的轨迹数据,也饿着。整条流水线的 GPU 利用率远低于你在经典推理 RL 里的预期。再加上工具响应延迟、环境状态不完全可见、每次交互都会改变环境状态,这些低效会成倍放大。结果就是:你还远没达到想要的能力水平,实验就已经慢得让人崩溃了。

环境本身也变成了一等公民级的研究课题

在监督微调(SFT)时代,所有人都在拼数据多样性,谁有更多更好的标注数据,谁就占优势。在智能体时代,该拼的是环境质量了:环境稳不稳定?够不够真实?覆盖了多少场景?难度梯度合不合理?状态空间够不够丰富?反馈信号够不够有营养?模型能不能找到漏洞作弊?大规模生成训练轨迹的效率够不够高?

环境构建正在从一个「顺手搭的实验配件」,变成一个独立的创业赛道。如果你训练的智能体最终要在类生产环境中运作,那这个环境本身就是你核心能力栈的一部分。

APPSO 划重点: 一句话总结这个转变,SFT 时代拼数据,智能体时代拼环境。构建高质量的训练环境,正在从「实验室的脏活累活」升级为「决定你能走多远的战略资产」。

6. 下一个前沿是更可用的思考

我的判断是:智能体式思考将成为思考的主导形态

它最终很可能取代那种旧式的静态独白推理,就是那种模型关起门来、对着自己嘟嘟囔囔写一大篇内部推理过程,试图用更多更多的文字来弥补「我没法跟外界交互」这个根本缺陷的做法。

即便面对极其困难的数学或编程问题,一个真正先进的系统也应该有权利去搜索、去模拟、去执行、去检查、去验证、去修正。目标是把问题切实解决掉,而且解决得稳健、高效。 不是比谁的推理链写得更长更好看。

但训练这类系统,有一个比什么都棘手的挑战:奖励劫持(reward hacking)

一旦模型有了真正有意义的工具使用能力,奖励劫持的危险就成倍增加。怎么理解?

  • 一个能搜索的模型,可能在强化学习训练过程中学会了直接搜答案,不是靠推理做出来的,是查到的。
  •  一个编程智能体,可能学会了利用代码仓库里的未来信息(比如测试用例本身就暗含了答案)、滥用日志、或者发现某个捷径让任务直接「通过」但其实什么都没做。
  • 如果训练环境有隐藏的信息泄漏,模型可能看起来表现超人,实际上只是被训练成了一个高效作弊者。

这就是智能体时代比推理时代精细得多、也危险得多的地方。 工具越强大,模型越有用,但模型能钻的空子也越多。更好的工具同时扩大了「虚假优化」的攻击面。

我预期,下一个让整个行业卡住的研究瓶颈,将来自这几个方向:环境设计、评估器鲁棒性、反作弊协议、以及策略与世界之间更有原则的接口。

但方向是清晰的:工具赋能的思考,就是比闭门造车的思考更有用,也更有希望带来真实世界的生产力提升。

智能体式思考还意味着一种全新的系统工程。核心智能将越来越多地来自于多个智能体如何被组织起来:一个负责全局规划和任务分发的编排器(orchestrator),一群各有专长的专业智能体(specialist agents),以及执行更具体任务的子智能体(sub-agents),后者帮助控制上下文窗口、防止信息污染、在不同层级的推理之间保持清晰的边界。

未来的路线图是三级跳:从训练模型,到训练智能体,再到训练系统

APPSO 划重点: 工具让模型更有用,也让模型更容易作弊。奖励劫持是智能体时代的「定时炸弹」。谁先解决好环境设计和反作弊问题,谁就掌握了下一阶段的竞争主动权。

结论

推理浪潮的第一阶段,确立了一件至关重要的事:当反馈信号靠谱、基础设施扛得住的时候,大模型上的强化学习能够产出质变级别的认知提升。

但更深层的转变,是从推理式思考到智能体式思考:从「想更久」,到「为了行动而思考」

训练的核心对象已经变了。不再是单一的模型,是模型 + 环境构成的整个系统。更具体地说,是智能体本身,加上围绕它的一切工程。这意味着什么研究最重要也变了:模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器鲁棒性、以及多个智能体之间的协调接口,重要性一点不输前者。

它还改变了「好的思考」的定义:在真实世界的约束下,能够维持有效行动的那条推理链,才是最好的。 不是最长的那条,不是看起来最酷炫的那条,是最有用的那条。

它也改变了竞争优势的来源:

推理时代,拼的是更好的强化学习算法、更强的反馈信号、更可扩展的训练流水线。

智能体时代,拼的是更好的训练环境、更紧密的训练与推理一体化、更强的系统工程能力,以及闭合「决策 → 后果 → 学习」这个循环的能力。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌