LinkSwift 网盘直链下载加速助手脚本插件！IDM / Aria2 下载 (百度/夸克/迅雷/阿里)

2025年10月18日 21:17

不知道大家有没这种体会，急着下载一个大文件，结果网盘限速慢得像蜗牛，迫于无奈开通了会员，花了钱不说，还要强迫你安装网盘的客户端才能开始下载，非常的不爽。

如果你有 NAS，想直接从网盘下载到 NAS，原本还必须先用电脑下载再手工复制。今天异次元推荐一个超好用的油猴脚本插件 LinkSwift！它能解析出百度、夸克等网盘的真实下载地址，不必再安装官方网盘客户端，即可调用 IDM、Motrix 多线程加速下载，或推送到 Aria2 远程下载……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

微软 Visual Studio 2026 免费正式版下载 - 最新 VS 编程开发 IDE 工具 (速度翻倍 / 融合 AI)

异次元软件世界

X-Force

2025年11月25日 08:16

最近除了谷歌发布全新的 Google Antigravity 外，微软也发布了 Visual Studio 2026 正式版，这是继 VS2022 后，时隔 4 年的重大版本更新，解决 5000+Bug 并实现了 300+ 功能需求。

无论你是资深开发专家还是刚入门学习编程的爱好者，现在都能下载到微软最新的 VS 开发工具免费使用了！VS 2026 不只更换全新 UI 设计，还从性能优化到 AI 深度集成，全方位提升开发者效率和体验。特别是启动速度、UI 响应方面提升非常明显，卡顿终于消失了……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

LiteMonitor - “小而美”开源硬件状态监控工具 (显示CPU/GPU/温度/内存/网速/流量)

异次元软件世界

X-Force

2025年12月28日 23:00

还在为了使用系统资源监控功能，安装那些动辄几百兆、附带一堆无用功能的臃肿“全家桶”软件吗？异次元曾推荐过简洁开源的 TrafficMonitor 来代替 360，而今天再带来一款新的小工具。

LiteMonitor 堪称 Windows 硬件资源监控软件的“新晋卷王”！它简直把“小巧轻量化”和“高定制”玩明白了。整个软件就 2MB 左右，解压即用，绿色免安装。运行时它自身后台资源占用低到可忽略不计，真正做到无负担的“隐形”陪伴。不仅界面直观精美，还完全开源免费……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

FnNAS - 电视盒子秒刷 “飞牛OS”！闲置安卓机顶盒变身全能 NAS (开源 fnOS ARM 版)

异次元软件世界

X-Force

2026年1月19日 21:43

提到 NAS 系统，大家可能都会想到主流品牌如群晖 (Synology) 的「DSM 」或 QNAP 的 QTS 等。之前推出可自部署的「飞牛 OS (fnOS) 」可谓一鸣惊人，赢得了众多玩家喜爱和推荐。

然而飞牛官方 fnOS 目前仅支持 x86 架构，只能在迷你主机/电脑上安装。而最近一个开源项目「FnNAS」，让那些吃灰“安卓电视盒子”ARM 设备也能原地复活，刷机后摇身一变成为一台搭载“飞牛”系统的功能全面丰富的 NAS！甚至能用来当做家中的低功耗专业服务器来用……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

Immich v2.5.0 发布，开源高性能自托管相册，GitHub 收获 90000 星

小众软件

青小蛙

2026年1月28日 11:43

Immich 是一款著名的开源、高性能、自托管相册工具，可以部署在自己的电脑、服务器、NAS 中，帮助用户通过 iOS、Android 等设备管理、备份照片、视频，拥有挂载本地 AI 的能力。

2026年1月28日发布 Immich v2.5.0 版本，并且在 GitHub 获得了超过 90000 星。

Immich 2.5.0 新版本功能：

释放空间
非破坏性编辑
数据库备份和恢复（Web）
上传改进
所有平台均实现视觉刷新
禁用管理员设置
星级评分（移动端）
更细粒度的权限（API 密钥）
渐进式 JPEG
幻灯片循环播放选项（网页版）
用于 HTTP/2 和 HTTP/3 图像加载的原生 HTTP 客户端

推荐给有自托管管理图片、视频的用户。

https://github.com/immich-app/immich/releases/tag/v2.5.0

以下内容为 2023年2月25日发布：

Immich – 开源自托管的手机照片备份工具[iPhone/Android]

Immich 是一个直接从 iPhone、Android 手机上备份照片与视频的开源解决方案，通过部署在自己的电脑、NAS、服务器中，使用 App 进行备份。界面酷似 Google Photos，支持多用户、照片和相册分享、好友上传、地理位置、机器学习识别事件等功能。是居家备份照片的好帮手。@Appinn

前不久，推荐了一款适合普通电脑使用的照片备份工具 PhotoSync：

PhotoSync 是一款通过 Wi-Fi 快速、安全地移动、备份、共享照片与视频的工具，支持 iPhone、Android，可以将照片备份至 NAS、电脑、FTP、网盘等处。
https://www.appinnn.com/photosync/

而 Immich，则适合拥有自己服务器的同学，首选 Ubuntu、Debian、MacOS 系统，也可以在 Windows 的 Docker Desktop 下工作。

Immich 手机照片/视频备份

Immich 的服务器端基于 Web，拥有自己的 iPhone、Android 应用，只需要在移动应用中填入服务器段的 API 地址，即可使用，两者功能有少许不同：

备份功能

配置好服务器端，登录移动应用之后，给于相册权限，就可以备份了，支持前台备份与后台备份，使用起来非常简单，有中文界面

Immich v2.5.0 发布，开源高性能自托管相册，GitHub 收获 90000 星 34

分享与上传

分享与上传就很赞了，你可以通过 Immich 将某个相册分享给好友，可以设置很多权限，包括：

设置描述文字
显示元数据（EXIF）
允许下载
允许上传
过期时间

Immich v2.5.0 发布，开源高性能自托管相册，GitHub 收获 90000 星 35

其中允许上传功能，可以让好友直接通过浏览器上传手机里的照片，在与好友一起出门游玩回来之后，共享照片真是太方便了。

安装 Immich

基于 Docker，安装 Immich 也很容易，先修改配置文件 .env：

wget -O .env https://github.com/immich-app/immich/releases/latest/download/example.env

实际上，只需要修改里面的 UPLOAD_LOCATION 部分，使用绝对路径，这是保存照片的路径。

其它设置保持默认，然后就可以安装了：

wget https://github.com/immich-app/immich/releases/latest/download/docker-compose.yml
docker-compose up -d

最后，在浏览器打开：IP:2283 就可以创建用户进入 Immich 了。

手机 App

Immich 可以通过命令行进行批量上传，也有官方 App：

在登录的时候，服务器地址填入：IP:2283/api 即可。

DEMO / 示例

有一个官方 DEMO 可以测试：

https://demo.immich.app/auth/login

公共场合，请谨慎上传图片啊，昨天的 memos DEMO 中，已经有同学干坏事了

最后，官网 / GitHub。

原文：https://www.appinn.com/immich/

另外，开发者提到：由于版本迭代频繁，请勿使用 Immich 当作单一备份，以防万一。

快到离谱！voidImageViewer 比图片还小的免费“极速看图”神器 (出自 Everything 团队)

异次元软件世界

X-Force

2026年2月5日 00:25

很多人都诟病微软，就算升级到 Windows 11，系统自带的看图工具都不好用！不仅启动速度慢，支持格式也不丰富，每次双击图片都要经历“黑屏→转圈→等待”的漫长折磨。

如果你也受够了这种糟糕的看图体验，那今天这款宝藏软件 Void Image Viewer 就能让你明白：极致的简单和快速，就是最好的体验！它出自“搜索快到让人震惊的神器——Everything”开发团队 voidtools 之手，同样开源免费。就冲 Everything 这个金字招牌，闭眼我都愿意试试……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

9 款开源工具更新[2602]

小众软件

青小蛙

2026年2月11日 18:02

一些开源工具，有了更新。简单粗暴，直接开始：

专为 AI 开发的 Obsidian CLI 工具

Obsidian CLI 是著名的开源 Markdown 笔记工具 Obsidian 刚刚发布的命令行工具，让你可以从终端控制 Obsidian，包括编写脚本、自动化、外部工具集成。

（目前仅限付费用户提前体验）

在这个时代，这，就是为 AI 开发的工具。

来自善用佳软的消息，以及评论：

早期因硬件落后才CLI，后来要人性化，进化到GUI。现在，机器超越人类，CLI又成了先进方式。连Obsidian都发布CLI了

没有更多评价，因为这本来就是给AI和其他CLI提供的。

Obsidian CLI 的功能十分丰富，被称作：在 Obsidian 中执行的任何操作都可以通过命令行完成。

但注意，目前的 Obsidian CLI 处于抢先体验阶段，需要拥有 Catalyst 许可证（付费）的用户。

原文：https://www.appinn.com/obsidian-cli/

Immich 更新到 v2.5.6

Immich 是一款拥有9万 GitHub 星的著名开源高性能自托管相册工具，你可以在里面管理、备份自己和家人的照片、视频，并且可以挂载外部 AI，实现情景识别、物体识别、语义搜索等功能。

2026年1月28日发布 Immich v2.5.0 版本，短短半个月已经到 v2.5.6 了，这期间主要更新了：

主要是针对 2.5.0 的 Bug 修正和小幅优化
v2.5.5 改善了稳定性
v2.5.6 体验与性能优化版本

版本	类型	重点
2.5.0	大版本功能更新	Free Up Space + 非破坏编辑 + 备份恢复 + UI 重构
2.5.1-3	快速补丁	修复上传 & 移动端问题
2.5.5	稳定性增强	时区 / iOS / 证书 / 删除逻辑修复
2.5.6	体验优化	缩略图生成、iOS 启动、Android 删除修复

推荐更新。

Discourse 发布了免费版测试

Discourse 是小众软件论坛所使用的开源社区程序，任何人都可以使用这套程序创建一个完整的带有AI功能的社区，包括传统的论坛、IM，完整的权限设置，总之和自己创建的没有区别。

目前 Discourse 发布了免费版测试，只需要在这里注册：

https://id.discourse.com/create-site

就能创建一个社区，堪称真的0门槛啊。

比如青小蛙就创建了一个，虽然没啥用，使用了二级域名：appinn.discourse.group

免费版本有限额：每个月50万浏览量、每个月10万邮件、一共5GB存储，以及3万token额度的CDCK Hosted Small LLM大模型（基于 Qwen/Qwen3-VL-30B-A3B-Instruct）

不能绑定自己的域名，可以随时升级。

但注意，这个额度对于社区来说，非常非常非常慷慨。如果你能达到这个量级，升级妥妥的

PowerToys v0.97.2 新功能

昨天，微软发布了 PowerToys v0.97.2 版本，从 v0.90 以来主要更新如下：

版本	主要新增 / 重要增强	说明
0.91–0.95	多模块持续优化	主要为稳定性改进、性能提升、UI 现代化改造（WinUI 3 迁移持续推进）
0.96.0	Advanced Paste 大升级	支持多 AI 端点（OpenAI / Azure / Gemini / Ollama 等），可自定义剪贴板转换流程
0.96.0	PowerRename 元数据支持	支持 EXIF/XMP 标签（如 `%Camera`、`%Lens`），适合照片批量重命名
0.96.0	Command Palette 改进	搜索过滤增强、剪贴板历史元数据显示优化、扩展菜单改进
0.97.0	CursorWrap（全新工具）	鼠标可从屏幕边缘“穿越”到另一侧，适合多显示器环境
0.97.0	Command Palette 大幅重构	支持 UI 个性化、命令排序优先级、自定义搜索引擎、直接控制 PowerToys 模块
0.97.0	CLI 扩展	FancyZones、Image Resizer、File Locksmith 等支持命令行调用
0.97.1	CursorWrap 增强	支持方向限制（仅水平/垂直），改善多显示器行为
0.97.2	CursorWrap 逻辑优化	增加单显示器禁用包裹选项
0.97.2	Advanced Paste 修复	修复设置页崩溃问题
0.97.2	Command Palette 本地化修复	修复字符串与扩展加载问题

Syncthing 进入 v2 时代以来的更新

Syncthing v2 发布以来，一直在不断的更新，目前已经到 v2.0.14 版本了，主要变化：

分类	特性	v2.x 版本详细说明
数据库	SQLite 存储	彻底弃用 LevelDB，改用 SQLite。显著降低了 RAM 占用，且数据一致性更高。
网络	多并发连接	设备间默认建立 3 个并发连接（1个元数据，2个数据流），解决了大文件同步时的拥塞问题。
日志	结构化日志	采用 Key-Value 格式输出，支持更细粒度的包（Package）级别调试日志。
存储策略	索引自动修剪	数据库会自动清理掉超过 15 个月的已删除文件元数据，防止数据库无限膨胀。
同步逻辑	移除 Rolling Hash	移除了效果不佳的滚动哈希检测，虽然减少了平移块的识别，但极大提升了扫描速度。
部署	环境变量配置	支持通过环境变量（Env Vars）完整覆盖配置文件，对 Docker/K8s 容器化部署更友好。
安全/维护	证明 (Attestation)	v2.0.14 开始加强了发布包的证明机制，确保跨平台二进制文件的来源可靠。
体验	无默认文件夹	首次启动不再强制生成 `Default Folder`，将配置权完全交给用户。

推荐更新。但注意如果有很多文件，从 v1 到 v2 的升级可能会消耗几十分钟。

frp v0.67.0（开源内网穿透工具）

frp 最近半年发布了三个小版本，主要更新如下：

版本	发布时间	主要新增功能
v0.65.0	2025-09	– XTCP 新增 NAT 穿透控制选项- 扩展 OIDC 客户端 TLS 与代理配置- 新增 `proxy_counts_detailed` 监控指标- 引入 Feature Gates（如 VirtualNet）
v0.66.0	2026-01	– HTTPS 支持负载均衡组（loadBalancer.group）- 新增 `enabled` 字段，可禁用单个代理- OIDC 支持从文件或命令动态获取 token
v0.67.0	2026-01-31	– 新增 `clientID`，服务端可识别客户端实例- Web Dashboard 全新 UI，支持暗色模式

如果你有一台带公网IP的设备作为 frp 服务器，那么依旧是很好的选择。

Karakeep 3.0

之前，青小蛙把稍后阅读、网络书签都迁移到了 Karakeep 上。然后没多久，Karakeep 3.0 就发布了。

Karakeep 0.29 强化了协作功能，0.30 强化归档与 AI 控制。

版本	关键更新
0.29.0	协作列表、自动备份、搜索自动补全、Highlights 重构、移动端增强、爬虫限速、支持 MyMind 导入
0.30.0	PDF 归档、年度统计、阅读器跨设备同步、自定义头像、AI 标签样式自定义、可关闭自动标签/摘要、Matter 导入导出、批量删除、`is:broken` 搜索

这类工具原生有 API，支持 mcp，可以非常方便的与AI工具进行整合。

Collabora 发布全新的开源 Office 软件

在去年11月份，Dalieba 同学就提到了 Collabora 公司发布了全新的 Collabora Office，基于 Collabora Online 开发而来，支持 Linux、Windows、macOS。采用标签页式视图以及与在线 Office 相同的界面设计，支持 OOXML 和 OpenDocument 文档格式。

前几天，Collabora Office 的首个桌面版本终于正式发布，可以编辑 ODF 或 DOCX。

拥有以下套件：

Writer（.odt, docx, doc, pdf, rtf）
Calc（.ods, xisx, xls, xIsm,. csv）
Impress（.odp, .ppt, .pptx）
Draw（.odg, vsd, .vsdx）

与 LibreOffice 的关系：目前 Collabora 已经是 LibreOffice 代码库最大的代码贡献者，Collabora 雇用了文档基金会的几位创始人以及许多顶级提交者。我们提供基于 LibreOffice 的长期支持产品，品牌为 Collabora Office Classic，并深深感谢并感谢与我们一起工作的许多熟练的社区贡献者，以及 LibreOffice 代码所支持的一系列令人难以置信的功能。

我中有你，你中有我！

VLC 最近的更新

作为著名的视频播放器，VLC 最近也有更新：

版本	更新内容
3.0.22	新增 Windows ARM64 原生构建支持；修复 Windows XP SP3 行为问题；多项解码器与播放器核心修复
3.0.23	修复 WebVTT 字幕定位问题；改进 FLAC 24bit 音频信息支持；多项安全修复（libass、Theora、PNG 等）；修复 D3D11 图像输出问题；改进 Qt 暗色模式显示；为 Qt6、FFmpeg8 等环境做适配准备
3.0.24（已出现暂未发布）	新增 OpenAPV 解码支持（基于 FFmpeg8）

Escrcpy - 免费开源！电脑控制安卓手机的投屏工具 (屏幕镜像 / 无线 / AI 自动化 / 录屏)

异次元软件世界

X-Force

2026年2月10日 20:00

上班时想要看手机不方便？在电脑前办公时常要用到一些手机 APP？或你是开发者，需要在电脑上测试手机应用？又或是想在电脑上管理手机文件，甚至希望能直接远程操控手机？

在 iOS 都推出了官方 iPhone 镜像功能，华为、小米等也有自家品牌的跨屏协同功能，你是否也希望能把任意品牌的 Android 安卓手机屏幕搬到电脑上使用？今天就给大家推荐一款简单好用的开源免费安卓无线投屏软件，能将手机屏幕投屏到电脑上进行控制的效率神器——Escrcpy！

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

Transmission - 清爽开源 BT 下载工具，多年迎来大更新 (支持 NAS 部署 / 边下边播)

异次元软件世界

X-Force

2026年2月28日 23:35

说到 BT 下载客户端，大家都诟病迅雷广告多，老牌 µTorrent 被收购后也开始塞广告，越做越臃肿；qBittorrent、BitComet 好像也停滞不前了；神器 IDM 又不支持 BT 下载。

折腾来折腾去，最后还是回到了经典的跨平台 Transmission——完全开源、零广告、不捆绑任何东西，甚至连个弹窗都没有。这次 4.x 版本更新，是它三年来最大的一次大版本跃升！加了不少实用功能，特别是新增支持“BT 边下载边播放”，预览小电影更方便了，值得去试试……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

免费自建密码库！新手 1Panel 简单部署 Bitwarden 服务器教程 (开源替代 1Password)

异次元软件世界

X-Force

2026年3月6日 02:00

最近 1Password 宣布全面涨价，引起了很大的热议。我们除了可以切换到 Sticky Password、EnPass、RoboForm 等替代品外，其实搭建自己的密码库也许是更好的选择。

对于有一定动手能力的同学，部署一个私有的 Bitwarden (Vaultwarden) 自托管密码管理器并不难。它开源免费，数据完全自主可控，同时支持手机电脑跨平台同步+浏览器一键登录插件，可以导入 1Password 或 Chrome 浏览器保存的密码。只需要一台 VPS 服务器 + 域名即可自建……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

HandBrake 官方绿色中文版 - 开源免费视频格式转换/压缩转码压制工具 (跨平台)

异次元软件世界

X-Force

2026年3月16日 02:10

无论是下载高清电影，还是用手机录制的视频，很多时候文件体积都非常巨大。收藏保存或分享时会比较麻烦，因此常备一款真正好用的免费视频压缩压制/格式转换软件是很有必要的。

网上视频处理工具非常繁多，收费免费的一大堆，很多人根本不知道怎么选。而在尝试过的软件中，我认为 Handbrake 可能是最好的开源免费跨平台视频压缩和格式转换软件了！作为一款万能视频转码压制工具 (压片/转换格式)，它不仅免费，还跨平台支持 Win、Mac、Linux 系统……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

Synctrain - 哭死！多年来 Syncthing 最大缺点终于解决了 (更好用的 iOS / Mac 同步网盘)

异次元软件世界

X-Force

2026年3月26日 00:01

不少人都被 iCloud、OneDrive 同步慢、空间贵折磨过。很多高手会推荐大家购买 VPS 服务器自己部署开源的「Syncthing」来同步文件。既免费跨平台，还能自己掌控数据，有着众多好处。

尽管 Syncthing 跨平台支持 Win、Mac、Linux 和 Android，但它多年来一直没有好用的 iOS 客户端。而 Synctrain 则是“新一代”专为 iPhone / iPad / Mac 重新设计开发的原生开源免费客户端，不仅速度快，且支持按需同步，真的能让 Syncthing 的文件同步体验上一个层次……

「前往查看原文.... 」

异次元还有这些值得一看：

异次元首页 | 微信公众号 | 关注微博 | 软件精选 | 软件激活码折扣

林俊旸离职后首发长文：反思千问得失，预判 AI 下半场需要「智能体思维」

爱范儿

李超凡

2026年3月27日 15:00

带队发布 Qwen 3.5 小模型系列、获马斯克公开点赞，20 小时后在社交媒体宣告离职。林俊旸离开阿里的方式，本身就是 2026 年 AI 行业最戏剧性的一幕。

32 岁，阿里最年轻的 P10，一手将千问做到全球下载量超 10 亿次、衍生模型超 20 万款，成为全球开源模型的新王。他的离开源于一次组织架构调整的分歧：

阿里希望将 Qwen 团队按预训练、后训练、视觉、语音等维度水平拆分，与通义实验室其他团队合并；林俊旸则坚信预训练、后训练乃至基础设施团队应该更紧密地垂直整合，而非割裂。这不只是管理风格之争，更是对「怎样才能训出最好的模型」这个根本问题的路线分歧。

离开近一个月后，林俊旸发出了这篇长文。他没有回应任何人事风波，直接亮出了自己对 AI 下一阶段的判断：我们正在从「训练模型」的时代，进入「训练智能体」的时代。

这篇文章之所以值得逐字读完，不仅因为写它的人在过去两年亲手操刀了 Qwen 全系列的后训练，更因为林俊旸在文中罕见地复盘了 Qwen3 在「混合思考模式」上的得与失。

以下为 APPSO 对林俊旸的编译：

原文 https://x.com/JustinLin610/status/2037116325210829168

从「推理式思考」到「智能体式思考」

过去两年，彻底改变了我们衡量 AI 模型的方式。

OpenAI 的 o1 证明了一件事：「思考」可以是模型的核心能力，可以专门训练出来、直接交到用户手里。DeepSeek-R1 紧随其后，证明这种「推理式后训练」并非大厂专利，可以在原始实验室之外复现和扩展。用大白话说：o1 是一个被教会了「回答之前先想想」的模型，R1 则是一个开源版的同类选手，跟 o1 打得有来有回。

那个阶段很重要。但 2025 年上半年的行业主旋律，说到底还是在围绕一件事打转：怎么让模型「想」得更多。让它在推理阶段烧更多算力，用更强的奖励信号训练它，暴露或控制那些额外的「思考过程」。

现在的问题是：然后呢？

我相信答案是智能体式思考。为了行动而思考，一边跟真实环境交互，一边根据世界的反馈不断修正计划。

1. o1 和 R1 的崛起真正教会了我们什么

第一波推理模型教会我们一个朴素的道理：想在大模型上把强化学习跑起来，你得有靠谱的评分标准。

什么叫靠谱？就是答案能判对错、结果能验证、反馈信号足够清晰。数学题有标准答案，代码能跑测试，逻辑推理能验证步骤。这些领域之所以成了强化学习的主战场，就是因为在这里，模型收到的奖励信号远比「让人类标注员觉得这个回答还不错」强得多。换句话说，强化学习终于能优化正确性，终于不用只追求看着像那么回事了。

然后，基础设施的重要性一下子凸显出来了。

一旦你开始训练模型进行更长的推理链条，强化学习就不再是在监督微调上面加个小配件那么简单了，它变成了一个重工业级的系统工程。你需要大规模的模拟推演（rollout）、高吞吐量的答案验证、稳定的策略迭代、高效的采样流程。推理模型的诞生，表面看是算法突破，底下看是基础设施的胜利。

OpenAI 把 o1 定义为用强化学习训练的推理产品线；DeepSeek R1 接棒验证了同一方向，同时也展示了推理式强化学习对底层算法和基础设施的要求有多高。

APPSO 划重点： 第一次大转折发生了。行业焦点从「扩展预训练」转向「扩展面向推理的后训练」。模型变强靠的不再是吃更多数据，靠的是在训练后阶段学会「怎么想」。

2. 真正的难题从来不只是「融合思考和指令模式」

2025 年初，我们 Qwen 团队心里有一张很大的蓝图。

理想中的系统长这样：一个模型同时搞定「思考」和「执行」两种模式。你可以手动调节它思考的深度，轻度、中度、深度，就像调空调温度一样。更理想的情况是，模型自己就能判断：这道题简单，直接答；这道题有点难，多想想；这道题极难，调动全部算力来啃。

方向是对的。Qwen3 是当时最清晰的公开尝试之一。它引入了「混合思考模式」，一个模型家族里同时支持「想了再答」和「直接答」两种行为，还描述了一条四阶段后训练流水线，其中明确包含了在长链推理冷启动和推理强化学习之后的「思考模式融合」步骤。

但融合这件事，说起来一句话，做起来要人命。

难在哪？难在数据。

很多人一听「融合思考和指令模式」，脑子里想的都是模型层面的事：一个模型文件能不能同时跑两种模式？一套对话模板能不能在两种风格之间切换？一个推理服务能不能暴露正确的开关？这些确实要解决，但都不是最深的坑。

最深的坑是：两种模式想要的东西，从根儿上就不一样。

你想想，一个好的「指令模型」该长什么样？干脆、简洁、格式规范、响应快。企业用户拿它来批量改写文本、打标签、做模板化客服、结构化数据提取，这些场景要的是效率和稳定，不需要深思熟虑。

一个好的「思考模型」呢？恰恰相反。它该在难题上多花时间、维持清晰的推理中间步骤、探索不同的解题路径、保留足够的「思考余量」来确保最终答案的正确性。

这两种性格天然打架。如果融合的训练数据没有精心设计，出来的模型往往两头不讨好：思考的时候啰嗦、犹豫、不够果断；执行指令的时候又不够利落、不够稳定、比客户真正需要的版本更贵更慢。

说实话，我们在平衡融合与数据质量的过程中，没有把所有事情都做对。

在不断修正的过程中，我们也仔细观察了用户到底怎么用这两种模式。结论是明确的：这两种行为画像确实在相互拉扯。

现实很诚实。2025 年晚些时候，在 Qwen3 最初的混合架构之后，我们的 2507 版本还是发布了独立的 Instruct 和 Thinking 版本，包括分开的 30B 和 235B 变体。大量商业客户根本不需要思考模式，他们要的就是高吞吐、低成本、高度可控的指令行为来跑批量任务。对这些客户来说，融合不是福音，是多余的成本。拆开来做，反而让两条线的团队都能更专注地解决各自的问题。

其他实验室走了相反的路：

Anthropic 公开押注集成式路线。Claude 3.7 Sonnet 是一个混合推理模型，用户可以选择普通回复或扩展思考，API 还能设定「思考预算」。Anthropic 直接放话：推理应该是模型的集成能力，不该单独拎出来做一个独立模型。

GLM-4.5 同样定位混合推理，把推理、编程和智能体能力统一到一个模型里。

DeepSeek V3.1 后来也做了类似的事，推出了「Think & Non-Think」混合推理方案。

那么问题来了：谁是对的？

答案不在「融合」还是「分离」这个二选一本身，在于融合是否有机。如果思考模式和指令模式只是尴尬地挤在同一个模型里，像两个性格迥异的人被硬塞进一件衣服，用户体验不会好。

真正成功的融合，需要一道平滑的光谱：模型能自如地在不同推理力度之间切换，最好还能自己判断该用多大力气。GPT 风格的 effort control（推理力度控制）指向了这个方向，这是一个关于「花多少算力来想」的连续策略，不是一个「想 / 不想」的二元开关。

APPSO 划重点： 林俊旸罕见地直言 Qwen3 在融合上「没做到完全正确」。核心矛盾其实很好理解：一个追求快准狠的执行者，和一个追求深思熟虑的思考者，硬融到一起，很容易两头都做成半吊子。

3. 为什么 Anthropic 的方向是一种有益的纠偏

Anthropic 在 Claude 3.7 和 Claude 4 上的做法，是一种值得注意的克制。

他们没有大谈模型有多能「想」，把重点放在了：集成推理、用户可控的思考预算、真实世界任务、编程质量，以及后来的关键一步，让模型在思考的过程中就能动手用工具。Claude 3.7 是带可控预算的混合推理模型；Claude 4 更进一步，推理过程和工具使用可以交错进行，边想边干。与此同时，Anthropic 把编程、长时间运行的任务和智能体工作流摆到了最优先的位置。

这里面有一个深刻的洞察：

推理链更长，不等于模型更聪明。很多时候恰恰相反。一个模型如果对所有问题都用同样冗长的方式来「推理」，说明它根本分不清轻重缓急。它可能正在失败于三件事：该优先处理什么（优先级判断）、该压缩掉什么（信息浓缩）、该在什么时候停止想而开始做（行动决策）。

Anthropic 的做法暗示了一种更有纪律的观点：思考应该为具体的工作目标服务。如果你要做的是编程，那思考就该帮你导航代码库、规划架构、拆解问题、恢复报错、编排工具调用。如果你要做的是智能体工作流，那思考就该帮你在漫长的执行过程中保持质量，而不是产出一堆令人印象深刻但没有实际行动力的中间长文。

这种「思考必须服务于行动」的理念，指向了一个更宏大的命题：

我们正在从训练模型的时代，进入训练智能体的时代。

这句话我们在 Qwen3 的博客里也明确写过。智能体是什么？一个能制定计划、决定何时行动、使用工具、感知环境反馈、修正策略、并在长时间跨度上持续运作的系统。一句话概括它的核心：与真实世界的闭环交互。

APPSO 划重点：长不等于强。Anthropic 的实践提供了一个重要的纠偏信号。思考的价值在于有没有真正服务于最终的行动目标，不在于产出了多少字的推理过程。这是从「炫技式推理」到「实用型思考」的转向。

4.「智能体式思考」到底意味着什么

说了这么多铺垫，现在进入正题。

智能体式思考和推理式思考，优化目标完全不同。

打个比方：推理式思考就像闭卷考试，评判标准是你交卷那一刻答案对不对。模型能不能解出定理、写出证明、产出正确代码、通过基准测试。想得再天花乱坠，最终只看结果。

智能体式思考更像是在真实世界里做一个项目。评判标准不是某一刻的答案，是你能不能在跟环境不断互动的过程中持续推进、持续解决问题。

核心问题变了。

不再是「模型能想多久？」，变成了：「模型能不能以一种维持有效行动的方式来思考？」

这要求模型处理一堆传统推理模型可以绕开的难题：

什么时候该停止思考、开始动手？想太多会错过行动窗口，想太少会犯错
该调用哪个工具、先后顺序是什么？这是一个规划和调度问题
怎么消化来自环境的嘈杂、不完整的信息？真实世界不会给你干净的输入
失败了怎么办？不能崩溃，得修正计划继续干
怎么在几十轮交互、几十次工具调用之后还保持连贯？这是长程记忆和一致性的问题

如果用一句话概括：

智能体式思考 = 通过行动来推理的模型。它在做的过程中不断地想。

APPSO 划重点：推理式思考像闭卷考试，智能体式思考像在真实世界里做项目。前者看最终答案对不对，后者看你能不能在复杂、动态、充满意外的环境里持续推进。这是 AI 能力评价体系的根本性转向。

5. 为什么智能体 RL 的基础设施更难

目标一变，底层的工程全都要跟着变。

经典推理强化学习的那套基础设施，不够用了。

直观地理解一下区别：在推理 RL 里，模型做一道题、给出一个答案、评估器打一个分，整个过程基本上是自包含的，评估器也相对干净。就像在一个封闭的考场里阅卷。

但在智能体 RL 里，模型不是在考场里答题，它活在一个复杂的真实环境中。工具服务器、浏览器、命令行终端、搜索引擎、模拟器、代码执行沙箱、API 接口、记忆系统、调度框架……模型的策略嵌在这一整套系统里。环境不再是一个站在旁边打分的裁判，它本身就是训练系统的一部分。

这带来了一个新的硬需求：训练和推理必须更干净地解耦。否则整个系统的吞吐量会崩掉。

举个具体的例子：一个编程智能体生成了一段代码，需要在真实的测试环境里跑一下看结果。这时候，推理端在等执行反馈，干不了别的；训练端在等完成的轨迹数据，也饿着。整条流水线的 GPU 利用率远低于你在经典推理 RL 里的预期。再加上工具响应延迟、环境状态不完全可见、每次交互都会改变环境状态，这些低效会成倍放大。结果就是：你还远没达到想要的能力水平，实验就已经慢得让人崩溃了。

环境本身也变成了一等公民级的研究课题。

在监督微调（SFT）时代，所有人都在拼数据多样性，谁有更多更好的标注数据，谁就占优势。在智能体时代，该拼的是环境质量了：环境稳不稳定？够不够真实？覆盖了多少场景？难度梯度合不合理？状态空间够不够丰富？反馈信号够不够有营养？模型能不能找到漏洞作弊？大规模生成训练轨迹的效率够不够高？

环境构建正在从一个「顺手搭的实验配件」，变成一个独立的创业赛道。如果你训练的智能体最终要在类生产环境中运作，那这个环境本身就是你核心能力栈的一部分。

APPSO 划重点： 一句话总结这个转变，SFT 时代拼数据，智能体时代拼环境。构建高质量的训练环境，正在从「实验室的脏活累活」升级为「决定你能走多远的战略资产」。

6. 下一个前沿是更可用的思考

我的判断是：智能体式思考将成为思考的主导形态。

它最终很可能取代那种旧式的静态独白推理，就是那种模型关起门来、对着自己嘟嘟囔囔写一大篇内部推理过程，试图用更多更多的文字来弥补「我没法跟外界交互」这个根本缺陷的做法。

即便面对极其困难的数学或编程问题，一个真正先进的系统也应该有权利去搜索、去模拟、去执行、去检查、去验证、去修正。目标是把问题切实解决掉，而且解决得稳健、高效。不是比谁的推理链写得更长更好看。

但训练这类系统，有一个比什么都棘手的挑战：奖励劫持（reward hacking）。

一旦模型有了真正有意义的工具使用能力，奖励劫持的危险就成倍增加。怎么理解？

一个能搜索的模型，可能在强化学习训练过程中学会了直接搜答案，不是靠推理做出来的，是查到的。
一个编程智能体，可能学会了利用代码仓库里的未来信息（比如测试用例本身就暗含了答案）、滥用日志、或者发现某个捷径让任务直接「通过」但其实什么都没做。
如果训练环境有隐藏的信息泄漏，模型可能看起来表现超人，实际上只是被训练成了一个高效作弊者。

这就是智能体时代比推理时代精细得多、也危险得多的地方。工具越强大，模型越有用，但模型能钻的空子也越多。更好的工具同时扩大了「虚假优化」的攻击面。

我预期，下一个让整个行业卡住的研究瓶颈，将来自这几个方向：环境设计、评估器鲁棒性、反作弊协议、以及策略与世界之间更有原则的接口。

但方向是清晰的：工具赋能的思考，就是比闭门造车的思考更有用，也更有希望带来真实世界的生产力提升。

智能体式思考还意味着一种全新的系统工程。核心智能将越来越多地来自于多个智能体如何被组织起来：一个负责全局规划和任务分发的编排器（orchestrator），一群各有专长的专业智能体（specialist agents），以及执行更具体任务的子智能体（sub-agents），后者帮助控制上下文窗口、防止信息污染、在不同层级的推理之间保持清晰的边界。

未来的路线图是三级跳：从训练模型，到训练智能体，再到训练系统。

APPSO 划重点： 工具让模型更有用，也让模型更容易作弊。奖励劫持是智能体时代的「定时炸弹」。谁先解决好环境设计和反作弊问题，谁就掌握了下一阶段的竞争主动权。

结论

推理浪潮的第一阶段，确立了一件至关重要的事：当反馈信号靠谱、基础设施扛得住的时候，大模型上的强化学习能够产出质变级别的认知提升。

但更深层的转变，是从推理式思考到智能体式思考：从「想更久」，到「为了行动而思考」。

训练的核心对象已经变了。不再是单一的模型，是模型 + 环境构成的整个系统。更具体地说，是智能体本身，加上围绕它的一切工程。这意味着什么研究最重要也变了：模型架构和训练数据当然还重要，但环境设计、rollout 基础设施、评估器鲁棒性、以及多个智能体之间的协调接口，重要性一点不输前者。

它还改变了「好的思考」的定义：在真实世界的约束下，能够维持有效行动的那条推理链，才是最好的。不是最长的那条，不是看起来最酷炫的那条，是最有用的那条。

它也改变了竞争优势的来源：

推理时代，拼的是更好的强化学习算法、更强的反馈信号、更可扩展的训练流水线。

智能体时代，拼的是更好的训练环境、更紧密的训练与推理一体化、更强的系统工程能力，以及闭合「决策 → 后果 → 学习」这个循环的能力。

#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。

特征	移动应用	网页
上传和查看视频和照片
打开应用程序时自动备份
用于备份的选择性相册
将照片和视频下载到本地设备
多用户支持
相册和共享相簿
可擦洗/可拖动的滚动条
支持RAW（HEIC，HEIF，DNG，APPLE ProRaw）
元数据视图（EXIF、地图）
按元数据、对象和图像标签搜索
管理功能（用户管理）
后台备份
虚拟滚动
OAuth 支持
实时照片备份和播放	iOS
用户自定义存储结构
公开分享

阅读视图

Immich 2.5.0 新版本功能：

Immich – 开源自托管的手机照片备份工具[iPhone/Android]

Immich 手机照片/视频备份

备份功能

分享与上传

安装 Immich

手机 App

DEMO / 示例

相关阅读

目录

专为 AI 开发的 Obsidian CLI 工具

Immich 更新到 v2.5.6

Discourse 发布了免费版测试

PowerToys v0.97.2 新功能

Syncthing 进入 v2 时代以来的更新

frp v0.67.0（开源内网穿透工具）

Karakeep 3.0

Collabora 发布全新的开源 Office 软件

VLC 最近的更新

相关阅读

从「推理式思考」到「智能体式思考」

1. o1 和 R1 的崛起真正教会了我们什么

2. 真正的难题从来不只是「融合思考和指令模式」

3. 为什么 Anthropic 的方向是一种有益的纠偏

4.「智能体式思考」到底意味着什么

5. 为什么智能体 RL 的基础设施更难

6. 下一个前沿是更可用的思考

结论