普通视图

发现新文章,点击刷新页面。
昨天以前首页

安娜的档案失去 .org、.se 两个域名,还面临永久禁令

作者 青小蛙
2026年1月19日 14:28

一个月前(2025年12月21日),安娜的档案离谱性的抓取了 8600 万个音乐文件,300TB 的 Spotify 数据
过去两周,他们相继失去了 .org、.se 两个域名,他们的麻烦还没有结束。上周五,俄亥俄州一家联邦法院对该网站的身份不明的运营者发布了缺席判决和永久禁令。

安娜的档案失去 .org、.se 两个域名,还面临永久禁令 50

来自 torrentfreak 的消息,俄亥俄州一家联邦法院对安娜的档案的运营者发布了缺席判决和永久禁令。

这项禁令是由拥有专有 WorldCat 数据库的非盈利组织 OCLC 提出的。2023 年安娜的档案抓取并发布了 WorldCat 数据库,大约 7 亿条唯一的书目元数据记录 。OCLC 最初要求数百万美元的赔偿,但最终放弃了这一要求,转而专注于通过禁令关闭该网站,该禁令也适用于中间商。

等等!.org 与 .se 域名现状?

安娜的档案(annas-archive)拥有诸多域名,包括 .li、.pm、.in,以及最近失去的 .org 与 .se。

.org:强制暂停:serverHold

目前 .org 的状态是由注册局(Registry)设置为强制暂停 serverHold 状态。

此时,你购买域名的注册商也无权直接解除,因为注册局属于注册商的上级机构。

安娜的档案失去 .org、.se 两个域名,还面临永久禁令 51

.se:停止解析:clientHold

目前 .se 域名状态是 clientHold。

即注册商要求注册局停止为该域名发布 DNS 解析

安娜的档案失去 .org、.se 两个域名,还面临永久禁令 52

WorldCat 是什么?

WorldCat 是全球最大的图书馆联合目录,汇集了来自 100 多个国家、数万家图书馆的书目元数据,内容包括书籍、期刊、论文、音像资料等。很多高校和公共图书馆在查询“哪本书在哪家图书馆有馆藏”时,背后实际上用的就是 WorldCat。

torrentfreak 甚至还透漏了美国地方法院法官迈克尔·沃森发布的意见和命令副本(pdf)。

未来

目前其他几个域名还可以正常访问按钮的档案,但未来如何没有人知道,甚至没有人知道明天会如何。

就,拭目以待吧。


原文:https://www.appinn.com/anna-archive-loses-org-se-domains/


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

英伟达被指为训练 AI 大模型,曾寻求安娜的档案高速访问,数据规模达 500TB 级

作者 青小蛙
2026年1月20日 16:29

就在前脚安娜的档案失去 .org、.se 两个域名,还面临永久禁令之后,torrentfreak 继续爆料:在一项集体诉讼中,几位书籍作者引用了英伟达内部文件,声称这家市值万亿美元的公司直接联系了安娜档案馆,寻求高速访问安娜的档案数据,数据规模达 500TB 级别。

有趣的是,安娜的档案曾明确警告英伟达:其所提供的数据为非法获取内容。

英伟达被指为训练 AI 大模型,曾寻求安娜的档案高速访问,数据规模达 500TB 级 50

英伟达自己的大模型

除了卖显卡,英伟达也在训练自己的大模型,包括 NeMo、Retro-48B、InstructRetro 和 Megatron。

英伟达还在自家的 NVIDIA NIM API 免费提供这些模型(限额),另外 NVIDIA NIM 中还有免费的 DeepSeek、QWen 等模型:

英伟达被指为训练 AI 大模型,曾寻求安娜的档案高速访问,数据规模达 500TB 级 51

作家起诉英伟达侵犯版权

torrentfreak 报告称,早在2024年初,几位作者就因涉嫌侵犯版权而起诉英伟达。他们声称英伟达的大模型是在 Books3 数据集上进行训练的。


Books 3

Books3 是一个包含了许多盗版内容的数据集包,于 2020 年首次发布,之后很多大模型都使用了 Books3。不过随着诉讼的到来,Books3 本身已经关闭了,但数据还流传在互联网上。


作为初步回应,英伟达否认侵权,但主张即便使用也构成合理使用。

然而指控并没有消失,上周五作者提交了一份修改后的申诉,「包括阿卜迪·纳泽米安 (Abdi Nazemian) 在内的作者现在引用了各种英伟达内部电子邮件和文件,表明该公司被指曾计划或尝试下载数百万本受版权保护的书籍。」

并称「竞争压力迫使 NVIDIA 进行盗版”,其中包括与备受争议的 Anna’s Archive 库合作。」


英伟达被指为训练 AI 大模型,曾寻求安娜的档案高速访问,数据规模达 500TB 级 52

53. 内部文件显示,竞争压力迫使英伟达走上了盗版之路。2023 年秋季,英伟达面临着一个迫在眉睫的最后期限 – 年度开发者日。自 2022 年 9 月 NeMo Megatron 系列发布以来,OpenAI 发布了 ChatGPT 并取得了巨大成功,导致投资者对人工智能的关注度大幅提升。作为回应,英伟达试图在其 2023 年秋季的开发者日上开发并展示尖端的 LLM。为了获取其内部称为“NextLargeLLM”、“NextLLMLarge”


诉讼还指出「“由于急需书籍,英伟达联系了 Anna’s Archive——这是现存规模最大、也最肆无忌惮的盗版电子书库之一——洽谈获取其数百万份盗版资料,并‘将Anna’s Archive的内容纳入我们大型语言模型的预训练数据中’。”」

「“因为 Anna’s Archive 对其盗版馆藏的‘高速访问’收取了数万美元的费用 […] NVIDIA 试图找出对数据的‘高速访问’是什么样的。”」


英伟达被指为训练 AI 大模型,曾寻求安娜的档案高速访问,数据规模达 500TB 级 53

「我在英伟达的数据策略团队工作,我们正在探索将 Anna’s Archive 纳入我们大型语言模型的预训练数据中。我们想了解您是否愿意分享您在大型语言模型相关方面的工作经验。」


诉讼称安娜的档案承诺向英伟达提供大约 500 TB 数据的访问权限。其中包括数百万本通常只能通过互联网档案馆的数字借阅系统访问的书籍,该系统本身已成为法庭的目标。

不过该投诉没有明确提及英伟达最终是否向安娜的档案支付了访问数据的费用。

另外,英伟达还被指控使用其他盗版资源。包括从 LibGen、Sci-Hub 和 Z-Library 下载书籍。

附:申诉副本下载(PDF

安娜的档案的麻烦

这是首次出现的美国大型科技公司与安娜的档案之间的直接通信细节,导致安娜的档案从个人获取知识下载使用,变成了商业公司使用。并且随着安娜的档案招惹了越来越多的官司,压力也会越来越大。

不知道这是否会导致安娜的档案的消失。

而英伟达方面,应该不会有什么影响,嗯。


原文:https://www.appinn.com/nvidia-anna-archive-500tb/


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

实锤:Spotify、索尼、华纳的起诉,导致「安娜的档案」的 .org 域名下架

作者 青小蛙
2026年1月26日 10:22

能够同时被 Spotify、索尼、华纳和环球音乐集团 (UMG) 联合起诉,安娜的档案也算是名扬天下了。

实锤:Spotify、索尼、华纳的起诉,导致「安娜的档案」的 .org 域名下架 44

事情是这样的:

2025年12月份:

离谱!安娜的档案抓取了 8600 万个音乐文件,300TB 的 Spotify 数据!

2026年1月份(上周):

安娜的档案失去 2 个域名,还面临永久禁令

在当时,很多人都怀疑 .org 域名的下架是因为 Spotify,但并没有实锤。

现在,实锤了!

来自 arstechnica 的消息:

实锤:Spotify、索尼、华纳的起诉,导致「安娜的档案」的 .org 域名下架 45

.org 域名暂停是 Spotify 与索尼、华纳和环球音乐集团 (UMG) 等主要唱片公司提起的诉讼造成的。

音乐公司于 12 月下旬在美国纽约南区地方法院起诉了 Anna’s Archive,该案详细内容最初被封存。1月16日,法官下令解封此案,“因为封存的目的已经达成”。

来龙去脉

1月21日,法院公开了大量文件,解释了域名暂停事件的来龙去脉:

1月2日,音乐公司申请了临时限制令,法院当天便批准了该申请。该限制令对公共利益注册局(PIR,一家总部位于美国的非营利组织,负责监管.org 域名)和 Cloudflare 提出了要求。

“PIR 和 Cloudflare 联手有能力切断 Anna’s Archive 用来非法传播受版权保护作品的三个网站域名的访问权限,”音乐公司向法庭表示 。

他们请求法院发布“临时限制令,要求 Anna’s Archive 立即停止对唱片公司原告的受版权保护作品进行任何复制或分发”,并“根据《所有令状法》行使权力,指示 PIR 和 Cloudflare 协助执行该命令”。

一个额外的要求

这些公司还要求,只有在“法院下达命令并由 PIR 和 Cloudflare 执行后,才能通过电子邮件向 Anna’s Archive 发送案件通知,以阻止 Anna’s Archive 继续实施其向公众发布数百万非法获取的、受版权保护的录音的计划。

Spotify 和唱片公司的请求内容如下:

如果 Anna’s Archive 收到唱片公司原告寻求临时限制令的通知,它几乎肯定会立即向公众发布其从 Spotify 非法复制的录音,并启动应急计划,将其基础设施迁出美国。

为了防止这种情况发生,原告已秘密提交了起诉状,唱片公司原告现在请求法院单方面发布临时限制令,以免 Anna’s Archive 先发制人地阻挠唱片公司原告动议所寻求的救济。

安娜的档案到底保存了多少 Spotify 数据?

安娜的档案说保存了大约 300TB 的数据,包括:

具体来说:

  1. 1. Spotify 的 2.56 亿首歌曲的元数据(占全部的99.9%)
  2. 2. 约 8600 万首音乐文件,约 300TB(占全部的99.6%)
  3. 3. 音质保持为原始的 OGG Vorbis 格式,码率为 160kbit/s
  4. 4. 无播放的音乐被重新编码为 75kbps 的 OGG Opus 格式
  5. 5. 截止日期为 2025 年 7 月

基本上,趴库很彻底。。。

不过,目前在安娜的档案种子下载页面,Spotify 的部分已经不可用了:暂不提供,恢复时间另行通知。

实锤:Spotify、索尼、华纳的起诉,导致「安娜的档案」的 .org 域名下架 46

图书与音乐

从这件事来看,图书版权的管理与音乐版权的管理完全不能相提并论。

此前的图书部分,无论是 z-library 还是安娜的档案,都可以通过东躲西藏来避免下线。

但涉及到了音乐版权部分,虽然说还没有让安娜的档案彻底下线,但他们也付出了不小的代价,短时间内也不会上架这部分的数据了。

很现实啊。


原文:https://www.appinn.com/spotify-annas-archive-takedown/


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

尽管面临法律阻力,安娜的档案仍“发布”了数百万首 Spotify 音乐文件

作者 青小蛙
2026年2月13日 18:12
尽管面临法律阻力,安娜的档案仍“发布”了数百万首 Spotify 音乐文件 38

安娜的档案 与 Spotify 事件回顾:

如今安娜的档案依旧面临法律阻力。

新的种子文件

不过,来自 torrentfreak 的消息,在安娜的档案完整的 torrent.json 文件中,发现了数十个新的 Spotify 下载链接(注:目前在 torrent.json 中已经看不到了)

  • 这些文件是在 2 月 8 日添加的
  • 大概包括 47 个新的音乐 torrent,以及一个新的元数据 torrent。
  • 包含 60,000 个文件,文件总数约为 280 万个。
  • 大约是 6 TB 的音乐。
  • 还有一个巨大的 29 GB“可查找”元数据索引文件

而音乐文件本身带有嵌入的媒体信息和元数据,包括歌曲、专辑、艺术家和出版商等。甚至有些还包括封面艺术。

尽管面临法律阻力,安娜的档案仍“发布”了数百万首 Spotify 音乐文件 39

或许,Spotify、索尼、华纳无力阻止最终发布

这可能是真的,这些版权机构可能最终无法阻止这些文件的发布…

让我们拭目以待吧。


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

❌
❌