【我提前体验了 2046 年的互联网,感觉糟糕透了】互联网档案馆从 1996 年起利用网络爬虫抓取了大量网页并存档,至今已经超过

【我提前体验了 2046 年的互联网,感觉糟糕透了】互联网档案馆从 1996 年起利用网络爬虫抓取了大量网页并存档,至今已经超过 3510 亿个网页,其称为「时光机」(Wayback Machine)项目。互联网档案馆的新项目名为 Wayforward Machine,同样是一台时光机,不过它的作用是带你穿越未来,时间是 2046 年。 #抽屉IT

相关推荐

封面图片

保存超过8660亿个网页的互联网档案馆和网站时光机仍在遭受DDoS攻击

保存超过8660亿个网页的互联网档案馆和网站时光机仍在遭受DDoS攻击 今天互联网档案馆服务总监 Chirs Freeland 发布博客透露目前 DDoS 攻击仍在持续中,攻击者使用僵尸网络对互联网档案馆发出大量异常的请求以阻塞服务器,如果不进行人工干预的话互联网档案馆的访问会完全瘫痪。此次攻击从上周日开始 (时差原因国内时间为周一),今天是攻击的第三天目前没有停止迹象,互联网档案馆数字图书管理员 Brewster Kahle 则透露这次攻击持续性强、影响深远、具有针对性、适应性强以及特别凶狠。以该网站的规模,互联网档案馆使用的服务器应该还是比较多的这样可以支撑全球各地用户的访问,尽管通过技术对抗后缓解了攻击,但只要攻击不停止,就会对互联网档案馆造成影响。不过对攻击者来说持续发起大规模的 DDoS 攻击也是有成本的,从连续攻击三天也可以看到这绝对不是新手在拿互联网档案馆练手,这样练手的成本着实太高。最后此次攻击主要是 DDoS,目前互联网档案馆保存的所有数据都是安全的,黑客似乎并未尝试入侵服务器以窃取或删除数据,但 DDoS 可能只是前期疲劳管理员的一种方式,不知道后续是否会进行其他恶意行为。 ... PC版: 手机版:

封面图片

互联网档案馆改进其 Flash 模拟支持

互联网档案馆改进其 Flash 模拟支持 互联网档案馆的 Jason Scott 宣布在志愿者Nosamu 和 bai0 的帮助下该项目的 Flash 模拟器获得了显著改进。 Flash Player 于2020年12月31日结束了更新,主流浏览器陆续移除了对 Flash 的支持。互联网档案馆是在 2020 年宣布存档 Flash 动画和游戏作品,因为作为一种创作工具,Flash 留下了很多出色的作品,应该让后人能体验这些作品,而不是让它们消失在数字时代。互联网档案馆支持了 Flash 模拟器 Ruffle,无需插件就能在浏览器中运行 Flash 动画和游戏作品。 最新的改进包括加入了对静音/取消静音的支持,能根据实际动画的信息调整屏幕大小。很多之前不能正常工作的 Flash 作品都将能加入档案收藏。互联网档案馆目前存档的 Flash 作品超过了一万件。

封面图片

互联网档案馆现在正在保存阿鲁巴岛的历史

互联网档案馆现在正在保存阿鲁巴岛的历史 阿鲁巴岛正在互联网档案馆中备份其历史,这对数字保存网站来说尚属首次。互联网档案馆于4月8日开放门户网站,让全世界都能访问超过10万份阿鲁巴历史文献。这些作品包括阿鲁巴岛自1986年成为荷兰王国辖下国家后开始在其国家图书馆和档案馆收集的材料。据互联网档案馆称,阿鲁巴馆藏“包括约4万份文档、6万张图像、900个视频、45个音频文件和7个 3D 对象,总共67个主题和/或机构 (子) 馆藏”。互联网档案馆表示,除了将所有内容添加到自己的服务器之外,它还使用去中心化的 Filecoin 网络来备份所有内容。

封面图片

出版商胜诉后 互联网档案馆删除50万本书

出版商胜诉后 互联网档案馆删除50万本书 由于图书出版商去年成功起诉了互联网档案馆,这个致力于扩展在线图书访问的免费在线图书馆最近减少了大约50万本书籍。互联网档案馆在本月的一篇博客文章中称,出版商突然强制这些删除行为,对依赖互联网档案馆访问图书的读者造成了“毁灭性的损失”,而且这些图书是无法或难以获取的。为了恢复访问权限,互联网档案馆现在正在上诉,希望说服美国第二巡回上诉法院推翻之前的裁决,使互联网档案馆对其控制的实体书籍数字借阅被视为版权法下的合理使用。 (详情请看原文)

封面图片

游戏保护主义者在互联网档案馆中发现大量旧版APP缓存

游戏保护主义者在互联网档案馆中发现大量旧版APP缓存 根据 Eurogamer 报道,其编辑探索互联网档案馆过程中,发现了大量来自 TestFlight 的旧手机游戏和应用程序,缓存容量高达 1.2TB,随后将其命名为“teraleak”。 根据目前曝光的数据,“teraleak”涵盖 2012 - 2015 年期间的旧款应用和游戏程序,应该是 2015 年年初从 TestFlight 网站上抓取的。 目前尚不清楚这些数据的来源,可能是来自配置错误的云存储,在时光机 (Wayback Machine) 中提及了亚马逊的 CloudFront 和 AWS 的 S3 服务。 、、

封面图片

互联网档案馆被判无权扫描纸书并提供借阅

互联网档案馆被判无权扫描纸书并提供借阅 3 月 24 日,互联网档案馆(Internet Archive)在一场由四家图书出版商提起的诉讼中败诉,法官判决该网站无权扫描纸质图书并提供借阅。(Hachette Book Group, Inc. v. Internet Archive, 542 F.Supp. 1156 (2023).) 这起诉讼源于互联网档案馆在 Covid 流行期间提供的「国家应急图书馆」服务。之前,该网站根据称为「受控数字借阅」(CDL)的机制提供电子书借阅服务,同一时间只能借出与实际购买的纸质书份数相同的电子书,其他读者需要等待归还才能继续借阅;应急图书馆取消了这个限制。出版商对此表示不满,于 2020 年 6 月提起诉讼;互联网档案馆被迫于当月关停了该服务。 案件于上周一开庭审理。称,互联网档案馆扫描的电子书并不构成「合理使用」,因为其正面价值并未超出对出版商的损害,也没有证据表明借阅电子版更方便可以间接促进纸质书销售。此外,扫描和提供借阅的行为也不满足「转化性」(transformative)使用的要求。这区别于谷歌在 2014 年就 Google Books 赢得的胜诉,因为 Google Books 扫描图书后将其转化为了可搜索数据库,而不是直接提供副本。 对此, 美国出版商协会表示欢迎,互联网档案馆表示将上诉。 少数派 标签: #互联网档案馆 频道: @GodlyNews1 投稿: @GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人