ArchiveBox是一个自托管的本地网络档案。允许您保存网页内容、浏览器历史记录中的来源、书签、资源库,并以各种形式保存,从通

ArchiveBox是一个自托管的本地网络档案。允许您保存网页内容、浏览器历史记录中的来源、书签、资源库,并以各种形式保存,从通常的html、js和PDF到各种媒体格式的音频、视频上传等形式。支持在自动模式下工作,还允许您在内容源变化时发送通知。 #tools

相关推荐

封面图片

Google将使用AI改进Chrome历史记录搜索功能帮你找网页 但数据会被共享

Google将使用AI改进Chrome历史记录搜索功能帮你找网页 但数据会被共享 这种查找逻辑简单易用然而有时候用户不记得标题和网站后,只使用页面中出现的关键词可能无法查到历史内容,有 AI 加持后这些问题迎刃而解。图片来自:@Leopeva64Google称使用人工智能技术后历史记录查找功能可以使用自然语言进行搜索,提交自然语言描述后人工智能会处理数据并找出匹配度最高的网页供用户浏览。既然需要使用人工智能那必然存在数据共享问题,至少现阶段这个 AI 模型不是本地运行的,因此开启此功能后Google会收集用户的这些浏览数据。Google也强调页面内容会以加密形式保存在设备本地,Google为了改进此功能会收集数据并可能会经由人工审核人员对内容进行检查以确保搜索功能的准确性。所以对用户来说这些功能就是双刃剑,为了方便实用就需要共享数据,除非未来 AI 模型都在设备端运行,这样所有数据都在本地处理不需要发生到云端。Google现在已经尝试在 Chrome 中集成 Gemini Nano 版模型,该模型现阶段主要是给开发者使用的,开发者可以构建 PWA 应用调用本地模型处理数据,不过这种模型暂时还无法支撑Google对 Chrome 更多 AI 功能的需求。最后现在还不清楚 AI 搜索功能是否会被默认开启,如果默认开启那至少在欧盟是肯定违反 GDPR 规定的,所以有可能不会默认开启避免引起隐私争议。 ... PC版: 手机版:

封面图片

这是一个允许你从多个来源收集电影剧本的工具,并以.txt文件的形式创建一个包含2.5千多部剧本的数据库,同时还有的元数据

这是一个允许你从多个来源收集电影剧本的工具,并以.txt文件的形式创建一个包含2.5千多部电影剧本的数据库,同时还有电影的元数据。 整个过程有四个步骤: 从各种来源收集剧本 - 在网站上搜刮HTML、txt、doc或pdf格式的剧本 收集元数据 - 从TMDb和IMDb获取关于剧本的元数据,以便进行额外处理 查找不同来源的重复内容 - 自动分组并删除不同来源的重复内容。 解析脚本 - 将脚本转换为只含人物和对话的行文 | #工具 #剧本

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人