Cloudflare开始免费提供阻止AI机器人的一键式解决方案

Cloudflare开始免费提供阻止AI机器人的一键式解决方案 就在上周,Akamai 的一份报告再次证实,机器人在整个网络流量中的占比非常大,人工智能让网络犯罪分子和不诚实的企业更容易得手。使用 Cloudflare 提供的内容交付和防火墙服务的网站和内容创建者现在又多了一个简单易用的解决方案,可以遏制大科技公司在没有明确授权的情况下释放机器人和采集网站内容的能力。大多数流行的人工智能公司(如 OpenAI)已经开始提供一种方法,通过在服务器上的robots.txt 文件中添加自定义规则来阻止爬行机器人。然而,这些解决方案只有在机器人被设计为真正遵守这些规则时才会起作用问题在于:1)并非所有公司都愿意遵守 robots.txt 指令;2)许多人工智能公司在提供这种"选择退出"之前就已经放弃了一切可能Cloudflare 表示,其绝大多数客户(多达 85%)已经选择以这种方式阻止人工智能机器人。Cloudflare 提供的新一键式解决方案既适用于免费客户,也适用于付费客户,它似乎可以有效打击不遵守 robots.txt 规则的人工智能机器人。Cloudflare 可以识别机器人,并为每个机器人创建单独的指纹,而且它发誓会随着时间的推移自动更新其指纹数据库。作为互联网上最大的 CDN 网络之一,Cloudflare 可以从平均每秒超过 5700 万次的网络请求中推断出数据。该公司列出了一份当今网络上最活跃的人工智能机器人名单,其中 Bytespider、GPTBot 和 ClaudeBot 是访问量最大的三个机器人。Bytespider 由中国公司和 TikTok 所有者字节跳动运营,很可能使用从 40% 受 Cloudflare 保护的网站上抓取的内容来训练其大型语言模型。GPTBot 正在访问 35% 的网站,并收集数据用于训练 ChatGPT 和 OpenAI 提供的其他生成式人工智能服务。Cloudflare 表示,ClaudeBot 最近的请求量增加了 11%,并被用于训练 Anthropic 开发的同名 LLM 算法系列。虽然通过静态分析可以更容易地识别这些众所周知的机器人,但 Cloudflare 还可以检测到假装成真人浏览网页的机器人。该公司开发了自己的全球机器学习模型,基本上是利用人工智能技术来识别假装成其他东西的人工智能机器人。Cloudflare表示,其模型能够"适当标记"来自躲避性人工智能机器人的流量,未来将用于检测新的刮擦工具和假冒机器人,而无需先生成新的机器人指纹。 ... PC版: 手机版:

相关推荐

封面图片

OpenAI 和 Anthropic 无视了防止机器人抓取在线内容的既定规则

OpenAI 和 Anthropic 无视了防止机器人抓取在线内容的既定规则 据《商业内幕》获悉,世界上最大的两家人工智能公司无视媒体出版商要求其停止免费抓取其网络内容用于模型训练的请求。据了解 TollBit 调查情况的人士以及另一位知情人士称,OpenAI 和 Anthropic 要么无视、要么规避了名为 robots.txt 的既定网络规则,该规则阻止自动抓取网站内容。TollBit 是一家致力于在出版商和人工智能公司之间促成付费许可交易的初创公司,该公司发现有多家人工智能公司存在这种行为,并在周五的信函中通知了某些大型出版商,信函中没有透露被指责规避规则的人工智能公司名字。

封面图片

《知乎知学堂 AI解决方案课程 (附资料)》

《知乎知学堂 AI解决方案课程 (附资料)》 简介:知乎知学堂 AI解决方案课程 (附资料)是一门深入探讨人工智能技术的课程,涵盖机器学习、深度学习、自然语言处理等核心技术。课程结合实际案例和编程实战,帮助学员掌握AI应用开发能力,适合对人工智能感兴趣的开发者和技术人员。 标签: #人工智能#机器学习#AI开发 文件大小:NG 链接:https://pan.quark.cn/s/629c9c582059

封面图片

微软与索尼半导体深化中国市场合作,提供边缘人工智能解决方案

微软与索尼半导体深化中国市场合作,提供边缘人工智能解决方案 微软有限公司与索尼半导体科技有限公司宣布发起合作伙伴赋能计划,鼓励具备资质的中国本土独立软件供应商,以及系统集成商合作伙伴基于商业AI摄像头解决方案进行创新 该解决方案将全球首款具有 AI 处理功能的图像传感器索尼 IMX500 智能视觉传感器与微软智能云的AI能力相结合,实现边缘人工智能处理

封面图片

谷歌人工智能聊天机器人 Gemini 即将提供针对 Workspace 客户的企业级数据保护

谷歌人工智能聊天机器人 Gemini 即将提供针对 Workspace 客户的企业级数据保护 谷歌人工智能聊天机器人 Gemini 即将推出针对企业用户的 Gemini Business 和 Gemini Enterprise 套餐,让 Workspace 客户能够使用谷歌最强大的人工智能之一 Gemini 1.0 Ultra 和企业级数据保护。管理员可以通过管理控制台管理 Gemini 设置。新套餐将在150多个国家和地区提供英语版本并进行了优化。企业套餐的对话不会用于训练 Gemini 模型。

封面图片

Anthropic 为其人工智能聊天机器人推出付费计划

Anthropic 为其人工智能聊天机器人推出付费计划 由前 OpenAI 员工共同创立的人工智能初创公司,Anthropic 今天宣布推出首个面向消费者的高级订阅计划 Claude Pro,适用于Claude 2(Anthropic 的人工智能聊天机器人) 美国 20 美元/月,英国 18 英镑/月。与 OpenAI 的 ChatGPT Plus 基本相同。 客户可以获得比免费 Claude 2 级别提供的“多 5 倍的使用量”、发送“更多”消息的能力。在高峰期具有 Claude 2 的优先访问权,并提前获得新功能的访问权限。

封面图片

几乎一半的网络流量都是机器人 它们大多具有恶意性质

几乎一半的网络流量都是机器人 它们大多具有恶意性质 作为市场上最大的内容分发网络之一,Akamai与Cloudflare和亚马逊AWS等公司并驾齐驱,对目前互联网上发生的事情了如指掌。而我们所知的互联网大多是机器人。这是Akamai根据2024年一份关于网络刮擦的报告得出的结论之一,不同来源的2022年和2023年报告中的类似数字也进一步证明了这一点。Akamai在报告中指出,电子商务行业受网络刮擦和"高风险"僵尸流量的影响最大。虽然某些类型的机器人可以为企业带来利益,但网络采集机器人通常会对底线和整体客户体验产生负面影响。目前,网络采集机器人被用于竞争情报、间谍活动、囤积库存、创建诈骗网站和其他犯罪活动。Akamai首席技术官Patrick Sullivan解释说,机器人带来了巨大的挑战,给网络应用程序、服务和应用程序接口所有者带来了"多个痛点"。抓取机器人可以轻松获取产品图片、描述、价格信息和其他数据。网络犯罪团伙可以利用这些数据创建假冒知名品牌或零售服务的虚假网站。由于人工智能的出现,垃圾邮件的形势正在发生变化。使用人工智能算法的僵尸程序越来越难被发现。Akamai表示,即使是非结构化数据,人工智能僵尸网络也能很好地工作,它们可以利用实际的商业智能,为欺诈者提供更加完善的"决策过程"。有了人工智能,犯罪分子可以比以往更高效地收集、提取和处理数据。机器人还可用于创建新的虚假账户,然后利用这些账户对真人及其财务进行攻击。即使是非恶意爬虫机器人也会降低网站性能,影响搜索引擎指标,并增加计算和托管成本。企业现在面临着越来越复杂的机器人,它们使用人工智能算法、无头浏览器技术和其他先进的解决方案。除传统方法外,这些新威胁还需要新颖、更复杂的缓解方法。如今,强大的防火墙仅仅是网站所有者所需的众多安全措施的开始。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人