研究:近一半热门新闻网站屏蔽了OpenAI爬虫#抽屉IT

None

相关推荐

封面图片

研究称48%热门新闻网站屏蔽OpenAI爬虫

研究称48%热门新闻网站屏蔽OpenAI爬虫由于缺乏明确的监管框架来管理生成式人工智能对受版权保护的材料的使用,许多大型出版商自行解决问题,将人工智能公司告上法庭,更新服务条款,阻止爬虫或达成交易以保护优质内容,数据和收入。该研究将媒体分为三类:传统印刷出版物、电视和广播电台以及数字媒体。到2023年底,超过二分之一(57%)的传统印刷出版物网站(例如《纽约时报》)将屏蔽OpenAI的爬虫程序,而电视和广播公司的这一比例为48%,数字媒体的比例为31%。同样,32%的印刷媒体屏蔽了Google的抓取工具,而19%的广播公司和17%的数字媒体也采取了同样的做法。Gartner副总裁、杰出分析师安德鲁·弗兰克(AndrewFrank)表示:路透社的研究强调了生成式人工智能面临的一个根本挑战:它依赖于真实的人生成的真实内容,而这些人将其视为对其生计的威胁。与此同时,康奈尔大学最近的一项研究发现,当新的人工智能模型根据先前模型而不是人类输入的数据进行训练时,它们往往会模型崩溃或退化,导致生成的输出中错误和错误信息增加。“这表明大型语言模型开发人员需要找到方法来补偿那些创建或报告真实内容的人,这不仅是为了社会,也是为了他们自己的商业利益。”弗兰克说。部署网站爬虫的原因有很多。像Google的Googlebot这样的爬虫会在这家科技巨头的搜索结果中索引出版商网站。与此同时,OpenAI的爬虫GPTBot通过互联网收集数据来训练其大型语言模型,例如ChatGPT。这使得人工智能工具能够生成准确的同步数据——新闻出版商尤其具有独特的优势来提供这种能力:GoogleAI的权重比优质出版商的内容高出5到100倍。人工智能驱动的解决方案正在成为传统搜索引擎的替代品。根据这项研究,与南半球的新闻媒体相比,北半球的新闻媒体更倾向于阻止人工智能爬虫。在美国,79%的顶级在线新闻网站屏蔽了OpenAI,而在墨西哥和波兰,只有20%的网站这样做了。与此同时,德国60%的新闻网站屏蔽了Google的爬虫,而波兰和西班牙则有7%的新闻网站屏蔽了Google的爬虫。几乎所有屏蔽GoogleAI的网站也屏蔽了OpenAI(97%)。尽管该研究没有对这一趋势提供明确的解释,但它表明OpenAI在Google之前发布其爬虫程序可能对此有所贡献。与此同时,在大多数国家/地区,一些出版商在这两套爬虫程序发布后立即对其进行了屏蔽。OpenAI于去年8月初推出了人工智能爬虫,Google也于9月紧随其后。根据这项研究,一旦做出屏蔽决定,没有任何网站会改变立场,解除对OpenAI或GoogleAI爬虫的屏蔽。...PC版:https://www.cnbeta.com.tw/articles/soft/1421033.htm手机版:https://m.cnbeta.com.tw/view/1421033.htm

封面图片

研究:近一半热门新闻网站屏蔽了OpenAI爬虫https://www.ithome.com/0/752/306.htm值得注意的

封面图片

RTX 4070已经偷偷“变心”:AD103屏蔽近一半核心

RTX4070已经偷偷“变心”:AD103屏蔽近一半核心其实在一个月前,就有消息称,RTX4070、RTX4060Ti、RTX4060都会改变核心,后两者分别从AD106、AD107改成AD104、AD106。这么做的代价就是需要屏蔽更多核心单元,才能达成相应的规格,但也很容易理解,良品率太低的瑕疵品再利用嘛。比如说RTX4070,之前使用的AD104是在7680个核心中屏蔽了1792个而来,只利用了76%。换成AD103的话,则需要在10240个核心中屏蔽4352个,64MB二级缓存屏蔽28MB,实际利用率只有大约57%,显存位宽也得从256-bit降低到192-bit。TechPowerUP确认,GPU-Z的下一个版本就可以顺利识别新版RTX4070。...PC版:https://www.cnbeta.com.tw/articles/soft/1429197.htm手机版:https://m.cnbeta.com.tw/view/1429197.htm

封面图片

澎湃新闻-首页头条研究:地球上近一半物种正经历种群数量快速下降#澎湃##资讯

封面图片

央视新闻:美国近一半自来水含有毒物质

封面图片

美国之音最新研究指出中国近一半的主要城市正在下沉

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人