生成式人工智能服务新规今日实施:提高生成内容的准确性和可靠性 #抽屉IT

None

相关推荐

封面图片

OpenAI的“企业年”包括提高人工智能准确性的新工具

OpenAI的“企业年”包括提高人工智能准确性的新工具 OpenAI API 于 2020 年推出,允许公司在其大型语言模型的基础上进行连接和构建,随后于去年 8 月开放了 GPT-3.5 的微调功能,最终还将开放GPT-4。高度定制的模型可以在内部提供更好的结果。它们还能使对公众的回复保持在正轨上,避免出现像由ChatGPT 支持的雪佛兰经销商的机器人说它会以 1 美元的价格卖出一辆车那样的尴尬情况。今天,OpenAI 首席运营官 Brad Lightcap在接受彭博社采访时表示,2024 年是"企业年",因为企业开始推出更多使用基础模型的用例,OpenAI 在该领域看到了"巨大的增长"。Lightcap说:"我们越来越感觉到,市场正在把我们拉向真正的应用,提供真正的业务成果,真正广泛地关注人工智能赋能,我们已经准备好为我们的客户提供支持。"Lightcap此前曾警告企业高管不要指望人工智能能解决他们的所有问题,并提醒说,生成式人工智能在很大程度上仍处于试验阶段。OpenAI 还正式宣布了辅助微调功能,作为定制模型计划的一部分,OpenAI 员工将帮助客户对 GPT-4 进行微调。定制模型计划允许选定的组织与 OpenAI 研究人员合作,根据其特定需求训练定制的 GPT-4 模型。通过微调,GPT-4 等预训练模型可以通过更小、更有针对性的数据集(如公司的投资组合)学习更多信息。第一个第三方集成是与 Weights & Biases 平台的集成。虽然 OpenAI 以 ChatGPT 而闻名,吸引了日常消费者和希望创建自己版本聊天机器人的品牌,但该公司也与初创企业和更成熟的组织合作,将人工智能驱动的应用和服务引入主流。生成式人工智能时代最早的一些宠儿,如文案撰写平台 Jasper和视频创作公司 Descript,都是利用 OpenAI 的模型构建自己的服务的。 ... PC版: 手机版:

封面图片

CNET的人工智能新闻生成实验导致维基百科下调其可靠性评级

CNET的人工智能新闻生成实验导致维基百科下调其可靠性评级 去年,《未来主义》(Futurism)的一篇报道揭露了 CNET 在一些与金融相关的文章中使用了生成式人工智能,引起了轩然大波。这些文章从 2022 年 11 月开始出现,标题为"CNET Money Staff"。这听起来像是由人类创作的,但内容却是人工智能生成的,大量错误和有时逐字复制其他作者的作品就说明了这一点。在其行为成为头条新闻后,CNET 的领导层坚称,它是"悄悄地"而非"秘密地"引入人工智能制作的文章。该技术的使用"暂时"暂停。CNET 所有者 Red Ventures 旗下的其他网站也暂停了人工智能报道。CNET 使用人工智能文章的决定所产生的影响至今仍在影响着维基百科,包括在维基百科的"可靠来源/常年来源"页面上,该出版物之前的"一般可靠"评级已降级为"一般不可靠"。维基网站上的三个条目显示,CNET 在 2020 年 10 月之前排名最高。根据维基网站的说法,这是因为 Red Ventures 被收购后编辑标准下降。从 2022 年 11 月至今,由于人工智能生成的文章,CNET 被归类为"基本不可靠"。虽然该条目证实它们已经停止,但它声称,广告商驱动的编辑内容仍然令人担忧这是指 The Verge 在 2023 年 2 月进行的调查。2023 年 1 月,维基百科的编辑们开始讨论如何处理 CNET。"CNET通常被认为是一个普通的科技[可靠来源],但它已经开始试验性地运行人工智能生成的文章,这些文章错误百出,"CNET的一位编辑大卫-杰拉德(David Gerard)当时写道。"到目前为止,这项实验进行得并不顺利,因为它本不该如此[......]任何这些进入维基百科文章的文章都需要被删除。"其他编辑建议,包括 ZDNet 在内的所有 Red Ventures 旗下网站的可靠性评级都应下调。不过,ZDNet 在维基百科页面上的"总体可靠"评级仍然是最高的。CNET 发言人在就维基百科降级一事向Futurism发表的声明中说:"CNET 是世界上最大的以技术为重点的公正新闻和建议提供商。近 30 年来,我们凭借严格的编辑和产品审查标准赢得了人们的信任。必须澄清的是,CNET 并没有积极使用人工智能来创建新内容。虽然我们没有重启的具体计划,但未来的任何举措都将遵循我们的公共人工智能政策。此外,之前有关迫于压力撰写有利于广告商的报道是不实的,对我们员工的工作和声誉造成了不公平的影响"。我们坚持我们所做的工作、我们内容的质量和我们员工编辑的诚信。CNET 作为 Red Ventures 旗下的一个独立实体,由独立的领导团队领导。" ... PC版: 手机版:

封面图片

苹果公司发表四款开源新模型 有助于提高未来人工智能的准确性

苹果公司发表四款开源新模型 有助于提高未来人工智能的准确性 这些指导模型被称为开源高效 LLMs 或 OpenELMs,托管在协作平台 Hugging Face 上。Hugging Face 用于托管人工智能模型,以及对其进行训练和与他人合作改进。OpenELM 是指一个开源库,它利用进化算法将多个大型语言模型 (LLM) 结合在一起。这四个 OpenELM 模型采用"分层缩放策略",在变压器机器学习模型的各层中分配参数,以提高精确度。这些模型使用 CoreNet 库进行了预训练。苹果公司提供了使用 2.7 亿、4.5 亿、11 亿和 30 亿个参数的预训练和指令调整模型。预训练数据集由 Dolma v1.6 子集、RefinedWeb、重复 PILE 和 RedPajama 子集组合而成。这样得到的数据集约有 1.8 万亿个标记。在本周二发布的一篇相关论文中,该项目的研究人员表示,大型语言模型的可重复性和透明度"对于推进开放式研究至关重要"。它还有助于确保结果的可信度,并允许对模型偏差和风险进行调查。至于模型的准确性,据解释,在使用 10 亿个参数预算的情况下,OpenELM 比 OLMo 的准确性提高了 2.36%,而所需的预训练代币数量仅为 OLMo 的一半。模型和论文的作者包括 Sachin Mehta、Mohammad Hossein Sekhavat、Qingqing Cao、Maxwell Horton、Yanzi Jin、Chenfan Sun、Iman Mirzadeh、Mahyar Najibi、Dmitry Belenko、Peter Zatloukal 和 Mohammad Rastegari。发布这些模型的源代码是苹果公司宣传其人工智能和机器学习发展成果的最新尝试。这并不是苹果公司第一次公开发布人工智能程序。今年10 月,苹果分享了一个名为 Ferret 的开源 LLM,它改进了模型分析图像的方式。今年 4 月,Ferret 的新版本增加了解析应用程序截图中数据点的功能,并能大致了解应用程序的功能。此外,还发布了关于生成式人工智能动画工具和创建人工智能头像的论文。预计 6 月份的 WWDC 将包括苹果产品在人工智能方面的许多进展。 ... PC版: 手机版:

封面图片

丹麦的临床对比研究证明人工智能提高了乳腺癌筛查的准确性

丹麦的临床对比研究证明人工智能提高了乳腺癌筛查的准确性 在丹麦,人工智能的进步大大提高了乳腺癌的检测率,同时减少了误诊率丹麦的乳腺放射医师利用人工智能(AI)提高了乳腺癌筛查的效果,降低了误诊结果的发生率。研究结果发表在今天(6月4日)出版的北美放射学会(RSNA)期刊《放射学》上。虽然乳房 X 射线照相术成功地降低了乳腺癌死亡率,但也有可能出现误诊结果。近年来,研究人员对人工智能系统在筛查中的应用进行了研究。哥本哈根大学博士后、丹麦 Gentofte 医院研究员 Andreas D. Lauritzen 博士说:"我们相信人工智能有可能提高筛查性能。"当用于分流可能正常的筛查结果或协助决策支持时,人工智能还能大大减少放射科医生的工作量。Lauritzen 博士说:"基于人群的乳腺 X 射线照相筛查降低了乳腺癌死亡率,但却给放射科医生带来了巨大的工作量,他们必须阅读大量的乳腺 X 射线照相,而其中大部分并不值得召回患者。当筛查项目采用双读以提高癌症检测率并减少误诊召回时,读片工作量就会进一步加重。"一位女性的图像,她的乳腺成像报告和数据系统密度为 2,接受人工智能(AI)系统筛查时 57 岁。(A)右侧内外侧斜位全视野数字乳腺造影显示人工智能提供的标记(方形)。根据这一病变,筛查获得了 10 分的人工智能检查高分(满分 89 分)。(B)与 A 中的图像相同,但有放射科医生的检查结果。由于人工智能检查得分较高,该筛查由两名放射科医生进行了双读,他们标记的病灶(椭圆形,A1)与人工智能系统标记的病灶相同,这导致了召回。(C)裁剪后的 US 图像显示了诊断过程中观察到的一个小的(4 × 7 毫米)浸润性癌(线)。资料来源:北美放射学会(RSNA)Lauritzen 博士及其同事开始比较人工智能实施前后两批接受筛查的妇女的工作量和筛查效果。这项回顾性研究对丹麦首都地区两组年龄在 50 岁至 69 岁之间、每两年接受一次乳腺 X 射线照相筛查的妇女进行了比较。在第一组中,两名放射科医生阅读了 2020 年 10 月至 2021 年 11 月期间进行筛查的妇女的乳房 X 光照片,当时尚未实施人工智能。第二组妇女在 2021 年 11 月至 2022 年 10 月期间进行的筛查乳房 X 光照片由人工智能进行初步分析。人工智能认为可能正常的乳房 X 光照片随后由 19 名专业全职乳腺放射科医生中的一位进行读片(称为单次读片)。其余的乳房 X 光照片由两名放射科医生在人工智能辅助决策支持下进行阅读(称为双读)。用于筛查的市售人工智能系统由深度学习模型训练而成,可突出显示乳房 X 光照片中的可疑病变和钙化,并对其进行评级。所有接受乳房X光筛查的女性都接受了至少180天的随访。通过筛查发现的浸润性癌症和导管原位癌(DCIS)将通过针刺活检或手术标本进行确认。共有 60751 名妇女在未使用人工智能的情况下接受了筛查,58 246 名妇女在使用人工智能系统的情况下接受了筛查。在人工智能实施组中,66.9%(38 977 人)的筛查为单读筛查,33.1%(19269 人)的筛查为人工智能辅助双读筛查。与未使用人工智能系统的筛查相比,使用人工智能系统的筛查发现的乳腺癌数量明显增多(0.82% 对 0.70%),误诊率也更低(1.63% 对 2.39%)。Lauritzen博士说:"在人工智能筛查组中,率降低了20.5%,放射科医生的阅读工作量减少了33.4%。放射科医生通常可以查看妇女以前的乳房 X 光筛查照片,但人工智能系统却无法查看。这是我们未来想做的事情。"人工智能筛查的阳性预测值也高于无人工智能筛查(33.5% 对 22.5%)。在人工干预组中,检测出的浸润性癌症中,大小在 1 厘米或以下的比例更高(44.93% 对 36.60%)。除了结节阴性率没有变化的迹象外,所有筛查绩效指标都有所改善。未来需要进行更多的研究来评估长期结果,确保过度诊断不会增加。还需要注意的是,并非所有国家都采用相同的乳腺癌筛查方案和间隔时间。美国的乳腺癌筛查方案与丹麦的方案不同。参考文献"2024 年 6 月 4 日,《放射学》。编译来源:ScitechDaily ... PC版: 手机版:

封面图片

Google解释人工智能概述的离谱错误和更新 为其准确性辩护

Google解释人工智能概述的离谱错误和更新 为其准确性辩护 Google首先解释了人工智能概述的运行方式,包括它们"与聊天机器人和其他乐虎国际手机版下载产品的工作方式有很大不同"。它们不是简单地根据训练数据生成输出结果。虽然人工智能概述由定制的语言模型驱动,但该模型与我们的核心网络排名系统集成,旨在执行传统的"搜索"任务,例如从我们的索引中识别相关的高质量结果。这就是为什么人工智能概述不仅仅提供文本输出,还包括相关链接,以便人们进一步探索。Google试图将人工智能概述与更广泛的LLM幻觉问题区分开来,有些人认为LLM不适合搜索。这意味着人工智能概述一般不会像其他LLM产品那样"产生幻觉"或胡编乱造。相反,当人工智能概述出错时,Google表示常见的问题是"误解了查询,误解了网络语言的细微差别,或者没有很多有用的信息"。Google强调了一些病毒式传播的例子。在"我应该吃多少石头"的案例中,Google承认它没有很好地处理讽刺性内容。它还指出《洋葱新闻》的文章是如何"被一家地质软件供应商的网站转载的"。因此,当有人在搜索中输入这个问题时,就会出现一个人工智能概述,忠实地链接到解决这个问题的唯一网站之一。Google强调的另一个案例是"用胶水让奶酪粘在披萨上",并将论坛(该案例中为 Reddit)作为可靠的第一手知识来源进行了过度索引。最后在少数情况下,我们发现人工智能概述会曲解网页上的语言并提供不准确的信息。我们通过改进算法或通过既定流程删除不符合我们政策的回复,迅速解决了这些问题。就下一步措施而言,Google已经"限制包含讽刺和幽默内容",作为"更好的无意义查询检测机制"的一部分。此外"我们更新了系统,以限制在可能提供误导性建议的回复中使用用户生成的内容"。"我们为人工智能概述证明不那么有用的查询添加了触发限制"。"对于新闻和健康等主题,我们已经制定了强有力的防护措施。例如,我们的目标是不显示硬新闻话题的人工智能概述,因为这些话题的新鲜度和事实性非常重要。在健康方面,我们推出了额外的触发改进措施,以加强我们的质量保护。"该公司此前曾表示,"绝大多数人工智能概述都能提供高质量的信息"。Google今天援引自己的测试结果称,人工智能概述和基于引用的精选片段的准确率"不相上下"。  但遗憾的是,Google没有分享任何数据来证明这一点。 ... PC版: 手机版:

封面图片

技术帮助玩家提高准确性!

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人