AI 标注员都开始用 AI 了。

众包工人用 AI 为 AI 做数据标注工作

众包工人用AI为AI做数据标注工作AI模型是建立在人类劳动的基础之上的，高质量的数据标注对AI模型至关重要，AI公司通常会雇佣廉价的众包工人做一些数据标注工作。但研究显示，随着AI聊天机器人，如ChatGPT的流行，众包工人开始利用AI做这些数据标注的工作。瑞士洛桑联邦理工学院的研究人员招募了44名众包工人来对16篇医学研究论文总结摘要，根据记录的击键情况，比如按下复制快捷键等，他们估计有33-46%的摘要文本是用AI生成的。消息来源：关联阅读：投稿：@ZaiHuaBot频道：@TestFlightCN

ChatGPT 在文本标注任务中的表现超过了众包工人

苏黎世大学的研究人员在预印本平台arXiv上发表论文，报告OpenAI的AI聊天机器人ChatGPT在文本标注任务中的表现超过了众包工人。大量的自然语言处理（NLP）应用需要高质量的标注数据，此类任务可根据复杂程度和规模交给亚马逊众包平台MTurk上的众包工人或专业的标注者去完成。研究人员使用了包含2,382则推文的样本，对比了ChatGPT和众包工人以及专业标注者的表现。结果显示，ChatGPT在五项任务中有四项超过了众包工人，在评估一致性（intercoderagreement）上超过了众包工人以及专业标注者。更重要的是ChatGPT的标注成本每条不到0.003美元，是众包工人二十分之一。研究显示大语言模型可显著提高文本分类的效率。()投稿：@ZaiHuabot频道：@TestFlightCN

知网AI生成文本检测专利公布可检测文本是否为AI生成

知网AI生成文本检测专利公布可检测文本是否为AI生成据天眼查，近日，同方知网数字出版技术股份有限公司申请的“一种AI生成文本的检测方法、装置、介质及设备”专利公布。摘要显示，通过将待检测文本输入文本分类模型，得到文本为AI生成的第一概率值；基于待检测文本及目标损失函数，得到文本的偏离度特征；基于待检测文本、预测模型及预设字典，得到文本的扩散度特征值；基于待检测文本，得到文本的句子长度特征及字词分布特征；根据上述第一概率值、偏离度特征、扩散度特征值、句子长度特征及字词分布特征，判定文本是否为AI生成文本。该专利不仅检测效率高，且不受审核人员的主观影响，检测结果更加准确。消息来源:

知网 AI 生成文本检测专利公布可检测文本是否为 AI 生成

知网AI生成文本检测专利公布可检测文本是否为AI生成天眼查App显示，近日，同方知网数字出版技术股份有限公司申请的“一种AI生成文本的检测方法、装置、介质及设备”专利公布。摘要显示，通过将待检测文本输入文本分类模型，得到文本为AI生成的第一概率值；基于待检测文本及目标损失函数，得到文本的偏离度特征；基于待检测文本、预测模型及预设字典，得到文本的扩散度特征值；基于待检测文本，得到文本的句子长度特征及字词分布特征；根据上述第一概率值、偏离度特征、扩散度特征值、句子长度特征及字词分布特征，判定文本是否为AI生成文本。该专利不仅检测效率高，且不受审核人员的主观影响，检测结果更加准确。

YouTube开始要求发布视频时标注是否为AI创建

YouTube开始要求发布视频时标注是否为AI创建2023年11月YouTube就宣布要在创作者中心添加人工智能标签，现在这个标签已经广泛推出，并对一些内容进行了修改。添加这个标签的本质目的是防止AI创作的逼真内容可能导致的虚假信息传播，而不是说所有由AI创建的内容都必须贴上AI标签。谷歌并不反对创作者使用人工智能技术，例如使用人工智能修改背景、调整颜色、修改一些滤镜效果等，这些都是完全可以的。同时YouTube还开发了一种机制，如果视频可能有迷惑或误导人们，那么YouTube可以自行决定在视频上贴上AI标签用来澄清。此外YouTube还开发了一种针对观看次数的流程，如果视频使用逼真的人工智能制作内容，则会向YouTube发送匿名警报，提醒YouTube处理此类内容。来源，频道：@kejiqu群组：@kejiquchat

世界首个 AI 程序员 Devin 视频竟造假？

世界首个AI程序员Devin视频竟造假？一位有35年软件工程师经验的YouTube博主通过逐帧分析Devin完成Upwork任务的宣传视频，发现Devin并不能像人类工程师那样完成任务，且表现非常糟糕。博主自己复制Devin尝试做的任务仅花费了大约36分钟，而Devin却用了至少6个小时，甚至可能超过一天。这引发了网友对Devin能力的质疑，认为其更多的是营销和炒作，而不是现实。博主在分析中指出，Devin在实际操作中遇到了许多问题，包括命令行错误、代码库版本不匹配、语法错误等。这些问题表明Devin在理解任务要求、处理实际问题和调试代码方面存在不足。博主还提到，软件开发者工作中最难、最关键的部分是与客户、领导及其他利益相关者的沟通，而这些是AI目前无法完成的任务。文章还提到了Devin在SWE-bench基准测试中的表现，以及全网对AI程序员的讨论和恐慌。尽管Devin在某些方面表现出色，但关于AI程序员能否解决真实问题的能力，仍应持有保留态度。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

相关推荐