AI 标注员都开始用 AI 了。

AI标注员都开始用AI了。又一条路锁死。我们在亚马逊机械土耳其重新运行了一项关于摘要总结的任务,并通过键盘击键检测和合成文本分类的组合,估计完成任务的众包工作者中有33-46%使用了LLMs。

相关推荐

封面图片

众包工人用 AI 为 AI 做数据标注工作

众包工人用AI为AI做数据标注工作AI模型是建立在人类劳动的基础之上的,高质量的数据标注对AI模型至关重要,AI公司通常会雇佣廉价的众包工人做一些数据标注工作。但研究显示,随着AI聊天机器人,如ChatGPT的流行,众包工人开始利用AI做这些数据标注的工作。瑞士洛桑联邦理工学院的研究人员招募了44名众包工人来对16篇医学研究论文总结摘要,根据记录的击键情况,比如按下复制快捷键等,他们估计有33-46%的摘要文本是用AI生成的。消息来源:关联阅读:投稿:@ZaiHuaBot频道:@TestFlightCN

封面图片

ChatGPT 在文本标注任务中的表现超过了众包工人

苏黎世大学的研究人员在预印本平台arXiv上发表论文,报告OpenAI的AI聊天机器人ChatGPT在文本标注任务中的表现超过了众包工人。大量的自然语言处理(NLP)应用需要高质量的标注数据,此类任务可根据复杂程度和规模交给亚马逊众包平台MTurk上的众包工人或专业的标注者去完成。研究人员使用了包含2,382则推文的样本,对比了ChatGPT和众包工人以及专业标注者的表现。结果显示,ChatGPT在五项任务中有四项超过了众包工人,在评估一致性(intercoderagreement)上超过了众包工人以及专业标注者。更重要的是ChatGPT的标注成本每条不到0.003美元,是众包工人二十分之一。研究显示大语言模型可显著提高文本分类的效率。()投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

知网AI生成文本检测专利公布 可检测文本是否为AI生成

知网AI生成文本检测专利公布可检测文本是否为AI生成据天眼查,近日,同方知网数字出版技术股份有限公司申请的“一种AI生成文本的检测方法、装置、介质及设备”专利公布。摘要显示,通过将待检测文本输入文本分类模型,得到文本为AI生成的第一概率值;基于待检测文本及目标损失函数,得到文本的偏离度特征;基于待检测文本、预测模型及预设字典,得到文本的扩散度特征值;基于待检测文本,得到文本的句子长度特征及字词分布特征;根据上述第一概率值、偏离度特征、扩散度特征值、句子长度特征及字词分布特征,判定文本是否为AI生成文本。该专利不仅检测效率高,且不受审核人员的主观影响,检测结果更加准确。消息来源:

封面图片

知网 AI 生成文本检测专利公布 可检测文本是否为 AI 生成

知网AI生成文本检测专利公布可检测文本是否为AI生成天眼查App显示,近日,同方知网数字出版技术股份有限公司申请的“一种AI生成文本的检测方法、装置、介质及设备”专利公布。摘要显示,通过将待检测文本输入文本分类模型,得到文本为AI生成的第一概率值;基于待检测文本及目标损失函数,得到文本的偏离度特征;基于待检测文本、预测模型及预设字典,得到文本的扩散度特征值;基于待检测文本,得到文本的句子长度特征及字词分布特征;根据上述第一概率值、偏离度特征、扩散度特征值、句子长度特征及字词分布特征,判定文本是否为AI生成文本。该专利不仅检测效率高,且不受审核人员的主观影响,检测结果更加准确。

封面图片

YouTube开始要求发布视频时标注是否为AI创建

YouTube开始要求发布视频时标注是否为AI创建2023年11月YouTube就宣布要在创作者中心添加人工智能标签,现在这个标签已经广泛推出,并对一些内容进行了修改。添加这个标签的本质目的是防止AI创作的逼真内容可能导致的虚假信息传播,而不是说所有由AI创建的内容都必须贴上AI标签。谷歌并不反对创作者使用人工智能技术,例如使用人工智能修改背景、调整颜色、修改一些滤镜效果等,这些都是完全可以的。同时YouTube还开发了一种机制,如果视频可能有迷惑或误导人们,那么YouTube可以自行决定在视频上贴上AI标签用来澄清。此外YouTube还开发了一种针对观看次数的流程,如果视频使用逼真的人工智能制作内容,则会向YouTube发送匿名警报,提醒YouTube处理此类内容。来源,频道:@kejiqu群组:@kejiquchat

封面图片

世界首个 AI 程序员 Devin 视频竟造假?

世界首个AI程序员Devin视频竟造假?一位有35年软件工程师经验的YouTube博主通过逐帧分析Devin完成Upwork任务的宣传视频,发现Devin并不能像人类工程师那样完成任务,且表现非常糟糕。博主自己复制Devin尝试做的任务仅花费了大约36分钟,而Devin却用了至少6个小时,甚至可能超过一天。这引发了网友对Devin能力的质疑,认为其更多的是营销和炒作,而不是现实。博主在分析中指出,Devin在实际操作中遇到了许多问题,包括命令行错误、代码库版本不匹配、语法错误等。这些问题表明Devin在理解任务要求、处理实际问题和调试代码方面存在不足。博主还提到,软件开发者工作中最难、最关键的部分是与客户、领导及其他利益相关者的沟通,而这些是AI目前无法完成的任务。文章还提到了Devin在SWE-bench基准测试中的表现,以及全网对AI程序员的讨论和恐慌。尽管Devin在某些方面表现出色,但关于AI程序员能否解决真实问题的能力,仍应持有保留态度。线索:@ZaiHuabot投稿:@TNSubmbot频道:@TestFlightCN

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人