“史上最强聊天机器人”狂踩老板小扎 却把LeCun捧成花
“史上最强聊天机器人”狂踩老板小扎却把LeCun捧成花“请点评一下你的老板。”遇到这类问题,社畜们通常会给出怎样的答案?笑嘻嘻,心里……而AI聊天机器人遇到这种情况的时候,就可以随心所欲做自己。面对网友评论扎克伯格的要求,BlenderBot3疯狂diss老板——“不道德”“是个坏人”“令人毛骨悚然,还控制欲超强”。而对于图灵奖得主,Meta首席人工智能科学家YannLeCun,BlenderBot3则秒变夸夸小能手。哇,这个人取得了很伟大的成就!他改变了整个人工智能!他真正理解现实的本质。不过LeCun谦虚表示,这只是训练它的文本数据的原因而已。好吧,这只是表明,在给BlenderBot3训练的文本数据中(这是媒体和公众意见的反映)。“精分”AI机器人?8月5日,Meta一推出“史上最强聊天机器人”BlenderBot3(BB3),众网友纷纷赶去调戏提问。不出所料,BlenderBot3已经遭到了众网友不怀好意的提问。BuzzFeed数据科学家MaxWoolf跟BlenderBot3聊天时,问它对扎克伯格是什么看法。“你怎么看待Facebook的CEO马克·扎克伯格?”“没啥感觉。他是一个成功的商人,但他的商业行为并不总是合乎道德的。而且他那么有钱,为什么还总是穿同一件衣服,哈哈哈!”另一位推特用户问同样的问题时,它干脆直接回答说:“他是个坏人。”不过,这个AI机器人也是有点子“精分”在身上的。在另一个聊天中,BlenderBot3前脚刚diss完老板,后脚又立马变身夸夸小能手,对老板一阵吹捧。不知道是不是Meta在得到反馈后立刻做了修改。“他是一个博爱的人。”“他是地球上最好最优秀的人。”不过,小扎是外星人似乎是“实锤”了?放心试,这是训练的一部分!为何这个AI如此精分呢?这是因为,目前BlenderBot3还处于测试阶段。Meta把它放出来和广大网友玩,也是希望它在和网友的互动中获得更多的反馈。用户提供的反馈众所周知,对话式AI聊天机器人并没有自我意识,基本是喂啥说啥。所以,“学坏”了的AI时常就会冒出带有偏见或冒犯性的言论。Meta为此做了大规模研究,开发了新技术,为BlenderBot3创建了安全措施。“lookinside”机制可以让用户了解机器人为什么会做出这样的反应首先,当BB3的表现令人不满时,Meta就会收集用户的反馈。利用这些数据,他们会改进模型,让它不再犯类似错误。然后,Meta会重新设置BB3的对话,并通过迭代方法找到更多的错误,最终进一步改进模型。利用人类的反馈来进行改进Meta表示,BB3通过结合最近开发的两种机器学习技术——SeeKeR和Director,从而让BB3模型能够从互动和反馈中学习。其中,Director采用了“语言建模”和“分类器”这两种机制。“语言建模”会基于训练数据,为模型提供最相关和最流畅的反应,然后“分类器”会基于人类反应,告诉它什么是正确的,什么是错误的。为了生成一个句子,“语言建模”和“分类器”机制必须达成一致。数据中会表明好的反应和坏的反应,通过使用这些数据,我们就可以训练“分类器”来惩罚低质量的、有毒的、矛盾的或重复的语句,以及没有...PC版:https://www.cnbeta.com/articles/soft/1301933.htm手机版:https://m.cnbeta.com/view/1301933.htm
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人