ChatGPT官宣提升了“真实性”和“数学能力”

ChatGPT官宣提升了“真实性”和“数学能力”大概是考虑到了这一点,ChatGPT刚刚宣布了一次重要更新:提升了“真实性”和“数学能力”。本次是ChatGPT自去年11月推出以来的第三次更新,但由于“更新说明”过于模糊,人们还需要经历一个对新能力的探索过程。几日前,计算机科学家、Wolfram语言之父StephenWolfram将理工科神器WolframAlpha与ChatGPT结合起来,为后者注入超强计算知识实现互补,效果相当不错。那么,这次更新之后的ChatGPT数学能力可与其一战吗?看起来……对比的结果不尽如人意:“只能说神经网络不是用来干这个的”,SebastianRaschka都觉得无奈了。还有人发现,升级后的ChatGPT“脾气逐渐暴躁”:“你数学是哪位老师教的?”面对一道十以内加减法的题目,它的语气像极了辅导孩子作业的家长。这也许是“偶然现象”?看来数学是真难。不管怎么说,我们可以期待一波后续的有趣Demo了。太卷了:ChatGPT和它的竞争者们“未来6到12个月将带来实验的爆炸式增长,一旦公司能够使用OpenAI的API在ChatGPT之上构建。出现的杀手级用例可能是围绕生成式AI对知识管理的影响。”NicolaMoriniBianzino。在最近的一次公开活动上,安永全球首席技术官NicolaMoriniBianzino表示,目前还没出现在企业中使用ChatGPT的“杀手级”用例。但这种状态可能很快就会改变,他预测未来6到12个月将带来大量实验,尤其是当公司能够使用OpenAI的API在ChatGPT上构建之后。Bianzino将生成式AI对知识管理的影响描述为“AI的辩证法”。“知识公司倾向于以一种非常扁平的二维方式存储知识,这使得访问、互动和对话变得困难。我们在20、30、40年前尝试构建专家系统。这并不是很顺利,因为它们太死板了。我认为这项技术有望克服专家系统存在的许多问题。”NicolaMoriniBianzino表示。与此同时,ChatGPT的竞争者们也不断涌现,这个赛道变得越来越“卷”。从Anthropic公司的Claude、DeepMind公司的Sparrow、Google公司的LAMDA到CharacterAI,每天似乎都有新竞争者步入赛场。Anthropic是一家旧金山的初创公司,由几位离开OpenAI的研究人员于2021年创立。公司成立不到一年后就宣布了高达5.8亿美元的融资,上周五还被报道即将增加3亿美元融资。这家公司开发了一个名为“Claude”的AI聊天机器人,目前通过Slack集成在封闭测试版中可用,据报道它与ChatGPT相似,甚至有一些改进。Anthropic描述自身的使命为“致力于构建可靠、可解释和可操纵的AI系统”。DeepMind同样是这条赛道上不可忽视的力量。这家公司在9月份的一篇论文中介绍了“Sparrow”,被誉为“朝着创建更安全、偏差更小的机器学习系统迈出的重要一步”。Sparrow是“一种有用的对话智能体,可以降低不安全和不适当答案的风险”,旨在“与用户交谈、回答问题并在有助于查找证据”。不过,DeepMind的安全研究员、Sparrow论文的主要作者GeoffreyIrving表示,DeepMind认为Sparrow是一个基于研究的概念验证模型,尚未准备好部署。在两周前的《时代周刊》文章中,该公司的首席执行官兼联合创始人DemisHassabis表示,DeepMind正在考虑在2023年的某个时候发布其聊天机器人Sparrow的“私人测试版”。如此一来,公司就可以开发基于强化学习的功能,比如引用来源——这是ChatGPT所没有的能力。再说到Google的LaMDA,这一模型曾在去年夏天引发过热议——Google工程师BlakeLemoine因声称LaMDA具有感知能力而被解雇。即使不像Lemoine认为的那样,LaMDA仍被认为是ChatGPT最大的竞争对手之一。Google在2021年发布的博客文章中表示,LaMDA的对话技巧“已经酝酿多年”。与ChatGPT一样,LaMDA建立在Transformer架构之上,也接受过对话方面的训练。根据Google的说法,“在训练期间,LaMDA发现了一些将开放式对话与其他形式的语言区分开来的细微差别。”《纽约时报》在1月20日的一篇报道中提到,Google创始人LarryPage和SergeyBrin上个月会见了公司高管,讨论了ChatGPT可能对Google1490亿美元的搜索业务构成的威胁。Google发言人在一份声明中表示:“我们继续在内部测试我们的AI技术,以确保它有用且安全,我们期待尽快与外部分享更多经验。”另外一位颇具实力的玩家则是CharacterAI,这家公司由Transformer论文作者之一NoamShazeer创办,逐渐为人熟知。该公司推出的AI聊天机器人技术允许用户与任何人聊天或进行角色扮演,比如模仿伊丽莎白女王和莎士比亚等历史人物。目前该技术是免费使用的,Character正在“研究用户如何与之互动,然后再制定具体的创收计划。”传百度将发布类似ChatGPT的聊天机器人更能引起国内AI从业者关注的是,据路透社、彭博社等多家外媒报道称,百度公司计划在3月份推出类似于OpenAI的ChatGPT的人工智能聊天机器人服务。消息人士称,百度计划在用户提出搜索请求时整合聊天机器人生成的结果,而不仅仅是链接。“该工具尚未命名,将嵌入在主搜索服务中,用户将返回对话风格的搜索结果。”在去年12月在一次内部讨论中,百度CEO李彦宏曾分享自己对ChatGPT的看法:“把这么酷的技术变成人人需要的产品”才是最难的,希望百度新的一年“至少能有一个高成长、有创新的业务,真正的aboveandbeyondourexpectation”。而据《科创板日报》1月30日报道,百度内部确有推出类似ChatGPT聊天机器人的规划,但具体时间并不精确。百度CEO李彦宏对于该项目的定位是“引领搜索体验的代际变革”。他在内部指出,相关技术已达到临界点,百度在其中有较大的机会。检测利器:让大型语言模型生成的文本无处隐藏ChatGPT的能力纵然强大,但同时它在学校作业、论文发表等领域的滥用已经引发了人们广泛的担忧。因此,学界开始探索检测ChatGPT等大型语言模型(LLM)生成文本的方法和工具。马里兰大学几位研究者对ChatGPT等语言模型输出的水印进行了研究。在论文《AWatermarkforLargeLanguageModels》,他们提出了一种高效水印框架,水印的嵌入对文本质量的影响忽略不计,可以使用高效的开源算法进行检测,而无需访问语言模型的API或参数。本文方法可以检测到比较短的合成文本(少至25个tokens),同时使得人类文本在统计学上不可能被标记为机器生成。斯坦福大学几位研究者在论文《DetectGPT:Zero-ShotMachine-GeneratedTextDetectionusingProbabilityCurvature》中,证明了从LLM中采样的文本倾向于占据模型对数概率函数的负曲率区域。利用这一观察结果,他们定义了一个基于曲率的新标准,来判断一段文章是否由给定的LLM生成。研究者将他们的方法称为DetectGPT,它不需要训练单独的分类器、收集真实或生成段落的数据集以及显式地为生成文本加水印。DetectGPT仅使用感兴趣模型计算的对数概率和另一通用预训练语言模型(如T5)生成段落的随机扰动。结果发现,DetectGPT比当前模型样本检测的零样本方法更具辨别力,尤其是将20B参数GPT-NeoX生成的假新闻报道检测从最强零样本基线的0.81AUROC提升到了0.95AUROC。未来将公布代码和数据。DetectGPT检测GPT-3生成文本的示意图。除了以论文形式展现的检测方案,也有个人推出了强大的检测工具。比如一位来自HiveAI、致力于ChatGPT检测器研究的ML工程师,其方案能够识别ChatGPT、GPT-3和其他流行AI引擎生成的文本。从内部基准测试结果来看,该方案效果明显优于GPTZero和OpenAIGPT2OutputDetector等类似方法。在内部数据集上,模型平衡准确...PC版:https://www.cnbeta.com.tw/articles/soft/1341913.htm手机版:https://m.cnbeta.com.tw/view/1341913.htm

相关推荐

封面图片

OpenAI官宣推出多模态ChatGPT 能看、能听、还会说

OpenAI官宣推出多模态ChatGPT能看、能听、还会说(来源:OpenAI)ChatGPT此前曾推出过能上传图片的“代码解释器“功能,具备了一些初步处理图像和文本照片的能力。但毫无疑问,今天这个“随手拍、随心问”才更贴近大多数用户的AI助手使用场景。拍张冰箱照片告诉你今晚吃啥按照标题的顺序,今天更新的功能主要有两点:基于图片的对话,以及实时语音对话。先说关注度非常高的图片聊天功能。按照OpenAI的说法,用户现在可以拍一张冰箱的照片,然后让ChatGPT来推荐菜谱;在旅行时拍摄一张地标的照片,让ChatGPT来讲述这处景点的有趣之处。当然,也能拍一张数学题的照片,让ChatGPT来解答。在官方给出的例子中,给到ChatGPT一张自行车的照片,问它如何把座椅调低。然后ChatGPT表示看你车的型号,有的车有快拆杆,有的是用螺栓固定,然后给出了详细的步骤。随后官方装作不懂,拍了一张螺栓的照片,并用官方画图工具圈出来以示强调,然后问ChatGPT这是不是快拆杆。ChatGPT表示你这个是螺栓,得去找一个内六角扳手。随后官方又拍了一张工具箱的照片,问ChatGPT到底是哪一个扳手。ChatGPT也顺利地认出了扳手,并准确提示用户到底要拿哪一个尺寸。ChatGPT会说话啦!除此之外,OpenAI也将语音识别、转录和音频生成功能打包,推出了AI语音聊天的功能,这项功能只适用于iOS和安卓客户端。官方表示,用户可以用这项功能为家里的小孩讲睡前故事。或者家里吃着饭,突然为某个问题吵起架来,这个时候就可以把ChatGPT拍在桌面上解决争论。OpenAI介绍称,这项功能使用了Whisper开源语音识别系统,将用户说的话转录成文本。同时还用上了一项新的文本转语音模型,并与专业配音演员合作,提供5种可供用户自行选择的声音。更先进的AI也有新的风险和局限性OpenAI表示,新的语音技术能够仅通过几秒钟的真实语音创造出逼真的合成声音。这种功能打开了创造力的大门,也带来了新的风险——例如不法分子可能伪造公众人物进行欺诈。所以OpenAI的决策是通过“语音聊天”这样的特定用例来推出这项功能。同时OpenAI也在与更多的机构展开合作。例如流媒体公司Spotify就在试用这项功能来进行语音翻译,通过使用播客主持人的声音将播客音频翻译成其他语言,帮助播客主持人扩大他们的全球影响力。图像也会带来新的挑战,例如幻觉问题,以及使用者在高风险领域却依赖模型对图像的解释。因此在上线前,OpenAI也对极端主义和科学能力等领域进行了风险测试。另外对看到这篇文章的中文读者来说,图片对话的体验大概率值得期待,但语音对话可能要打一些折扣。OpenAI表示,该模型擅长转录英文文本,但在一些其他语言,特别是那些使用非罗马字母的语言中表现不佳,建议非英语用户不要使用ChatGPT来进行此类用途。...PC版:https://www.cnbeta.com.tw/articles/soft/1386295.htm手机版:https://m.cnbeta.com.tw/view/1386295.htm

封面图片

百度版ChatGPT文心一言3月完成内测对外开放

百度版ChatGPT文心一言3月完成内测对外开放中国互联网公司百度在确认将于3月推出与美国人工智能公司OpenAI开发的ChatGPT类似人工智能聊天机器人服务,香港股价一度上涨13%,为三个月来最大涨幅。综合彭博社和澎湃新闻报道,百度星期二(2月7日)确认,百度内部类似于聊天机器人ChatGPT的项目名字确定为“文心一言”,英文名ERNIEBot,将在3月完成内部测试,面向公众开放。彭博社1月30日引述知情人士报道,百度计划将类似ChatGPT的人工智能聊天机器人服务最初版本嵌入其主要搜索服务中。这项工具尚未命名,将允许用户获得与ChatGPT类似的对话式搜索结果。知情人士称,百度自研基于海量数据和先验知识训练的通用文本语义表示模型(Erniesystem)将是即将出台的ChatGPT类似工具的研发基础。目前,文心一言在做上线前的冲刺。去年9月,百度创始人李彦宏判断人工智能发展在技术层面和商业应用层面,都有方向性改变。据推测,百度那时已开始做文心一言。按照谷歌和微软加快推出类ChatGPT服务的节奏,文心一言开放内测还有可能提前。对话式大型语言模型ChatGPT被认为会颠覆现有搜索引擎的商业模式,吸引了微软公司的高度关注和合作兴趣,并促使谷歌公司在内部发布“红色代码”警报。其可以轻松与人类进行各个领域的对话,回答科学问题、写论文、写文章都不在话下。今年1月初,百度搜索杰出架构师辜斯缪曾在一次小范围的媒体沟通会上说:“我们预计在3月会做一个比较大的升级。百度搜索今年在技术上最重要的工作就是要把整个检索系统变成检索+生成双模系统。”据介绍,ChatGPT的相关技术百度都已有涵盖。在人工智能四层架构中,百度有全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言则位于模型层。百度对澎湃科技说,ChatGPT是人工智能里程碑,更是分水岭,这意味着人工智能技术发展到临界点,企业需要尽早布局。

封面图片

Google 宣布了挑战 ChatGPT 的 AI 服务 Bard

Google正式宣布了挑战OpenAI聊天机器人ChatGPT的AI服务。ChatGPT能以对话的方式回答用户输入的各种问题,它引入了信息检索的新模式,向Google统治了20多年的搜索引擎市场发起了挑战,搜索巨人为此加快推出自己的对话式AI服务Bard。Bard是基于它的 LanguageModelforDialogueApplications(缩写LaMDA),将首先挑选部分人员进行测试,然后未来几周逐渐推广给更广泛的用户。Bard和ChatGPT 的工作模式类似,根据训练的语料对用户输入的问题生成文本答案,它相对于ChatGPT的一个优势是能利用最新的数据,ChatGPT的数据截止于2021年。来源:投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

数学能力超ChatGPT 70B开源大模型火了

数学能力超ChatGPT70B开源大模型火了并且是在参数只有700亿,远不及后三者的情况之下。HuggingFace已上线3个在线可玩版本(分别为7B、13B和70B参数),各种数学题可以直接丢进去试一试。比如解决下面这道四次多项式方程:或者是一道简单的微积分:亦或者是稍微修改过的拉格朗日方程推导:它都全部正确(过程也不需要等太久)。有网友向作者表示:效果真的很惊人,感谢你们对开源LLM的贡献。目前,相关代码、复现方式以及论文也都开源或上线,GitHub短短几天已揽获4.8k标星。那么,WizardMath究竟是如何做到的?用AI生成的指令增强大模型能力OpenAI的大模型(InstructGPT、GPT-4等)能够取得巨大成功、去执行各种复杂和多样化的任务,一部分原因是使用了真实人类用户生成的开放域指令数据进行了微调。然而,不是谁都能像这家公司一样获得这样的指令数据集。一是因为整个注释过程极其昂贵且耗时,二是人工难以创建出足够比例的高难度指令。因此,开发出一种成本相对较低的、大规模开放域指令自动生产方法,成为当下指令调优语言模型的关键。在此,作者将他们的方法命名为EvolInstruction。它是一种利用AI来代替人类自动生成涵盖各种难度级别开放域指令的新方法。具体而言,EvolInstruction分为指令进化器和指令消除器。其中指令进化器可通过深度进化(蓝线)或广度进化(红线)两种路径,将简单指令升级为更复杂的指令或创建一条全新指令。具体执行哪一条?随机选择就好。其中,深度进化的具体“进化法”,则是通过五种类型的操作来完成,包括:添加约束(addconstraints)、深化(deepening)、具体化(concretizing)、增加推理步骤(increasereasoningsteps)和使输入复杂化(complicateinput)。由于所有指令均由AI完成,有时难免会出现错误。因此,指令消除器就是用于过滤失败指令的。以下是一个具体示例,该方法从“1+1=?”开始,最终通过以上步骤自动生成了相当多的新指令。通过重复这一生成过程,最终我们就能得到足够多的指令,然后将它们合并并随机打乱,组成一个难度级别均匀分布的指令集,就可以对基础大模型进行微调了。在此,作者选择Alpaca的训练数据(仅由175条人工创建的种子指令生成)作为初始数据集,然后使用ChatGPT的API执行了四个进化周期,最终获得25万条指令。为了与Vicuna的70k真实用户数据(ShareGPT)进行公平比较,作者从这25万条数据中抽取了等量的样本,训练LLaMA7B模型,最终得到WizardLM,结果WizardLM的性能明显优于Vicuna。(Alpaca:斯坦福在LLaMa-7B基础上微调出来的模型;Vicuna,UC伯克利在LLaMa-13B的基础上微调得来)此外,在更为复杂的测试指令下,人类更喜欢WizardLM的输出,而非ChatGPT,这表明该方法可以显着提高LLM处理复杂指令的能力。基于此,作者又利用EvolInstruction生成了很多数学领域相关的指令,然后微调羊驼大模型,得到了WizardMath。其效果如开头所示,在GSM8k数据集上测得其数学能力超越包括ChatGPT、ClaudeInstant1、PaLM2-540B等一众大模型,位列第5名,仅次于GPT-4、Claud1.3和2.0,以及5400亿参数的Flan-PaLM2之后。以此类推,作者还在羊驼之上得到了专攻代码能力的WizardCoder,效果超越Claude和Bard(详情可戳文末地址)。团队介绍本文共9位作者,全华人。一作有3位:CanXu,微软亚洲互联网工程院S+DNLP组高级应用科学家,之前曾在微软小冰研究组和微软亚研院从事聊天机器人系统工作;QingfengSun,MicrosoftResearch科学家,研究方向为自然语言处理和信息检索,精通构建高效搜索系统,为MicrosoftBing和Office365贡献了核心深度模型;KaiZheng,MicrosoftResearch科学家,研究方向为自然语言处理、搜索和推荐排名,同样为MicrosoftBing和Office365贡献了核心深度模型。通讯作者为姜大昕,微软全球合伙人、副总裁、前微软亚洲研究院首席科学家,在微软工作16年有余、曾作为微软必应搜索引擎和Cortana智能助手自然语言理解负责人,日前已被曝离职投身大模型创业。另还有一位作者JiazhanFeng,是北大学生,这篇合著论文是TA在微软实习时产出的。项目主页:https://github.com/nlpxucan/WizardLM/tree/main/WizardMath...PC版:https://www.cnbeta.com.tw/articles/soft/1376959.htm手机版:https://m.cnbeta.com.tw/view/1376959.htm

封面图片

Google声称Bard AI在数学和编程方面有所进步

Google声称BardAI在数学和编程方面有所进步正如博客文章所解释的那样,大型语言模型(LLM)(例如Bard)本质上是预测引擎。当给出提示时,他们会通过预测句子中接下来可能出现的单词来做出响应。这使他们成为非常优秀的电子邮件和论文作者,但对于软件开发人员来说,它有些有些容易出错。你可能会说——像GitHub的Copilot和亚马逊的CodeWhisperer这样的代码生成模型呢?这些不是通用的。与Bard和ChatGPT沿线的竞争对手不同,后者使用来自网络、电子书和其他资源的大量文本样本进行训练,Copilot、CodeWhisperer和类似的代码生成模型几乎完全在代码样本上进行训练和微调。为了解决一般LLM中的编码和数学缺陷,Google开发了隐式代码执行,允许Bard编写和执行自己的代码。最新版本的Bard识别可能受益于逻辑代码的提示后编写代码对其进行测试并使用结果生成表面上更准确的响应。根据内部基准测试,Google表示,与之前的Bard版本相比,新的Bard对“基于计算的”单词和数学问题的反应提高了30%。当然,我们必须在现实中观察这些说法是否经得起外部测试。“即使有了这些改进,Bard也不会总是正确——例如,Bard可能不会生成代码来帮助快速响应,它生成的代码可能是错误的,或者Bard可能不会在其响应中包含已执行的代码,”Bard产品负责人JackKrawczyk和工程副总裁AmarnagSubramanya在博文中写道。“综上所述,这种通过结构化、逻辑驱动的能力进行响应的改进能力是使Bard变得更有帮助的重要一步。”当Google今年早些时候推出Bard时,它并没有将其与BingChat和ChatGPT等产品相提并论。事实上,这次推出有点像一场灾难,输出的错误答案短暂地使公司股价下跌了8%。据报道,在发布Bard之前对其进行测试的几名Google员工对这家搜索巨头提出了严重的担忧,其中一人称其为“病态的骗子”,而另一人则认为其“比无用还糟糕”。通过隐式代码生成和其他增强功能,如支持新语言、多模式查询和图像生成,Google回应了批评——并试图扭转局面。不过,它是否足以跟上该领域领先的生成式AI聊天机器人的步伐还有待观察。最近,Anthropic推出了一个人工智能聊天机器人模型,它具有大大扩展的“上下文窗口”,这使得模型可以相对连贯地交谈数小时甚至数天,而不是几分钟。ChatGPT背后的开发者OpenAI已经开始支持使用外部知识和技能增强ChatGPT的插件。...PC版:https://www.cnbeta.com.tw/articles/soft/1364079.htm手机版:https://m.cnbeta.com.tw/view/1364079.htm

封面图片

ChatGPT 浏览器扩展精选 ——

ChatGPT浏览器扩展精选——1.DetectGPT-检测由神经网络编写的文本。在浏览网页时识别AI生成的内容。(Chrome浏览器)https://chrome.google.com/webstore/detail/detectgpt-detect-chat-gpt/oadkgbgppkhoaaoepjbcnjejmkknaobg/related2.CheatScrubGPTDetector-类似的插件,但功能更多。(火狐浏览器)https://addons.mozilla.org/en-US/firefox/addon/cheatscrub/3.ChatGPTforSearchEngines-将ChatGPT集成到浏览器搜索栏中。(Chrome、Firefox、Edge)https://chatonai.org/4.Ghostwrite:ChatGPT电子邮件助手-可帮您撰写电子邮件的智能服务。(Chrome浏览器)https://chrome.google.com/webstore/detail/ghostwrite-chatgpt-email/fbjnnjochaopepfjpngghafgnafebkjh5.CasperAI-用于执行各种任务的智能助手。例如,可以制作一篇文章的简述。(Chrome)https://chrome.google.com/webstore/detail/casper-ai/fgfiokgecpkambjildjleljjcihnocel6.ChatGPTWriter-适用于所有页面,可修复错误、撰写文本、摘要等。(Chrome)https://chatgptwriter.ai/7.GPTforSheets-“智能版“谷歌表格。(Chrome)https://workspace.google.com/marketplace/app/gpt_for_sheets_and_docs/6773180546548.ChatGPTforYouTube-制作YouTube视频摘要。(Chrome)https://chatgpt4youtube.com/9.ChatGPTFileUploaderExtended-允许您将文件上传到ChatGPT。(Chrome浏览器)https://chrome.google.com/webstore/detail/chatgpt-file-uploader-ext/becfinhbfclcgokjlobojlnldbfillpf10.editGPT-允许您编辑神经网络生成的文本。(Chrome、火狐、Edge)https://www.editgpt.app/#AI#tools

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人