微软昨天贴出了这篇150页长的报告,从各个方面(多模态生成的能力、写代码的能力、数学能力、与世界交互的能力、与人类交互的能力、差

微软昨天贴出了这篇150页长的报告,从各个方面(多模态生成的能力、写代码的能力、数学能力、与世界交互的能力、与人类交互的能力、差别对待的能力)衡量了 GPT-4 目前的能力范围,结论是: 在所有这些任务上,GPT-4 都已经很接近人类,并且大幅超越了此前的 ChatGPT。根据这些能力,我们相信:it could reasonably be viewed as an early (yet still incomplete) version of an artificial general intelligence (AGI) system. 也就是说通用人工智能 AGI 从此刻起不再是一个科幻题材了。 【网评】“在所有指标上都接近人类”就远超任何人类了

相关推荐

封面图片

哪怕我是降临派也会sign的,GPT4 获得了接近人类的能力,而99.99%的人类对此一无所知。人类需要时间,准备好迎接冲击。

哪怕我是降临派也会sign的,GPT4 获得了接近人类的能力,而99.99%的人类对此一无所知。人类需要时间,准备好迎接冲击。 云中月: 可怕! 站得更高的精英们应该是看到了什么普罗大众不知道的事情。一封公开信刚刚得到1000多名(还在持续增加中)精英的签名: 我们呼吁所有人工智能实验室立即暂停比GPT-4更强大的人工智能系统的训练至少6个月。如果不能迅速实施这种暂停,政府应该介入并实行暂停令。

封面图片

微软在最近发布的一篇论文中对 GPT-4 进行了全面评测。微软认为「鉴于 GPT-4 能力的广度和深度,我们相信它应该被合理视作

微软在最近发布的一篇论文中对 GPT-4 进行了全面评测。微软认为「鉴于 GPT-4 能力的广度和深度,我们相信它应该被合理视作一个通用人工智能(AGI)系统的早期(但仍不完整)版本。」 #抽屉IT

封面图片

文心一言数学和中文理解能力全球第几?清华最新报告出炉

文心一言数学和中文理解能力全球第几?清华最新报告出炉 在人类对齐能力评测中,文心一言4.0位居国内第一;中文理解上,文心一言4.0领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,和文心一言4.0分差超过1分。在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中;在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。在安全性评测上,国内模型文心一言4.0拿下最高分(89.1分),Claude-3仅列第四。据悉,自文心一言首发至今,用户数已突破2亿。 ... PC版: 手机版:

封面图片

马斯克用微软论文当论据起诉OpenAI:你们自己早承认AGI了

马斯克用微软论文当论据起诉OpenAI:你们自己早承认AGI了 去年论文发表时就引发不小关注,1年时间里被引次数已经高达1500次。马斯克的起诉书里写道,微软自己的科学家自己都承认了。这么看,OpenAI最新的一通回应不是啪啪自己打脸?还真不一定。这篇《Sparks of AGI》当初爆火确实不假,但其中很大一部分热度来自争议。不少人觉得它不够严谨、在炒热度,而且这篇论文没有经过同行评议,只是上传到了arxiv,结果也无法复现。所以这篇论文到底说了啥?马斯克凭啥敢拿它大做文章?论文说了啥?这篇论文主要测试了GPT-4在2022年秋季的一个早期版本。研究提出,GPT-4不仅掌握语言能力,而且能解决复杂新奇的问题,任务可以跨数学、编码、医学、法律、视觉等。在这些任务中,GPT-4的表现接近于人类水平,大大超越以往LLM性能,比如ChatGPT。由此,研究给出了关键性结论:我们认为它可以被合理地视作一个早期版本(仍不完整)的AGI。在此基础上,研究团队还进一步探讨了真正意义上的AGI应该具备哪些要素。论文全篇超过150页,分别测试了GPT-4的多模态、代码、数学、常识等能力,通过大量实例得出结论。以测试代码能力为例,GPT-4和ChatGPT会得到同样的提示词,研究人员将会对回答结果进行分析。GPT-4的一些数据结果非常值得关注。比如在零样本下,GPT-4代码能力在HumanEval上的精度达到82%。再比如在现实问题问答中,GPT-4的表现也远好于ChatGPT。研究还讨论了GPT-4基于自回归架构表现出的局限性。比如模型本身具备相应的知识能力,但是却会回答错问题,因为预测下一个token的机制使得模型不能进行“内心对话”。最后,论文作者还提出了对AGI的一系列构想。这篇论文发表于GPT-4面世的一周后,当时引发业界巨大关注。“AGI的闪现”让不少人感叹,一切都结束了。但质疑也不少,很多人觉得这个结论是不是有点夸大其词了?而且研究团队承认使用的一些测试方法不够科学严谨,他们主要是想展示GPT-4卓越的能力。不过可以肯定的是,这篇论文成功把GPT-4和AGI强关联,给GPT-4创造了更多讨论热度,也成为AGI讨论热潮的重要推力。可是谁又能想得到,它现在倒成为马斯克起诉OpenAI的关键了。马斯克到底想干啥?马斯克搞事,总是醉翁之意不在酒。去年他和千名大佬共同呼吁暂停开发AI半年,结果转头自己囤卡、开搞大模型,火速成立AI初创公司xAI。今年起诉OpenAI,核心的目的就是督促其开源。号称GPT-4是AGI也是给OpenAI上道德压力。一方面要求他们开源,另一方面提出“AGI算法不应该授权给微软”。所以有人合理怀疑,这场官司“会让一切减速”。与此同时,马斯克的Grok也还在稳步推进中,目前已发布Grok-2。值得一提的是,去年OpenAI宫斗前后,马斯克曾在一场访谈中表示,从现在(23年12月)算起,AGI还有不到3年。但往小了说,写小说和JK罗琳一样好、能发现新物理规律或发明新技术的AI,从现在算起还有不到3年。当时他还表示觉得山姆·奥特曼很复杂。目前,OpenAI方面除了否认GPT-4是AGI外,还没有更多回应。有法律专家认为,马斯克列出的一系列观点,很难当成明确的条款来执行。“诉讼可能比较牵强”,但是提出了“强有力的政策论点”。有圈内大V还觉得马斯克这么干,有点吃不到葡萄说葡萄酸。马库斯则调侃说,马斯克这么做逼得OpenAI不得不承认自己没达到AGI,但是可以找第三方来承认。比如雇我这样的人来拯救他们。 ... PC版: 手机版:

封面图片

【面对 AGI,你是降临派、拯救派还是走狗派?】一项关于暂停强人工智能开发的请愿正在进行中,目前签名已经超过千人,其中包括马斯克

【面对 AGI,你是降临派、拯救派还是走狗派?】一项关于暂停强人工智能开发的请愿正在进行中,目前签名已经超过千人,其中包括马斯克和不少业界大牛。请愿呼吁“可独立核查地”暂停训练能力强于 GPT-4 的大模型至少 6 个月,避免 AGI 研究将人类引向不可预测的巨(灭)大(亡)风险。 #抽屉IT

封面图片

清华大模型报告:文心一言中文理解、数学等多项能力全球第一

清华大模型报告:文心一言中文理解、数学等多项能力全球第一 最近,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench 大模型综合能力评测框架,正式对外发布 2024 年 3 月版《SuperBench 大模型综合能力评测报告》。评测共包含了 14 个海内外具有代表性的模型,在人类对齐能力评测中,文心一言 4.0 表现位居国内第一,其中在中文推理、中文语言等评测上,文心一言分数领先,和其他模型拉开明显差距,中文理解上,文心一言 4.0 领先优势明显,领先第二名 GLM-4 0.41 分,GPT-4 系列模型表现较差,排在中下游,并且和第一名文心一言 4.0 分差超过 1 分。在语义理解中的数学能力上,文心一言 4.0 与 Claude-3 并列全球第一; GPT-4 系列模型位列第四五,其他模型得分在 55 分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心一言 4.0 超过 GPT-4 Turbo、Claude-3 以及 GLM-4 拿下榜首。在安全性评测上,国内模型文心一言 4.0 拿下最高分(89.1 分),Claude-3 仅列第四。 来源:财经慢报频道

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人