MMLU 是特别重要的指标(如果不是最重要的话

MMLU 是特别重要的指标(如果不是最重要的话 包含了57个学科的综合知识能力 是很多模型的衍生能力的基础 Andrej Karpathy: Huge day indeed for AI and LLMs, congrats to Meta This is now the most capable LLM available directly as weights to anyone from researchers to companies. The models look quite strong, e.g. Table 4 in the paper: MMLU is good to look at, the 70B model is just below GPT-3.5. But…

相关推荐

封面图片

韩国一位研究人员声称发现了室温超导材料。最重要的是,合成方法特别简单,高中实验室都能完成,用图2评论区网友的话说,那感觉就像山顶

韩国一位研究人员声称发现了室温超导材料。最重要的是,合成方法特别简单,高中实验室都能完成,用图2评论区网友的话说,那感觉就像山顶洞人用手搓出了核弹。现在很多团队正在紧张地进行复现实验。这个发现有多重要呢?这么说吧,如果是真的,你给他发一个诺贝奖都显得对不住他。第四次工业革命的曙光似乎就在眼前 。 #抽屉IT

封面图片

许多人谈论中国崛起,但是中国现在最大的问题到底是什么?其实不是什么投资,经济数据等等,这些都很重要,但最重要的可能是中国人的精神

许多人谈论中国崛起,但是中国现在最大的问题到底是什么?其实不是什么投资,经济数据等等,这些都很重要,但最重要的可能是中国人的精神迷茫,缺乏信心,对中国将来要走向哪里的困惑?这不是所谓习近平思想所能解决的。via @RFI_Cn

封面图片

头条新闻专访泰国国防部长:军队要变强,最重要的是这个!

头条新闻专访泰国国防部长:泰国军队要变强,最重要的是这个! 11月10日,泰国亚洲大众集团(大众)有限公司CEO兼泰华新媒体协会副秘书长黄兰珺对泰国国防部长素廷进行独家采访。作为泰国军方的核心机构,国防部的地位举足轻重。而作为“平民”上任的新任国防部长,素廷仅上任两个月,面对不同的声音,也压力重大。此外,在这次采访中,素廷也向我们解读了国防部的最新动向。 素廷表示,刚上任时,担任国防部长的责任让他感到有些艰巨,但实际上,上任后并没有那么困难。军队的人员具有良好的纪律,都会遵循命令。他认为自己需要成为大家的榜样,这样才能服众。 对于目前备受泰国关注的“军队改革”问题,素廷表示,与其说是“改革军队”还不如说是“与军队共同发展”。他强调,“与军队共同发展”的目标是提高效能,适应时代的需要,增强应对多元挑战的能力。 采访中,素廷还透露了他对数字化和科技的重视。他指出,军队需要紧跟科技发展的步伐,因此国防部将推行电子化军队管理,支持军队在信息技术领域的发展,推动数字化战略的实施,以应对现代战争的复杂性。 在采访的最后,素廷强调了国防部的使命,即确保国家安全和稳定。他表示,国防部将与其他相关机构密切协作,共同应对国家面临的各种挑战。 安危事件@anwei 投稿联系 @xbok ⁉安危事件群 @tianya

封面图片

黄仁勋加州理工毕业典礼演讲:人工智能是我们这个时代最重要的技术

黄仁勋加州理工毕业典礼演讲:人工智能是我们这个时代最重要的技术 今天是无比自豪和喜悦的一天。这是你们所有人的梦想成真。但不仅仅是你们。因为你们的父母和家人为看到你们达到这一里程碑做出了无数的牺牲。所以让我们抓住这个机会,祝贺他们,感谢他们,让他们知道你爱他们。你不想忘记这一点,因为你不知道自己会在家里住多久。你今天要非常感激。作为一个骄傲的父母,我真的很喜欢我的孩子们没有搬出去。每天见到他们真是太好了。但现在他们搬出去了,这让我很难过。所以希望你们能花点时间和父母在一起。你们在这里的旅程证明了你们的性格、决心和为梦想做出牺牲的意愿。你应该感到自豪。做出牺牲、忍受痛苦和磨难的能力,这些品质在生活中是必需的。你和我有一些共同点。首先,NVIDIA 的两位首席科学家都来自加州理工学院。我今天发表演讲的原因之一是我在招聘。所以我想告诉你们,NVIDIA 是一家非常棒的公司。我是个非常好的老板,深受大家喜爱。来 NVIDIA 工作吧。你和我都对科学和工程充满热情。虽然我们相差约 40 年,但我们都处于职业生涯的巅峰。对于所有关注 NVIDIA 和我的人,你们都知道我的意思。只是对于你们来说,你们还有许多许多的巅峰要走。我只希望今天不是我的巅峰。不是巅峰。所以我会像以前一样努力工作,确保我未来还有更多的巅峰。去年我发表毕业典礼演讲,分享了几个关于 NVIDIA 旅程的故事和我们学到的可能对毕业生有价值的经验教训。我不得不承认我不喜欢给建议,尤其是对别人的孩子。所以我今天的建议将主要隐藏在一些我喜欢的故事和我享受的一些生活经历中。我相信我是当今世界上任职时间最长的科技 CEO。在这 31 年的时间里,我成功地做到了不破产、不厌倦、不被解雇。因此,我很荣幸能够享受人生的很多经历,从创建 NVIDIA 开始,从无到有,再到今天。所以我谈到了创建 CUDA的漫长道路。我们花了 20 多年时间发明的编程模型,它正在彻底改变当今的计算。我谈到了我们曾经参与的一个非常公开的、被取消的世嘉游戏机项目,以及知识诚实。我知道理查德·费曼非常关心并经常谈论这一点,知识诚实和谦逊拯救了我们的公司。以及如何撤退,战略性撤退,是我们最好的策略之一。所有这些都是我在毕业典礼上谈到的违反直觉的教训。但我鼓励毕业生参与人工智能,这是我们这个时代最重要的技术。我稍后会再谈一点,但你们都知道人工智能。很难不沉浸其中,被它包围,不被大量关于它的讨论所包围。当然,我希望你们所有人都在使用它,玩弄它,并取得一些令人惊讶的结果,有些是神奇的,有些是令人失望的,有些是令人惊讶的。但你必须享受它,你必须参与其中,因为它发展得如此之快。这是我所知道的唯一一项同时以多个指数级发展的技术。所以这项技术变化得非常非常快。所以我建议学生们奔跑,不要走路,参与人工智能革命。然而,一年后,它发生了令人难以置信的变化。所以今天,我想做的是从我的角度与你们分享我对你们即将毕业的一些重要事情的看法。这些是正在发生的非凡的事情,你们应该有一个直观的理解,因为这对你很重要,对行业也很重要,希望你们能抓住眼前的机会。计算机行业正在从基础开始转型,确切地说是从螺柱开始转型。一切都在从头开始改变。在每个层面,很快,每个行业也都将发生改变。原因很明显,因为如今计算机是最重要的知识工具。它是每个行业和每个科学领域的基础。如果我们如此深刻地改变计算机,那么当然会对每个行业产生影响。我稍后会谈到这一点。当你进入行业时,了解正在发生的事情很重要。现代计算可以追溯到 IBM System 360。那是我从中学习的架构手册。这是一本你不需要学习的架构手册。从那时起,已经提出了很多更好的文档和更好的计算机和架构描述。但 System 360 在当时非常重要。事实上,System 360 的基本思想、架构和原则至今仍主导着计算机行业。它是在我出生一年后推出的。80 年代,我是第一代 VLSI 工程师之一,他们从 Mead 和 Conway 的里程碑式教科书中学习设计芯片。我不确定这里是否还在教授这本教科书。它应该在 VLSI 系统的介绍中。基于 Carver Mead 在加州理工学院的芯片设计方法和教科书方面的开创性工作,彻底改变了 IC 设计。它使我们这一代人能够设计超巨型芯片,并最终设计出CPU。CPU带来了计算的指数级增长。性能、令人难以置信的技术进步,即所谓的摩尔定律,推动了信息技术革命。我们这一代人参与的工业革命见证了世界从未见过的大规模生产。看不见的东西的大规模生产,易于复制,软件的大规模生产。它导致了一个价值3万亿美元的产业。当我坐在你这个位置上时,IT行业还很小,而通过销售软件赚钱的想法只是幻想。然而,今天,软件是我们行业生产的最重要的商品、最重要的技术和产品创造之一。然而,Dennard缩放、晶体管缩放和指令级并行性的极限已经降低了CPU性能。而CPU性能增长放缓正发生在计算需求继续呈指数级增长的时候。如果不加以解决,计算需求和计算机能力之间呈指数级增长的差距,计算能耗和成本、通货膨胀最终将扼杀每个行业。我们可以看到计算通货膨胀的明显迹象。经过二十年的发展,NVIDIA的CUDA,NVIDIA的加速计算为我们指明了前进的道路。这就是我来这里的原因。因为行业终于意识到了加速计算的惊人有效性,而就在我们目睹了几十年后的计算通货膨胀之时。通过将耗时的算法卸载到专门用于并行处理的GPU,我们通常可以实现十倍、百倍甚至千倍的加速,从而节省资金、成本和能源。我们现在加速了从计算机图形、光线追踪(当然还有基因测序、科学计算、天文学、量子电路模拟、SQL数据处理,甚至熊猫数据科学)等应用领域。加速计算已经达到了一个临界点。这是我们对计算机行业的第一个伟大贡献。我们对社会的第一个伟大贡献。这就是我们进行加速计算的原因。它现在为我们提供了一条可持续计算的前进道路,随着计算需求的不断增长,成本将继续下降。加速计算带来的时间、成本或能源节省的百倍、千倍,肯定会在其他地方引发新的发展。直到深度学习进入我们的意识,我们才知道它是什么。一个全新的计算世界出现了。Geoffrey Hinton、Alex和Ilya 使用NVIDIA CUDA GPU训练AlexNet,并在2012年ImageNet挑战赛中获胜,震惊了计算机视觉社区。这是深度学习的重要时刻,是大爆炸,标志着人工智能革命开始的关键时刻。我们在AlexNet改变了公司之后做出的决定值得注意。我们在AlexNet改变了公司和其他一切之后做出的决定。我们看到了深度学习的潜力,并且相信,只是通过原则思维相信,通过我们自己对深度学习可扩展性的分析相信,我们相信这种方法可以学习其他有价值的功能。也许深度学习是一种通用函数学习器。有许多问题很难或不可能用基本的第一原理来表达。所以当我们看到这一点时,我们认为,这是一项我们真正需要关注的技术,因为它的局限性可能仅受模型和数据规模的限制。然而,当时也存在挑战。这是2012年,2012年刚过不久。如果不构建这些庞大的GPU集群,我们如何探索深度学习的极限?当时我们是一家相当小的公司。构建这些庞大的GPU集群可能要花费数亿美元。但如果我们不这样做,就无法保证在扩大规模后会有效。但是,没有人知道深度学习可以扩展到多远。如果我们不构建它,我们永远不会知道。这就是其... PC版: 手机版:

封面图片

此人叫做:蔡静怡 来自福建安溪蓬莱 喜欢吃赔付 骗车租 这些都不是重要的 重要的是特别喜欢钓那些有家庭男人 好事不做一件 坏事做

此人叫做:蔡静怡 来自福建安溪蓬莱 喜欢吃赔付 骗车租 这些都不是重要的 重要的是特别喜欢钓那些有家庭男人 好事不做一件 坏事做千万遍 据说之前骗了一位30多岁男人的钱大概有20多w害得人家妻离子散 舒服的是你了疼的是他和你的13 之前和其他男人一起去爬山还做了一些不可思议的事情 长这么好看干脆去应聘红楼岗位吧 现在还在找长期对象中大家注意一点吧 已经患上艾滋病了 #网友爆料 ==========================

封面图片

#网友投稿#蔡静怡 此人叫做蔡静怡,来自福建安溪蓬莱,喜欢吃赔付、骗车租,这些都不是重要的,重要的是特别喜欢钓那些有家庭男人,好

#网友投稿#蔡静怡 此人叫做蔡静怡,来自福建安溪蓬莱,喜欢吃赔付、骗车租,这些都不是重要的,重要的是特别喜欢钓那些有家庭男人,好事不做一件,坏事做千万遍,据说之前骗了一位30多岁男人的钱大概有20多w害得人家妻离子散,舒服的是你了疼的是他和你的13,之前和其他男人一起去爬山还做了一些不可思议的事情,长这么好看干脆去应聘红楼岗位吧,现在还在找长期对象中大家注意一点吧 已经患上艾滋病了 东南亚资讯一手掌握↓ 订阅频道:@baoliao111 爆料与广告联系:@wanan668

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人