跟一个 OpenAI 团队的朋友聊,有个感触是,大模型还是工程的问题,不是理论/算法问题或者硬件问题。

跟一个 OpenAI 团队的朋友聊,有个感触是,大模型还是工程的问题,不是理论/算法问题或者硬件问题。 对人工智能有超强的洞察和预测、对算法有精妙的认知,是理论/算法问题;有芯片,能用起来芯片,是硬件问题。 工程问题是知道明确的终点和目标,一帮人怎么用软硬件和算法解决的问题,不依赖于单纯的天才洞察、采购财力、数据规模等等。 就像发现原子能的规律、有钱建工厂、储备了很多铀-235,和真正造出原子弹,这中间的 gap 一样。有多复杂,看了《奥本海默传》就知道。 吃的还是苦功夫,有价值的还是失败率。

相关推荐

封面图片

中国工程院院士郑纬民:开展基于国产AI芯片大模型基础设施研究 要关注整体系统工程化和超算租赁

中国工程院院士郑纬民:开展基于国产AI芯片大模型基础设施研究 要关注整体系统工程化和超算租赁 在第二届开放原子开源基金会OpenHarmony技术大会,中国工程院院士郑纬民表示,要大力开展基于国产AI芯片大模型基础设施研究,要改变国产卡的生态系统不好的局面,做好整体系统工程化,关注软硬件协同设计,解决大模型基础设施的部分问题,同时他提醒,国内超级计算机租赁也能进行大模型训练。

封面图片

这是一本即将出版的高性能计算书籍,名为“适应现代硬件的算法”,作者是Sergey Slotin。

这是一本即将出版的高性能计算书籍,名为“适应现代硬件的算法”,作者是Sergey Slotin。 其目标读者包括从性能工程师和实用算法研究员到刚刚完成高级算法课程并希望学习更多实用的方法来加速程序的本科计算机科学学生,不仅仅是从O(nlogn)提升到O(nloglogn)。 ||| #电子书

封面图片

端侧模型 + 硬件会是 AI 爆发的下一个机会吗?

端侧模型 + 硬件会是 AI 爆发的下一个机会吗? 段小草的回答 我觉得端侧模型 + 硬件会是下一个机会。 首先还是澄清一下概念,端侧模型应该是相对于云端模型而言的,可以在硬件设备本地运行的模型。端侧模型不一定是开源模型,比如苹果在打算在 iPhone 上内置的 AI 模型 Apple Intelligence,就并不开源: 又或者谷歌在 Chrome 浏览器中内置的 Gemini-nano[1]: 当然,很多开源的小模型只要可以自行在消费级设备上部署,也可以看作端侧模型,比如面壁智能的可以在手机上运行的 MiniCPM。 AI 硬件,则是指广泛的消费级的硬件,而非专业的数据中心计算硬件。在我的理解上,AI 硬件大体上又可以分为 AI PC、AI 手机和其他新形态的 AI 硬件(比如一些可穿戴的、或者新交互方式的 AI 硬件)。比如这张图中所展示的[2]: 端侧模型和 AI 硬件结合在一起,我觉得主要有三方面优势: ● 隐私:隐私和数据安全显然是端侧模型最明显最直接的优势,特别是在个人信息、内部资料、数据分析方面,用户会倾向于使用可控的本地模型。 ● 成本:虽然现在很多 AI 应用都是免费的,但 API 并不免费,某种意义上讲,端侧模型激活了边缘算力,其实降低了 AI 调用的成本。 ● 普及:端侧模型 + AI 硬件的方式,有可能会给带来新的破圈的机会,让之前没有接触 AI 的普通人有机会用到 AI 工具和 AI 能力。 我甚至会觉得,第三点才是最重要的原因。我最近一段时间写 AI 话题,遇到最大的困扰就是,即便圈内已经非常火热的话题,在普通人眼中,要么是冷漠不关心,要么是质疑加嘲讽。 这里面当然有一部分人是了解过用过之后觉得空炒概念,但还有相当一部分人实际上没有自己用过,只是看了一些更反智和煽动的话语就给先入为主地觉得 AI 没有用。 对于这部分人来说,他们大概不会去主动注册或者使用 AI 应用,但如果 AI 润物无声地进入 PC、手机,提供更简洁方便的使用体验,相当于喂饭级功能,也许会大大增加 AI 的普及程度。 via 知乎热榜 (author: 段小草)

封面图片

Google Chrome部署的抗量子加密算法可能引起问题 部分网站TLS握手阶段失败

Google Chrome部署的抗量子加密算法可能引起问题 部分网站TLS握手阶段失败 X25519KYBER768 算法主要用于对抗未来的量子计算机解密,这种攻击也被称作是「现在存储稍后解密」攻击,其原理是现在存储浏览器的会话数据,未来使用性能强大的量子计算机解密数据。现阶段 TLS 加密协议使用的算法包括 ECDSA 算法是难以暴力破解的,然而未来出现的量子计算机破解这类算法应该是很容易的事情,所以部署抗量子加密算法是一种未雨绸缪的做法。Chrome 团队此前解释到,经过几个月的兼容性和性能影响实验时候,在 Chrome 124 版中推出了混合后量子 TLS 密钥交换策略,这可以保护流量免受现在存储稍后解密攻击。X25519KYBER768 算法会在 TLS 封装中添加额外的数据,有 IT 管理员认为服务器的 TLS 握手出现失败主要原因可能就是服务器不知道如何处理客户端的 ClientHello 消息中的额外数据。理论上说这并不算是 Chrome 的问题,主要还是服务器未能正确实现 TLS 以及无法正常处理封装 X25519KYBER768 算法额外数据的更大的 ClientHello 数据包,正常情况下当服务器无法处理这类数据应该会降级到经典加密才对,但现在的情况是没有降级。这个算法是在 Chromium 中添加的,因此 Microsoft Edge 等其他使用 Chromium 引擎的浏览器也存在同样的问题,目前的临时解决办法是禁用抗量子加密算法。下面是禁用方法:适用于普通客户端:转到 Chrome://flags/#enable-tls13-kyber 将抗量子加密算法禁用Chrome 策略:IT 管理员可以通过企业策略暂时禁用,路径为 Software > Policies > Google > Chrome,将 PostQuantumKeyAgreementEnabled 禁用。最后 IT 管理员还需要与服务器软件供应商联系,看看是否有支持 Kyber 的软件更新,如果支持则可以更新后再到 Chrome 中启用并进行测试。 ... PC版: 手机版:

封面图片

突破元素周期表的极限:"超重"元素挑战理论

突破元素周期表的极限:"超重"元素挑战理论 来自新西兰梅西大学(Massey University)、德国美因茨大学(University of Mainz)、法国索邦大学(Sorbonne University)和稀有同位素加速器(FRIB)的科学家们讨论了元素周期表的极限,并结合超重元素研究的最新进展对"稳定岛"的概念进行了修正。他们的工作是 2024 年 2 月《自然-物理学评论》的封面专题。除了《自然-物理评论》的专题报道外,《物理报告》还发表了一篇关于超重元素原子电子结构理论的评论。寻找超重元素什么是最重的结合原子核和最重的结合原子,它们有什么特性?质子数超过 103 个的化学元素核被称为"超重核"。它们是科学家们正在努力揭示的这些原子核的广阔未知领域的一部分。探索这一未知领域为连接广泛科学领域的发现提供了前景。目前正在建造的新的实验设施可以帮助科学家揭示原子及其原子核在电子、质子和中子数量非常大的情况下的特性。这些设施将在原子序数和质量的极限上创造出新的元素和核素。研究图片。图片来源:《自然-物理评论》2024 年 2 月刊,封面设计:Susanne Harris超重原子核的产生率极低。从这些实验中获得的物理和化学数据表明,超重原子核偏离了轻元素和同位素。这让科学家们质疑,元素周期表和核素表的边界还能扩大多少。评估是否存在"扩展稳定半岛"也是一个科学目标,在这个半岛上,超重原子核的寿命可能超过迄今为止发现的寿命极短的原子核。超重元素的理论进展与未来此外,原子结构理论的进展集中于超重元素及其预测的电子基态构型,这对元素在周期表中的位置非常重要。"由于存在巨大的静电力,超重原子中的电子以接近光速的速度运动,"论文作者之一、约翰-A-汉纳物理学特聘教授、FRIB首席科学家维特克-纳扎雷维茨(Witek Nazarewicz)说。"超重原子核中非常强的库仑力也会产生新的效应。这对原子和核理论来说是一场新的球赛"。在 FRIB,科学家们将研究如何更接近位于稳定性增强区域的超重原子核。许多超重核目前无法测量,因此有关它们的信息必须来自理论推断。FRIB 的核理论家利用高性能计算和机器学习辅助下的先进模型对超重核进行预测。研究元素周期表和超重区的核状况将产生新的想法和方法,对核物理学、原子物理学、天体物理学和化学产生影响。编译自:ScitechDaily ... PC版: 手机版:

封面图片

《【3D视觉工坊】彻底剖析激光-视觉-IMU-GPS融合SLAM算法:理论推导、代码讲解和实战》

《【3D视觉工坊】彻底剖析激光-视觉-IMU-GPS融合SLAM算法:理论推导、代码讲解和实战》 简介:本书系统解析【3D视觉工坊】彻底剖析激光-视觉-IMU-GPS融合SLAM算法:理论推导、代码讲解和实战的核心内容,并结合实用案例帮助读者加深理解。内容涵盖其发展历程、关键概念及实际应用,提供深入的知识探索路径。适合对该主题有兴趣的学习者,帮助拓宽视野并提高专业素养。 标签: #【 #【3D视 #知识 #学习 文件大小:NG 链接:https://pan.quark.cn/s/55fb4a4ad38e

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人