无问芯穹夏立雪:目标将大模型算力成本压缩四个数量级,为算力市场带来增量 #抽屉IT

None

相关推荐

封面图片

Google发布Gemma 2轻量级开放模型 以极小的成本提供强大的性能

Google发布Gemma 2轻量级开放模型 以极小的成本提供强大的性能 Gemma 2 有两种规格:90 亿 (9B) 和 270 亿 (27B) 个参数。新一代模型的推理效率更高,性能也优于第一个 Gemma 模型。Google称,27B 模型的性能可与两倍于其规模的模型相媲美,而 9B 模型的性能则优于 Llama 3 8B 和其他类似规模的开源模型。未来几个月,Google计划发布参数为 2.6B 的 Gemma 2 型号,它将更适合智能手机的人工智能应用场景。新的 Gemma 2 模型可以托管在单个英伟达 A100 80GB Tensor Core GPU、英伟达 H100 Tensor Core GPU 或单个 TPU 主机上,从而降低人工智能基础架构成本。甚至可以通过Hugging Face Transformers在英伟达 RTX 或 GeForce RTX 桌面 GPU 上运行 Gemma 2。从下个月开始,Google云客户可以在Vertex AI上部署和管理 Gemma 2。开发人员现在可以在 Google AI Studio 上试用新的 Gemma 2 模型。在 Gemma 2 的训练过程中,Google对训练前的数据进行了过滤,并根据一套全面的安全指标进行了测试和评估,以识别和减少潜在的偏差和风险。Google通过 Kaggle 或 Colab 免费层免费提供 Gemma 2。学术研究人员可申请Gemma 2 学术研究计划,以获得 Google 云积分。Gemma 2 集高性能、高效率和可访问性于一身,改变了开源人工智能领域的游戏规则,致力于开放访问和负责任的人工智能开发,为人工智能的未来树立了一个积极的榜样。 ... PC版: 手机版:

封面图片

清华大学实现芯片领域重要突破!计算能效超现有芯片23个数量级

清华大学实现芯片领域重要突破!计算能效超现有芯片23个数量级 随着人工智能的蓬勃发展,智能光计算作为新兴计算模态,在后摩尔时代展现出远超硅基电子计算的性能与潜力。但最大的痛点是光的计算优势被困在不适合的电架构中,计算规模受到了限制,无法支撑急需高算力与高能效的复杂大模型智能计算。而太极光芯片的计算能效,直接超越了现有智能芯片23个数量级,可以为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。 ... PC版: 手机版:

封面图片

滚动新闻-财经网大模型热潮引发算力需求暴增 专家:算力是短板,也是发力机会| #网 ##财经 ##资讯

封面图片

各位,这两个地址的下载量和评论数为何相差了一个数量级啊乌龙了乌龙了

封面图片

算力成本迅速飙升 AI创企想挑战谷歌微软等巨头更难了

算力成本迅速飙升 AI创企想挑战谷歌微软等巨头更难了 2022年底,奥特曼领导的人工智能初创企业OpenAI发布了ChatGPT,引发了激烈的市场竞争。一大批新兴初创公司纷纷进入生成式人工智能市场,但其中大多数可能会在未来一年左右退出市场或被现有企业吸收。因为做生意的成本太高,他们根本无法独立生存下去。以Unitary的首席执行官萨沙·哈科(Sasha Haco)为例。公司业务是扫描社交媒体上的视频,寻找违规内容。相比Unitary向客户收取的费用,用OpenAI的人工智能工具扫描视频的订阅成本要高出100倍。因此,Unitary不得不自行开发人工智能模型,这本身就是一种走钢丝式的平衡行为。Unitary仍需要通过微软云服务或亚马逊网络服务(AWS)等云供应商租用罕见的人工智能芯片。哈科表示,自2020年以来,这些芯片的价格已经翻了一番,而且很难预订。她透露:“有时候我们买不到所需的东西,所以不得不支付原来10倍的价格。”所幸Unitary成功了。但哈科承认,没有哪家生成式人工智能初创公司找到了如何大规模低成本运营业务的方法,至少没法像大型科技公司那样。旧金山的另一位人工智能创始人告诉我,很多不得不租用人工智能芯片和云计算服务的同行都发现,他们赚钱的唯一途径就是“人们不使用这些产品”。创业公司Dialogue主要为受监管的行业量身定制聊天机器人。公司首席执行官罗纳德·阿什里(Ronald Ashri)说:“把算力比作电力再合适不过了。”“你不得不接入一个基础模型,这就是你的电力,你要不断消耗。在我们提供给客户的解决方案中,算力消耗是最高的一块成本。”生成式人工智能初创公司可以通过两种不同方式来构建他们的技术。例如,他们可以开发自家的OpenAIGPT-4或谷歌Gemini,但这种基础模型动辄需要投入几亿美元。他们也可以选择在现有模型的基础上开发各种功能,这种方法只需要几千万美元的投资,目前绝大多数人工智能初创公司都是这样做的。在这两种情况下,主要受益者都是云计算领域的巨头微软、亚马逊以及Alphabet旗下的谷歌,此外还有人工智能芯片制造商英伟达。芯片公司Vaire Computing首席执行官鲁道夫·罗西尼(Rodolfo Rosini)表示:“目前,所有这些初创公司都从风险投资者那里拿钱,然后再把钱交给云计算公司和英伟达。”这就是为什么英伟达的股价在去年翻了一倍多,估值接近2万亿美元的原因。人们或许会认为,大型科技公司会放眼整个人工智能初创领域,对充满活力的初创公司感兴趣,渴望从中获得新人才和新想法,但事情远没有那么简单。大多数新成立的生成式人工智能初创公司都没有太多核心的人工智能研究科学家,因为它们都依赖于更大的第三方模型。这些初创公司的大部分员工通常都是普通的软件工程师,在网罗人才方面对大科技公司来说没有太多吸引力。总部位于伦敦、专注于投资人工智能的风险投资公司Air Street Capital创始人内森·贝纳奇(Nathan Benaich)表示,Meta等大型科技公司已经在大量投资内部的人工智能项目,其中许多公司去年还大幅削减了成本。更大的绊脚石是监管。由于最近一波更严格的反垄断执法行动,大型科技公司对任何涉及重大人工智能交易的反垄断监管都持谨慎态度。因此更多收购行为也转为投资。市场研究公司Pitchbook高级分析师布伦丹·伯克(Brendan Burke)提供的数据也印证了这一点。他表示,大型科技企业对人工智能初创企业的投资在2023年达到了246亿美元以上,高于2022年的44亿美元。这一转变的目的就是避开监管审查。但伯克还透露,现在美国联邦贸易委员会(FCC)正在调查其中的一些投资行为,其中包括微软对OpenAI的上百亿美元投资以及亚马逊对Anthropic的投资,大科技企业可能还会回归到传统收购上来。风险资本投资者和初创公司对未来一年的并购交易持不同看法。最有可能发生的事情是监管层面的压力将影响大科技公司收购估值超过10亿美元的领先人工智能初创公司,比如Perplexity、Cohere和Character.ai和Inflection。相反,它们将吸引更多投资。至少目前看来,一些规模较小的长尾型企业将被收购,而其他初创公司将在成本压力下倒闭。结果就是产生一个与当下非常相似的竞争环境,最大的行业参与者继续变得更大。这是大型科技公司的胜利,也可以说是消费者的胜利,他们能继续以低廉价格获得人工智能。但是,融入人们生活方方面面的通用人工智能被少数几家公司主导时,他们就拥有了巨大的影响力。(辰辰) ... PC版: 手机版:

封面图片

大模型爆火GPU陷供应短缺,算力租赁需求兴起=====================皮衣男:赢

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人