谷歌的 1000 种语言的人工智能模型迈出关键一步

谷歌的 1000 种语言的人工智能模型迈出关键一步去年 11 月，谷歌宣布其计划创建一个支持世界上 1000 种最常用语言的语言模型，同时还披露了其通用语音模型（USM）。周一，谷歌披露了 USM 的更多信息，称其是创建该语言模型迈出的 “关键性的第一步”。谷歌将 USM 描述为 “一个最先进的语音模型系列”，它有 20 亿个参数，经过了 1200 万小时的语音和超过 300 种语言的 280 亿个句子的训练。USM 已经被 YouTube 用来生成封闭式字幕，支持超过 100 种语言，并将作为基础来建立一个更加广泛的系统。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

在Telegram中查看

相关推荐

人工智能公司正在转向“小型”语言模型以获利

人工智能公司正在转向“小型”语言模型以获利投入数十亿美元构建所谓的大型语言模型以推动生成式人工智能产品的人工智能公司，现在正寄望于一种新的收入增长方式：小型语言模型。苹果、微软、Meta 和谷歌最近都发布了新的人工智能模型，这些模型的“参数”较少，但功能仍然强大。通常来说，参数的数量越多，人工智能软件的性能就越好，能处理的任务也就越复杂和微妙。本周公布的 OpenAI 的最新模型 GPT-4o 和谷歌的 Gemini 1.5 Pro，据估计都拥有超过1万亿个参数。而 Meta 正在训练其开源 Llama 模型的4000亿参数版本。除了努力说服一些企业客户支付运行生成式人工智能产品所需的大额费用外，对数据和版权责任的担忧也阻碍了其广泛应用。这促使像 Meta 和谷歌这样的科技集团推出只有几十亿参数的小型语言模型，作为更经济、更节能、可定制的替代方案，这些模型在训练和运行时所需的电力更少，同时还能保护敏感数据。

Roblox借助LLM语言模型发布实时人工智能聊天翻译器

Roblox借助LLM语言模型发布实时人工智能聊天翻译器 Roblox 首席技术官丹-斯特曼（Dan Sturman）说，该翻译器的目标是让Roblox用户更容易理解对方在说什么，从而让他们在相互交流时感觉更舒适。翻译器会自动翻译聊天内容，但用户可以点击图标查看原始信息。"我们知道，当用户用自己的语言与他人交谈或互动时，参与度就会提高，"Sturman 说。"我们借鉴了这一理念，并通过自动翻译消除了语言障碍。"Roblox 首先建立了一个基于转换器的大型语言模型 (LLM)，该模型通过公开数据和内部数据进行训练。它将 LLM 置于一个专家混合（MoE）架构中，这是一个运行多个翻译应用程序的环境，每个应用程序都是一种语言的专家。Sturman 说，考虑到他们项目的规模，他的团队认为建立自己的模型比修改现成的 LLM 更容易。斯图尔曼说，Roblox 会监控聊天内容（出于信任和安全考虑），如果翻译不尽完美，可以得到反馈。他补充说，增加聊天翻译人工智能"不会改变我们的隐私和安全流程，违禁词语仍会被屏蔽"。Roblox 在过去几年中一直在努力吸引较为年长的用户，并一直在使用生成式人工智能模型来增强用户体验。去年，它为开发者推出了一款人工智能聊天机器人助手，还能自动将图像资产（如建筑物上的文字）翻译成用户的默认语言。斯图尔曼希望翻译模式最终能超越单纯的文本聊天翻译。"未来，我们可以使用人工智能将不合规的[违禁]词语翻译成合规词语，或者将其用于语音聊天的实时语音翻译，还有很多可能性。"其他公司也在开发人工智能翻译模型。Meta 发布了语音到文本和文本到文本的翻译器 SeamlessM4T，可处理近 100 种语言。Google的通用语音模型也能翻译约 100 种语言，并已部署在 YouTube 上翻译字幕。 ... PC版：手机版：

苹果利用谷歌芯片训练其人工智能模型

苹果利用谷歌芯片训练其人工智能模型当地时间周一，苹果公司宣布了新的 Apple Intelligence 人工智能服务。但在活动结束后，苹果发布的一份技术文件的细则中明确显示出，谷歌公司已成为在人工智能领域又一个赢家。为了构建苹果的基础人工智能模型，该公司的工程师使用了自主开发的框架和一系列硬件，特别是自己的内部图形处理单元 (GPU) 和只能在谷歌云端使用的张量处理单元 (TPU) 芯片。苹果并未透露其对谷歌芯片和软件的依赖程度，以及对英伟达或其他人工智能供应商硬件的依赖程度。谷歌已经开发 TPU 大约 10 年了，并公开讨论了可用于人工智能训练的两种第五代芯片；谷歌表示，第五代芯片的性能版本提供的性能可与英伟达 H100 人工智能芯片相媲美。通常谷歌的芯片并不直接出售给客户，只能通过谷歌云进行访问。

谷歌推出最新的大型语言模型 Gemini 1.0

谷歌推出最新的大型语言模型 Gemini 1.0 谷歌发布最新的大型语言模型 Gemini，谷歌 CEO 皮查伊在 6 月份的 I/O 开发者大会上首次透露了该模型，现在正式向公众推出。谷歌针对不同场景发布了三种不同尺寸的版本。例如 Google 的人工智能聊天机器人 Bard 现在由可扩展的 Gemini Pro 提供支持。 Gemini Nano 是轻量版本，旨在 Android 设备上本地离线运行，Pixel 8 Pro 成为首款搭载此模型的设备。 Gemini Ultra，它是谷歌迄今为止创建的最强大的 LLM，适用于高度复杂的任务。似乎主要是为数据中心和企业应用设计的。

谷歌 DeepMind 推出活细胞人工智能模型

谷歌 DeepMind 推出活细胞人工智能模型谷歌的 DeepMind 推出了一个人工智能模型，用于研究生命的基本构成要素及其在细胞内的相互作用，推动了揭示疾病秘密和寻找疾病(如癌症)疗法的努力。根据周三在《自然》期刊上发表的一篇论文，最初于2018年开发的AlphaFold 3对微小生物结构外观和相互作用做出了迄今最精确的预测。同构实验室的首席人工智能官马克斯•贾德伯格表示，AlphaFold 3的能力为研究人员提供了新的机会，可以迅速识别潜在的新药分子。同构实验室与制药公司礼来和诺华有合作关系。“这使得我们的科学家和药物设计师能够在原子水平上创造和测试假设，并且在几秒钟内使用AlphaFold 3生成高度准确的结构预测。”贾德伯格说，“与可能需要数月甚至数年的实验相比，这是非常快速的。”AlphaFold 3展示了“显著提高”的预测准确性，超过了许多现有的专业工具，包括基于前两代技术的工具。研究表明，开发正确的人工智能深度学习框架，可以大大减少获取“生物相关性能”所需的数据量。

OpenAI 正式公布人工智能语言模型 GPT-4

OpenAI 正式公布人工智能语言模型 GPT-4 3月15日早间，人工智能初创公司 OpenAI 正式公布最新一代人工智能语言模型 GPT-4。它是 OpenAI 在放大深度学习方面的努力的最新里程碑，是一个大型多模态模型，可接受图像和文本输入，发出文本输出。 GPT-4 对月订阅费20美元 ChatGPT Plus 用户开放使用，同时也会纳入到微软的 Bing 聊天机器人中。相关链接： - OpenAI-GPT-4 https://openai.com/research/gpt-4 - GPT-4 Developer Livestream http://www.youtube.com/watch?v=outcGtbnMuQ - ChatGPT Plus 访问 GPT-4 https://chat.openai.com - GPT-4 API 候补名单申请 https://openai.com/waitlist/gpt-4-api - 优先获得 API 权限的方法 https://github.com/openai/evals

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人