谷歌的 1000 种语言的人工智能模型迈出关键一步

谷歌的 1000 种语言的人工智能模型迈出关键一步 去年 11 月,谷歌宣布其计划创建一个支持世界上 1000 种最常用语言的语言模型,同时还披露了其通用语音模型(USM)。周一,谷歌披露了 USM 的更多信息,称其是创建该语言模型迈出的 “关键性的第一步”。谷歌将 USM 描述为 “一个最先进的语音模型系列”,它有 20 亿个参数,经过了 1200 万小时的语音和超过 300 种语言的 280 亿个句子的训练。USM 已经被 YouTube 用来生成封闭式字幕,支持超过 100 种语言,并将作为基础来建立一个更加广泛的系统。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

相关推荐

封面图片

人工智能公司正在转向“小型”语言模型以获利

人工智能公司正在转向“小型”语言模型以获利 投入数十亿美元构建所谓的大型语言模型以推动生成式人工智能产品的人工智能公司,现在正寄望于一种新的收入增长方式:小型语言模型。苹果、微软、Meta 和谷歌最近都发布了新的人工智能模型,这些模型的“参数”较少,但功能仍然强大。 通常来说,参数的数量越多,人工智能软件的性能就越好,能处理的任务也就越复杂和微妙。本周公布的 OpenAI 的最新模型 GPT-4o 和谷歌的 Gemini 1.5 Pro,据估计都拥有超过1万亿个参数。而 Meta 正在训练其开源 Llama 模型的4000亿参数版本。 除了努力说服一些企业客户支付运行生成式人工智能产品所需的大额费用外,对数据和版权责任的担忧也阻碍了其广泛应用。这促使像 Meta 和谷歌这样的科技集团推出只有几十亿参数的小型语言模型,作为更经济、更节能、可定制的替代方案,这些模型在训练和运行时所需的电力更少,同时还能保护敏感数据。

封面图片

Roblox借助LLM语言模型发布实时人工智能聊天翻译器

Roblox借助LLM语言模型发布实时人工智能聊天翻译器 Roblox 首席技术官丹-斯特曼(Dan Sturman)说,该翻译器的目标是让Roblox用户更容易理解对方在说什么,从而让他们在相互交流时感觉更舒适。翻译器会自动翻译聊天内容,但用户可以点击图标查看原始信息。"我们知道,当用户用自己的语言与他人交谈或互动时,参与度就会提高,"Sturman 说。"我们借鉴了这一理念,并通过自动翻译消除了语言障碍。"Roblox 首先建立了一个基于转换器的大型语言模型 (LLM),该模型通过公开数据和内部数据进行训练。它将 LLM 置于一个专家混合(MoE)架构中,这是一个运行多个翻译应用程序的环境,每个应用程序都是一种语言的专家。Sturman 说,考虑到他们项目的规模,他的团队认为建立自己的模型比修改现成的 LLM 更容易。斯图尔曼说,Roblox 会监控聊天内容(出于信任和安全考虑),如果翻译不尽完美,可以得到反馈。他补充说,增加聊天翻译人工智能"不会改变我们的隐私和安全流程,违禁词语仍会被屏蔽"。Roblox 在过去几年中一直在努力吸引较为年长的用户,并一直在使用生成式人工智能模型来增强用户体验。去年,它为开发者推出了一款人工智能聊天机器人助手,还能自动将图像资产(如建筑物上的文字)翻译成用户的默认语言。斯图尔曼希望翻译模式最终能超越单纯的文本聊天翻译。"未来,我们可以使用人工智能将不合规的[违禁]词语翻译成合规词语,或者将其用于语音聊天的实时语音翻译,还有很多可能性。"其他公司也在开发人工智能翻译模型。Meta 发布了语音到文本和文本到文本的翻译器 SeamlessM4T,可处理近 100 种语言。Google的通用语音模型也能翻译约 100 种语言,并已部署在 YouTube 上翻译字幕。 ... PC版: 手机版:

封面图片

苹果利用谷歌芯片训练其人工智能模型

苹果利用谷歌芯片训练其人工智能模型 当地时间周一,苹果公司宣布了新的 Apple Intelligence 人工智能服务。但在活动结束后,苹果发布的一份技术文件的细则中明确显示出,谷歌公司已成为在人工智能领域又一个赢家。为了构建苹果的基础人工智能模型,该公司的工程师使用了自主开发的框架和一系列硬件,特别是自己的内部图形处理单元 (GPU) 和只能在谷歌云端使用的张量处理单元 (TPU) 芯片。苹果并未透露其对谷歌芯片和软件的依赖程度,以及对英伟达或其他人工智能供应商硬件的依赖程度。 谷歌已经开发 TPU 大约 10 年了,并公开讨论了可用于人工智能训练的两种第五代芯片;谷歌表示,第五代芯片的性能版本提供的性能可与英伟达 H100 人工智能芯片相媲美。通常谷歌的芯片并不直接出售给客户,只能通过谷歌云进行访问。

封面图片

谷歌推出最新的大型语言模型 Gemini 1.0

谷歌推出最新的大型语言模型 Gemini 1.0 谷歌发布最新的大型语言模型 Gemini,谷歌 CEO 皮查伊在 6 月份的 I/O 开发者大会上首次透露了该模型,现在正式向公众推出。 谷歌针对不同场景发布了三种不同尺寸的版本。例如 Google 的人工智能聊天机器人 Bard 现在由可扩展的 Gemini Pro 提供支持。 Gemini Nano 是轻量版本,旨在 Android 设备上本地离线运行,Pixel 8 Pro 成为首款搭载此模型的设备。 Gemini Ultra,它是谷歌迄今为止创建的最强大的 LLM,适用于高度复杂的任务。似乎主要是为数据中心和企业应用设计的。

封面图片

【谷歌宣布推出语言模型PaLM 2】

【谷歌宣布推出语言模型PaLM 2】 谷歌宣布推出语言模型PaLM 2,称其可在移动设备上使用。该语言模型在语言和编码上有出色的表现。谷歌CEO讨论新款AI模型Gemini,称公司正打造AI水印以抑制错误信息。谷歌高管称,聊天机器人(ChatBot)Bard的编程能力已经有所改善,Bard现在接入多种编程工具。

封面图片

OPENAI 推出面向所有用户的更快更便宜人工智能模型

OPENAI 推出面向所有用户的更快更便宜人工智能模型 OpenAI 推出了一个更快、更便宜的人工智能模型来支持其聊天机器人 ChatGPT。在周一的直播活动中,OpenAI 推出了新的大语言模型 GPT-4o。这是其已经问世一年多的 GPT-4 模型的更新版本。该模型基于来自互联网的大量数据进行训练,更擅长处理文本和音频,并且支持50种语言。新模式将面向所有用户,而不仅仅是付费用户。GPT-4o 的发布势将撼动快速发展的人工智能领域,目前 GPT-4 仍然是黄金标准。OpenAI 发布新模型也正值谷歌I/O开发者大会的前一天。谷歌是人工智能领域的早期领导者,预计将利用这次活动发布更多人工智能更新,以追赶有微软公司支持的 OpenAI。 、、

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人