Google 正在利用 DeepMind AI语言模型为 YouTube Shorts 生成描述，使它们更易于搜索。

Google DeepMind 和谷歌研究院首席科学家 Jeff Dean 在 X 上表示，由 Gemini Pro 模型提供支

Google DeepMind 和谷歌研究院首席科学家 Jeff Dean 在 X 上表示，由 Gemini Pro 模型提供支持的 Bard 首次亮相就在 Imsys 排行榜排名第二，超越了 GPT-4，Bard + Gemini Ultra 即将发布。 LMSYS Org 是一个开放的研究组织，由加州大学伯克利分校的学生和教师与加州大学圣地亚哥分校和卡耐基梅隆大学合作创立。 via 匿名标签: #Bard #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

【Hayo AI 支持 Google Palm】很高兴的向大家宣布，Google-PaLM2 语言模型的使用权限现已「免费」向所

【Hayo AI 支持 Google Palm】很高兴的向大家宣布，Google-PaLM2 语言模型的使用权限现已「免费」向所有 Hayo AI 用户开放，您可以在 AI Chat 界面切换到该模型。PaLM2是由Google开发的语言模型，它在高级推理任务方面表现出色，包括代码和数学运算、分类和问答、翻译和多语言能力以及自然语言生成等。此外，PaLM2还衍生出了Bard、PaLM API等模型。关于该模型的更多介绍，您可以参照：消息来源： via 匿名标签: #Hayo 频道: @GodlyNews1 投稿: @GodlyNewsBot

Google DeepMind推出Gemma模型

Google DeepMind推出Gemma模型这是一款轻量级、先进的开源模型，供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸，能够在不同的设备类型上运行，包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。性能和设计 Gemma模型在技术和基础设施组件上与Gemini共享，这使得Gemma 2B和7B在其大小范围内相比其他开放模型具有最佳性能。 Gemma模型不仅可以直接在开发者的笔记本电脑或桌面电脑上运行，而且在关键基准测试中的表现超过了更大的模型，同时遵循严格的安全和负责任输出标准。主要特点： 1.轻量级、高性能模型：Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸，提供预训练和指令调优的变体，针对其大小范围内相比其他开放模型具有最佳性能。 2.跨框架工具链支持：支持JAX、PyTorch和TensorFlow通过原生Keras 3.0进行推理和监督式微调（SFT），适应多种开发需求和环境。 3.易于入门和集成：提供准备就绪的Colab和Kaggle笔记本，以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成，方便开发者快速上手。 4.高效的运算能力：针对多个AI硬件平台上进行优化，确保在NVIDIA GPU和Google Cloud TPU上的行业领先性能。通过与NVIDIA的合作，无论是在数据中心、云端还是本地RTX AI PC上，都确保了行业领先的性能和与尖端技术的集成。 Gemma模型能够在不同的设备类型上运行，包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。这种广泛的兼容性使得模型能够适应各种应用场景和需求。 |

Google DeepMind的新AI可以为视频生成配乐和对白

Google DeepMind的新AI可以为视频生成配乐和对白 DeepMind 写道："视频生成模型正以惊人的速度发展，但目前的许多系统只能生成无声输出。V2A技术[可能]成为让生成的电影栩栩如生的一种有前途的方法"。DeepMind的V2A技术可以将配乐描述（例如"水母在水下跳动、海洋生物、海洋"）与视频配对，创造出与视频中的人物和语气相匹配的音乐、音效甚至对话，并通过DeepMind的SynthID深度防伪技术打上水印。DeepMind 表示，为 V2A 提供动力的人工智能模型（一种扩散模型）是在声音和对话文本以及视频剪辑的组合上训练出来的。DeepMind 写道："通过对视频、音频和附加注释进行训练，我们的技术学会了将特定音频事件与各种视觉场景联系起来，同时对注释或文本中提供的信息做出响应。"关于训练数据是否受版权保护，以及数据创建者是否被告知 DeepMind 的工作，目前还不得而知。人工智能驱动的声音生成工具并不新鲜。创业公司 Stability AI 上周刚刚发布了一款，ElevenLabs 在 5 月份也推出了一款。创建视频音效的模型也不新鲜。微软的一个项目可以从静止图像中生成说话和唱歌视频，Pika和GenreX等平台已经训练出模型，可以获取视频并猜测特定场景中适合的音乐或效果。但 DeepMind 声称，其 V2A 技术的独特之处在于，它可以理解视频中的原始像素，并自动将生成的声音与视频同步，还可以选择不加说明。V2A 并不完美，DeepMind 也承认这一点。由于底层模型并没有在大量存在伪像或扭曲的视频上进行过训练，因此它并不能为这些视频生成特别高质量的音频。出于这些原因，同时也为了防止滥用，DeepMind 表示不会在短期内（如果有的话）向公众发布这项技术。DeepMind 写道："为了确保我们的 V2A 技术能够对创意社区产生积极影响，我们正在收集来自顶尖创作者和电影制作人的各种观点和见解，并利用这些宝贵的反馈意见来指导我们正在进行的研究和开发工作。在考虑向更广泛的公众开放之前，我们的 V2A 技术将接受严格的安全评估和测试。"DeepMind 的 V2A 技术对于档案管理员和处理历史片段的人来说是一种特别有用的工具。但是，按照这种思路进行的生成式人工智能也有可能颠覆电影和电视行业。要想确保生成式媒体工具不会消除工作岗位，或者说，消除整个职业，就需要一些强有力的劳动保护措施。 ... PC版：手机版：

Google Gemini模型已上线Poe

Google Gemini模型已上线Poe Google Gemini模型现已上线Poe，支持上传图片，官方介绍：这是谷歌Gemini家族的多模态模型的Beta版本，该模型在模型性能和速度之间实现了平衡。该模型展现了优秀的通用能力，尤其擅长跨模态推理，并支持最大32k个tokens的上下文窗口。 via 匿名标签: #Google #Gemini #Poe 频道: @GodlyNews1 投稿: @GodlyNewsBot

Google DeepMind 用大模型解决尚未解决的数学问题