谷歌 DeepMind 开发新 AI 可为视频生成配乐和对白

谷歌DeepMind开发新AI可为视频生成配乐和对白近日，Google的人工智能研究实验室DeepMind表示，它正在开发为视频生成配乐的人工智能技术。DeepMind在其官方博客上发表文章称，它认为V2A（"视频到音频"的缩写）技术是人工智能生成媒体拼图中必不可少的一部分。虽然包括DeepMind在内的许多机构已经开发出了视频生成人工智能模型，但这些模型无法在生成视频时同步生成音效。

在Telegram中查看

相关推荐

Generating audio for video：DeepMind视频音频生成技术，为无声创造同步音轨的创新工具，结合视

：DeepMind视频音频生成技术，为无声视频创造同步音轨的创新工具，结合视频像素和自然语言提示生成丰富的音景-DeepMind研发了视频到音频(V2A)技术，可以利用视频像素和文本提示生成与视频同步的丰富音轨。-V2A可与像Veo这样的视频生成模型配合使用，为视频添加戏剧性配乐、逼真音效或与视频角色和语气匹配的对话。-V2A也可以为各类传统镜头生成音轨，如档案素材、无声电影等，拓宽创作空间。-V2A支持无限生成音轨，允许定义正向和负向提示来指导生成所需的音频。-V2A使用基于扩散的方法，先编码视觉输入，然后模型逐步从随机噪声中提炼音频。这个过程同时利用视觉输入和文本提示进行指导。-为提高音频质量，训练中加入了AI生成的含音频详细描述和语音转录的注释信息。-V2A可理解原始像素，添加文本提示是可选的。它也无需人工调整生成音频与视频的对齐。-当前局限包括视频失真可影响音频质量，语音同步存在待改进之处。-DeepMind将采取负责任的方式开发和部署V2A，正在与顶级创作者合作改进技术，并加入合成识别工具SynthID以防范技术误用。-V2A正在进行安全评估，初始结果显示它是使生成视频栩栩如生的有前景技术。

人工智能公司 OpenAI 向好莱坞推荐视频生成技术Sora

人工智能公司OpenAI向好莱坞推荐视频生成技术Sora人工智能公司OpenAI在好莱坞发起了魅力攻势，与派拉蒙、环球和华纳兄弟探索等主要电影公司举行了会议，展示其视频生成技术Sora，并缓解对人工智能模型将损害电影行业的担忧。据多位知情人士透露，首席执行官萨姆•奥尔特曼和首席运营官布拉德•莱特卡普在最近几天举行的会议上向电影行业巨头的高管们做了介绍。奥尔特曼和莱特卡普展示了Sora—一个新的生成式人工智能模型，能够根据简单的文字提示生成细节栩栩如生的视频。——

上海人工智能实验室发布自动驾驶视频生成模型 GenAD

上海人工智能实验室发布自动驾驶视频生成模型GenAD上海人工智能实验室3月20日发文宣布，近日，该实验室联合香港科技大学、德国图宾根大学、香港大学推出大规模自动驾驶视频生成模型GenAD，通过预测和模拟真实世界场景，为自动驾驶技术的研究和应用提供支撑。视频生成模型GenAD进一步拓宽了自动驾驶技术的研究路径。结合此前推出的端到端自动驾驶模型UniAD、“语言+自动驾驶”全栈数据集DriveLM，上海人工智能实验室从多个技术维度对自动驾驶技术进行探索，从而多方位提升其智能性。同时，联合团队构建了包含1747小时驾驶视频的数据集OpenDV-YouTube，现已开源。

谷歌 DeepMind 推出了人工智能生成图像的水印工具

谷歌DeepMind推出了人工智能生成图像的水印工具谷歌DeepMind推出了一款新的水印工具，可以标记图像是否是由人工智能生成的。该工具名为SynthID，最初仅供Google人工智能图像生成器Imagen的用户使用，该生成器托管在GoogleCloud的机器学习平台Vertex上。用户将能够使用Imagen生成图像，然后选择是否添加水印。希望它可以帮助人们辨别人工智能生成的内容何时被冒充为真实内容，或者帮助保护版权。ViaHuaHua投稿：@ZaiHuaBot频道：@TestFlightCN

谷歌正在将听不见的水印直接嵌入到其 AI 生成的音乐中

谷歌正在将听不见的水印直接嵌入到其AI生成的音乐中使用谷歌DeepMind的AILyria模型创建的音频，例如使用YouTube的新音频生成功能制作的曲目，将带有SynthID水印，以便人们在事后识别其AI生成的来源。DeepMind在一篇博客文章中表示，水印不会被人耳察觉到，并且“不会影响聆听体验”。并补充说，即使音轨被压缩、加速或降低或者增加了额外的噪音，该水印仍然是可以被检测到的。像SynthID这样的水印工具被视为防范生成式人工智能的某些危害的重要保障。例如，拜登总统关于人工智能的行政命令呼吁制定一套由政府主导的新标准，为人工智能生成的内容添加水印。——

Google将两个AI团队Brain和DeepMind合并成一个

Google将两个AI团队Brain和DeepMind合并成一个在今天的一篇博文中，GoogleCEO桑达尔-皮查伊表示，Brain和DeepMind现在将成为一个集团，最终称为GoogleDeepMind。他表示：过去十年，他们在人工智能方面的集体成就涵盖了AlphaGo、变形金刚、word2vec、WaveNet、AlphaFold、序列到序列模型、知识蒸馏、深度强化学习，以及用于表达、训练和部署大规模ML模型的分布式系统和软件框架，如TensorFlow和JAX。在Google计算资源的支持下，将所有这些人才整合到一个专注的团队，将大大加快我们在人工智能方面的进展。DeepMind的领导人DemisHassabis现在将成为GoogleDeepMind的CEO。现在的前Google人工智能部门负责人杰夫-迪安（JeffDean）现在将成为Google的首席科学家，并向皮查伊报告。Google最近在人工智能创新方面一直在加速追赶微软的步伐。3月，它宣布了其名为Bard的聊天人工智能机器人。然而，它的推出并非没有争议，本周一份新的报告称，Google不顾一些员工的反对，包括许多人工智能伦理团队的反对，匆匆推出了Bard公开版本。一方面，Google也在开发自己的人工智能艺术和视频生成器。...PC版：https://www.cnbeta.com.tw/articles/soft/1355957.htm手机版：https://m.cnbeta.com.tw/view/1355957.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人