Stability AI发布免费音频生成工具可创作AI歌曲

StabilityAI发布免费音频生成工具可创作AI歌曲而StableAudio2.0提供了完整的三分钟音频片段，这个长度的歌曲大多数适合电台播放，而所有上传的音频必须是无版权的。据了解，与OpenAI的音频生成模型VoiceEngine只向一小部分用户开放不同，StabilityAI通过其网站免费向公众提供StableAudio，未来将很快提供API接口。StabilityAI表示，StableAudio2.0与其早期版本的一个主要区别在于，它能够创建与真实歌曲相似的歌曲结构，包括有序幕、进展和尾声。不过，已经试玩StableAudio2.0的媒体表示，这个水平的AI歌曲距离帮助用户用音乐表达想法，差距依然比较大。例如，有用户用“带有美国风格的民谣流行歌曲”（美国乡村音乐）作为提示，StableAudio生成的歌曲在某些部分听起来有山谷清晨的氛围，并且疑似加入了人声。理论上，StableAudio2.0的新功能允许用户调整生成的AI音频作品，使作品更符合用户的听歌风格。例如可以调整遵循提示程度，或设置转换所上传音频的哪一部分，用户还可以添加像人群的吼声或键盘敲击等音效。然而，这种AI歌曲最大的问题在于，让人感觉毫无灵魂。但这并不令人感到惊讶，因为这和其他大厂的AI音频问题一样。例如，如Meta和Google也一直在尝试AI音频生成，但两家公司都没有公开发布他们的模型，因为他们仍在收集开发者的反馈，来解决AI歌曲无灵魂的问题。StabilityAI在一份新闻稿中说，StableAudio是在AudioSparx的数据上训练的，后者拥有超过800，000个音频文件的库。不过，这些音频可能出现版权纠纷。StabilityAI表示，作品被纳入AudioSparx的艺术家可以选择退出，以避免他们的作品用于训练模型。其实，使用版权音频训练模型是StabilityAI的前音频副总裁EdNewton-Rex在StableAudio发布后不久就离开公司的原因之一。对于2.0版本，StabilityAI说它与AudibleMagic合作，使用其内容识别技术来追踪和阻止版权音频进入平台。总之，StableAudio2.0的确让AI歌曲比之前更像真正的歌曲，但还是没有完全达到这个目标。媒体表示，如果StableAudio2.0模型坚持添加某种人声，也许下一个版本的AI音频作品会出现更能令人分辨的语言。...PC版：https://www.cnbeta.com.tw/articles/soft/1426117.htm手机版：https://m.cnbeta.com.tw/view/1426117.htm

在Telegram中查看

相关推荐

Stability AI 发布用于生成声音和歌曲的开放式AI模型

StabilityAI发布用于生成声音和歌曲的开放式AI模型该模型使用来自免费音乐库FreeSound和免费音乐档案馆的约486,000个样本进行训练。StabilityAI公司称，该模型可用于为视频、电影和电视节目创建鼓点、乐器旋律、环境噪音和"制作元素"，也可用于"编辑"现有歌曲或将一首歌的风格（如流畅爵士乐）应用到另一首歌中。StabilityAI公司在其公司博客上发表的一篇文章中写道："此次开源发布的一个主要好处是，用户可以根据自己的自定义音频数据对模型进行微调。例如，鼓手可以在自己的鼓声录音样本上进行微调，生成新的节拍。"不过，StableAudioOpen也有其局限性。它不能生成完整的歌曲、旋律或人声，至少不能生成好的歌曲、旋律或人声。StabilityAI表示，它并没有为此进行优化，并建议希望获得这些功能的用户选择该公司的高级StableAudio服务。StableAudioOpen也不能用于商业用途，其服务条款禁止这样做。此外，它在不同音乐风格和文化或英语以外的语言描述中的表现也不尽相同，StabilityAI将这些偏差归咎于训练数据。"数据源可能缺乏多样性，所有文化在数据集中都不具有同等代表性，"StabilityAI公司在对模型的描述中写道。"模型生成的样本将反映训练数据的偏差"。稳定人工智能公司（StabilityAI）长期以来一直在努力扭转业务颓势，最近，该公司负责生成音频的副总裁埃德-牛顿-雷克斯（EdNewton-Rex）因不同意该公司关于在受版权保护的作品上训练生成人工智能模型构成"合理使用"的立场而辞职，从而引发争议。StableAudioOpen似乎试图扭转这种说法，同时不着痕迹地宣传StabilityAI的付费产品。随着包括Stability音乐生成器在内的音乐生成器越来越受欢迎，版权--以及一些生成器创建者可能滥用版权的方式--正成为人们关注的焦点。5月，代表比利-乔尔（BillyJoel）、DojaCat和LilNasX等艺术家的索尼音乐公司致函700家人工智能公司，警告不要"未经授权使用"其内容来训练音频生成器。今年3月，美国田纳西州签署了第一部旨在遏制人工智能在音乐领域滥用的法律。...PC版：https://www.cnbeta.com.tw/articles/soft/1433768.htm手机版：https://m.cnbeta.com.tw/view/1433768.htm

阿里云的AI模型EMO上线通义App，允许用户通过照片和音频生成唱歌视频

阿里云的AI模型EMO上线通义App，允许用户通过照片和音频生成唱歌视频由通义实验室研发的AI模型EMO已在通义App上线，供用户免费使用。EMO是一个音频驱动的AI肖像视频生成系统，能够根据输入的参考图像和语音音频生成具有表现力的面部表情和头部姿势视频。用户可以选择多种模板，如热门歌曲或网络热梗，上传肖像照片后，EMO将合成相应的唱歌视频。目前，App提供了80多个模板，但不支持自定义音频。EMO的主要特点包括音频驱动的视频生成、高表现力和逼真度、无缝帧过渡、身份保持、稳定的控制机制、灵活的视频时长以及跨语言和风格的适应能力。此外，EMO的官方项目主页、研究论文和GitHub链接均已提供，模型和源码将待开源。关注频道@TestFlightCN

Stability AI 推出 Stable Audio，基于文本生成最长 90 秒音频

StabilityAI推出StableAudio，基于文本生成最长90秒音频StabilityAI公司近日推出StableAudio，可以基于用户输入的文本内容，自动生成音乐或者音频。免费版StableAudio可以生成最长20秒的音乐片段，而用户在购买Pro订阅之后，可以生成最长90秒的音频内容。StabilityAI公司首席执行官表示：“我们希望音乐爱好者和创意专业人士使用StableAudio工具，帮助生成新的内容，并期待能够激发无限的创造力”。https://stability.ai/blog/stable-audio-using-ai-to-generate-music——

Stable Audio 2.0 发布：生成最长 3 分钟音频，能帮音乐家补全创意作品

StableAudio2.0发布：生成最长3分钟音频，能帮音乐家补全创意作品StabilityAI宣布推出StabilityAudio2.0，进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容，最长可以生成3分钟的音频内容。StableAudio2.0扩充了生成功能之外，还提供了音频生成音频功能，基于用户上传的一小段音频内容，扩展生成、补充相关的音频内容。例如音乐家如果在创作某段音乐的时候“卡壳”了，可以上传某段DEMO，要求StableAudio2.0补充完整歌曲，让你的各种小创意都能转换为完整的音频内容。StableAudio2.0还支持定制、微调生成后的音频内容，换句话说，如果你不喜欢音频中的某些内容，你可以根据自己的具体需求改变风格。StabilityAudio2.0不仅能生成完整的音轨，还能帮助您制作各种声音和音频效果，从打字时发出的声音到人群背景声等等。来源，频道：@kejiqu群组：@kejiquchat

Stability AI 发布草图到图像生成 AI 工具

StabilityAI发布草图到图像生成AI工具StabilityAILtd.今天推出了StableDoodle，进一步丰富了其生成式人工智能工具库。该公司表示，这是一款草图到图像工具，可以将简单的草图转换为更动态的图像，它的目标受众是从创意专业人士到业余艺术家的所有人。该公司表示，StableDoodle可供专业人士和新手使用，并且不需要熟悉人工智能工具。用户只需勾画出基本草图并上传，模型就会根据用户的选择将其转换为专业的卡通风格动画、折纸模型甚至逼真的图像。https://clipdrop.co/stable-doodle——

AI图片生成AI视频生成工具限免快手大模型团队自研打造-可灵AI#AI工具#趣站#AI#AI图片生成#AI视频生成https:/

AI图片生成AI视频生成工具限免快手大模型团队自研打造-可灵AI#AI工具#趣站#AI#AI图片生成#AI视频生成https://www.ahhhhfs.com/60059/

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人