中国首个音乐SOTA模型「天工音乐大模型」今日公测

中国首个音乐SOTA模型「天工音乐大模型」今日公测 天工SkyMusic:中国首个音乐AIGC SOTA模型。以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。 生成的中文人声发音清晰、正宗、无异响,没有出现「百老汇式中文歌」等水土不服的情况。而且,它不仅针对普通话做了优化,粤语、成都话、北京话等方言语种也照顾到了。 它能够通过歌词控制情绪变化,并实现如颤音、歌剧、吟唱等多种歌唱技巧,使生成的音乐作品情感更加丰富且贴合情境。

相关推荐

封面图片

AI高考作文出圈 网友票选天工AI居首

AI高考作文出圈 网友票选天工AI居首 据悉,“天工AI”不仅在前不久发布了MoE混合专家天工3.0大模型,接连发布了全球首个公开技术架构的AI音乐SOTA,且近期又向社会开源了2千亿稀疏大模型。对于对普通用户,不仅具有强大的自然语言处理和生成能力,更能同时满足多种任务需求的能力,包括文案创作、知识问答、逻辑推演、数理推算、代码编程、AI画画、虚拟人聊天、情感陪伴等,俨然已经成长为一款多模态全能AI产品,这些长线的积累直接引索了天工AI在高考AI大战中备受关注,从而在此次【新课标1卷】人工智能的作文命题迅速走红。据悉,天工大模型由昆仑万维自研,是国内首个对标ChatGPT的双千亿级大语言模型,天工大模型通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。2023年11月3日,天工大模型通过备案,面向全社会开放服务。相关文章:文心一言通义千问们互评高考作文 友商们快打起来了微信回应被高考作文题Cue到:要求不超过150字 我只用10个字AI第一次高考:记得作文要龙头猪肚凤尾 ... PC版: 手机版:

封面图片

文字生成音乐AI模型Suno发布重大更新 支持中文等50种语言 输入文字提示即可生成带歌词音乐

文字生成音乐AI模型Suno发布重大更新 支持中文等50种语言 输入文字提示即可生成带歌词音乐 新版Chirp v1 已在 Discord 上线!与 v0 相比,v1 带来了一系列新功能和改进,文本到音乐 AI迎来Midjourne时刻: 现在支持 包括中文在内50 多种语言 增强了音频质量 可以选择您的音乐风格/流派 使用 [verse] 和 [chorus] 等标签可控制歌曲结构 更快的生成速度

封面图片

香港首个自主研发基础大模型初步完成

香港首个自主研发基础大模型初步完成 第二届香港国际创科展日前在香港会议展览中心开幕。香港科技大学首席副校长兼“香港生成式人工智能研发中心”(HKGAI)主任郭毅可在展会上接受记者采访时透露,由HKGAI训练、香港首个自主研发的基础大模型已初步完成。郭毅可表示,该大模型支持中文和英语,将为香港人工智能发展开辟新里程。他介绍,HKGAI在香港国际创科展上还首度向公众展示了10项自主开发的生成式人工智能服务和应用。这些人工智能研发成果包括,能实时让用户获得法律顾问、导游等各行各业信息的“专家咨询服务机器人”、将用户照片自动生成动画和合成图片的“跨越时空的相遇”应用、利用深度鉴伪技术实时分辨图片真伪的“AI火眼金睛”软件,以及辅助日常文书工作的“未来写作助手”机器人等。

封面图片

Google 发布了文本生成音乐的大模型 MusicLM

Google 发布了文本生成音乐的大模型 MusicLM 可以根据文字生成音乐,可以指定乐器、节奏、风格、播放场景。 今年我们也许能看到几款 AI 原创音乐的播放软件了。 https://google-research.github.io/seanet/musiclm/examples/

封面图片

项目Bark功能:文本音频模型

项目Bark 项目功能:文本音频模型 项目简介:Bark是由Suno创建的基于transformer的文本转音频模型。Bark能够生成高度逼真的多语言语音,以及其他音频,包括音乐、背景噪音和简单的音效。该模型还可以产生笑声、叹息和哭声等非语言交流。 Bark支持各种语言,可以自动从输入文本中确定语言。当输入的文本是混合编码时,Bark会尝试使用相应语言的本地口音。目前英语的质量最好 项目地址:点击直达 排队申请:点击直达

封面图片

AI取代周杰伦?人均音乐制作人的时代是否已然来临

AI取代周杰伦?人均音乐制作人的时代是否已然来临 有网友评论表示:“《We Go!》有点像专业的作品了”,也有其他网友说:“《We Go!》听上去好像没有感情”。虽然对于AI音乐,网友们褒贬不一,但如果AI能直接生成专业作品,而且受到大多数听众的喜爱,是不是意味着AI将改变音乐界的专业分工甚至促使整个音乐行业革新呢?视频大模型后,音乐大模型来了日前,音乐大模型Suno发布V3,并且开放给个人用户,随即便引爆了互联网。其实,Suno已经发布了一段时间,但这一次将免费用户的音乐生成时长增加到2分钟,并且有更丰富的定制选项,比如可以定制纯器乐作品。这一举动激发了网友们的使用热情,大量AI生成歌曲蜂拥而至。此次,更新的Suno V3模型的亮点之一是其对用户提供的歌词的高效处理能力。用户仅提供歌词,V3便能生成符合多种曲风、流派的歌曲,甚至可定制AI歌手的音色。这种高度定制化和个性化,不仅满足用户基本需求,还激发创作灵感,推动音乐创作的边界。其中,有一首名为《We Go!》的中文歌在3月24日发布之后,很快就冲上了热度榜第一。我们听到《We Go!》总体感受是,这首歌有着典型的重金属音乐特征和结构,且完整度相当高,因此被不少国外网友分享并热议。而且,有国内用户用很多耳熟能详的歌词作为基础,让Suno重新生成曲调,“重制”了《让我们荡起双桨》《声声慢》《以父之名》《夜曲》《七里香》等经典曲目,生成效果令人惊艳。过去一年,我们看到,生成式AI在产生文本、图像甚至视频方面取得了重大进展,特别是OpenAI的新Sora工具,带起了全民文生视频的热潮。但是音频,尤其是音乐方面却一直落后。除了Suno, 2023年以来,越来越多的AI生成音乐类产品出现。去年8月,Meta以AudioCraft名义发布了三款AI音乐生成研究工具;Google子公司DeepMind也与Youtube联合推出了人工智能音乐生成模型Lyria、23年11月推出了Dream Track,它可以按照选定的著名歌手的风格创作原创歌曲,12月14日,Google又推出AI音乐创作工具“MusicFX”,仅需几句话用户即可生成原创的音乐作品。但这些看似更大厂商推出的软件都是不温不火,其实是有理由的。有业内人士分析认为,相比图文和视频,音乐的机器学习要复杂得多,AI需要理解和模拟复杂的音乐结构、和声、旋律以及节奏等元素,这在技术上是非常复杂的。音乐不仅仅是技术的堆砌,它还包含了深厚的文化背景和个人情感的表达。而且,人声和音乐的结合,也是一个难点。值得注意的是,Suno V3对于著作权的归属问题在官网做了详尽的描述与规定,同时为了防止模型作品被滥用,还开发了专有的无声水印技术,用以检测歌曲是否是使用Suno创作。Suno官方称,V4已经在开发中,并将在未来推出一些全新的功能。那么,很多人都在好奇,到底是一个什么样的团队创造出这个爆款的软件呢?其实,这又是一个天才团队成立的故事。12人团队给音乐圈的惊喜Suno AI成立于2022年,其创始团队位于麻省剑桥市。在创立Suno之前,他们一起在剑桥的一家公司名叫Kensho Technologies的公司工作,据了解,Suno创业团队目前仅12人。创始人是Mikey Shulman,博士毕业于哈佛大学物理学专业。他是创始团队在Kensho时的机器学习团队主管,在创立Suno之前,他还是一名MIT斯隆管理学院的兼职讲师。其他3位创始人分别是Shulman、Freyberg、Georg Kucsko和Martin Camacho,他们都是机器学习专家,还有在 Tiktok、Meta 等互联网公司的从业经验。在Kensho工作期间,四人的主要任务是开发一种AI语音转录技术,用来转录上市公司的财报电话会议。后来他们发现,AI音频领域好像还没有现象级的产品出现,于是他们开始创业。他们先做了个文本转语音程序Bark。但当他们对早期Bark用户进行调查时,发现用户真正想要的是音乐生成工具。于是他们才找到了真正适合自己的方向。2023年7月他们推出了音频生成模型增加人声音乐功能;9月,更新后的模型,可以让用户可以在Suno的Discord频道体验文字生成音乐;12月20日推出了Suno网页版本应用。这次推出的第一款可制作广播级的音乐生成模型V3,一经发布就在网上爆火。别让AI替代的创作元宇宙新声也听到很多关于AI用途的声音,有人质疑AI的方向问题,他们希望机器人帮人类扫地、洗碗,是因为人类要去写诗、画画;现在是AI都去写诗和画画了,而人类还在扫地、洗碗。那么,研究AI写诗、画画、做音乐的意义是什么?我们认为,现在也已经有扫地机器人、洗碗机等工具,机械类的工作早就有机器可以替代。而现在AI应该深入各个领域去扩散思维,替代或者辅助人们来做更多的工作,如果,AI连艺术都能做,做那些机械类的工作岂不是更容易?有业内人士认为,随着数据库的更新、技术的迭代,AI将在未来10年内’干掉’作曲人。其实,AI显然为业内人士敲响了警钟,但即便AI技术再升级,永远有1%是无法被替代的,这1%的来源也正是音乐行业的核心部分,那就是创造力。而且,AI合成音乐可能会将音乐创作过度商业化,这完全本末倒置了。他认为音乐创作很多时候是主观的、能动的、感性的,是自己的生活记录和情感抒发。元宇宙新声认为,机器与人之间的最大区别往往就在于人文情怀,再好的词曲也比不上“周杰伦”“林俊杰”三个字在听众心中的存在意义,再无瑕的人声演绎也难以与明星演唱会现场的万人大合唱相比较。写在最后我们看到,Suno冲击的不仅是行业分工,还有音乐流媒体。在早前发布的宣传片里,Suno勾勒了这样一个未来的音乐场景:用户不再使用流媒体,而是想听歌的时候,直接用Suno生成。但我们担心的是,随着AI的发展,AI音乐泛滥,用户还能不能在更多的歌曲中找到符合自己审美的音乐和听音乐的初心。如果,可以克服这样的困难,大模型与音乐内容、创作者的结合或许将成就新一代音乐,同时带来行业的变革。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人