尝试了一下 Suno,会有直观的冲击。

尝试了一下Suno,会有直观的冲击。这个《低语的竹子》从头到尾都是AI的作品。ChatGPT完成脚本(prompt),Suno创作词曲,Midjourney创作背景图,DeepL翻译中文歌词。当然,想法还是需要自己提供一些「冷启动」。这是AI在继续让创作门槛降低。未来的创作者的工具会极大丰富,而需要花费时间掌握的多数「技术能力」会迅速贬值。一人杂志(公众号/播客)、一人电视台(直播间)刚刚成真,一人乐队、一人电影、一人游戏已在眼前。

相关推荐

封面图片

SUNO V3 有点像 Midjourney 的 V3,GPT 的 3.0 版本,给音乐产业带来了很多变化的可能:

SUNOV3有点像Midjourney的V3,GPT的3.0版本,给音乐产业带来了很多变化的可能:1)UGC音乐平台:音乐是创作者头部效应最明显的产业之一,在pre-AI时代,普通人拍的视频可能是具备被消费价值的,因为拍摄的对象可能很有意思,但是普通人创作的音乐或者翻唱的歌是完全达不到及格线的。所以之前做音乐UGC平台的公司基本都没有起来,音乐版权拥有者赚钱很容易,天下苦三大久已。但现在SUNO为代表的AI作曲工具,有点像摄影的发展从一开始要用胶片拍摄和冲洗,变成了数码相机,再变成了手机摄像头。当大量的人突然可以按照自己的想法和歌词生成达到及格线的音乐时,这里面就可能会诞生新的音乐家和大作。于此同时,SUNO也是AIGC应用里面难得的可以形成「内容生产者+消费者闭环」的平台。妙鸭和Midjourney的问题都在于AI产生的内容在本平台上的再消费价值不大。一个人用MJ生成的图片一般来说只对这个生产者本人有价值,但用SUNO生成的音乐不一定。我发现我很自然地就在SUNO上开始听推荐的音乐了,有的还真的有点意思:例子:https://app.suno.ai/song/5c16c93d-0c60-4be1-a65f-c0fafe001a1b这个应该是用了自定义歌词,但听起来真挺可以的。2)个性化音乐:70分的音乐单独听可能价值不大,因为我总可以去听95分的佳作,实际上只有音乐存在「单曲循环」的场景,我们会不断的听最好的歌。但70分的音乐配合合适的场景可能是有用的,尤其是可以随时生成个性化歌词音乐的时候。例子:https://www.bilibili.com/video/BV1Xu4y1n7Jd用AI产生自定义音乐点评电影。3)背景音乐生成器:有一些场景是70分音乐也OK的场景,并且感觉器乐会更容易,因为音乐底层和数学其实是很像的?想起小时候有个假乐队叫班得瑞,就是台湾一个乐队公司把很多风格类似的器乐包装在一起出专辑,而SUNO现在生成的钢琴曲质量已经不错了,感觉凑合可以作为很多咖啡厅的背景声。例子:https://app.suno.ai/song/a0f12ca5-0833-49ce-97f1-cd6094510f2c4)音乐人的Copilot:就跟我们不能现在要求Chatgpt直接写出一部小说一样,对SUNO的要求也不应该是直接生成一首完整的歌,而是作为再创作的起点。SUNO可以首先作为音乐创作者的Copilot。这个地方看起来难点是如何生成专业创作者需要的工程文件(和3D生成遇到的问题类似),分轨的原始音乐素材也是现在最难获得的训练数据。

封面图片

DeepSeek-V2 这个模型确实很强,尝试了一下我日常的任务都能胜任。

DeepSeek-V2这个模型确实很强,尝试了一下我日常的任务都能胜任。主要是太便宜了,开放平台送的十块钱总共有500万Token。冲个五十块钱估计够我用好几年。模型为MOE架构总参数236B激活参数21B,开源版本上下文128K,API上下文32K。在8卡H800机器上,输出吞吐量超过每秒5万Token。模型权重下载:https://huggingface.co/deepseek-ai

封面图片

继续玩ChatGPT的代码解释器上瘾了,尝试了一下数据分析功能,卧槽,真的牛皮。

继续玩ChatGPT的代码解释器上瘾了,尝试了一下数据分析功能,卧槽,真的牛皮。我的AIGC周刊是在竹白上更新的,而竹白的用户订阅数据是可以导出的,我就想看看能不能从里面找到一些比较有用的数据和规律。下面是具体的分析过程:导出的文件都是json格式的,刚开始我把订阅用户的邮箱文件发给它,想看一下订阅用户中不同类型的邮箱的比例,显然他完成的很好因为这个json文件里只有邮箱地址。从结果来看跟预期的差不多Gmail占了40%第二大的就是QQ邮箱占18%。之后就是比较复杂的挑战了,我把包含所有用户的json文件发了一下,这个json的格式就比较复杂了。然后我先让它分析了一下订阅用户订阅渠道的数量和比例,微信订阅还是多,大概是邮箱的两倍多一点。还有2%的同学两个渠道都订阅了,可能是怕我跑了。哈哈最后是比较深入的分析,我让他分析了一下最近一个月订阅用户增长的趋势。这里有一个比较有意思的事情是,由于不能联网它不知道现在的时间,我让他分析最近一个月的数据,他给了我22年12月的。我补充了现在的日期以后就没问题了。这里我原本因为会在周一的用户增长比较多,没想到是周三和周四。神奇。之后我又想看一下最近半年每个月的趋势,这里可能是数据量有点大,它失败重试了好几次才搞定。这里最后的数据跟我想的差不多,基本上跟AI相关热度的趋势是一样的,三月份最高,然后逐渐降低。最近差不多见底了。

封面图片

我尝试了一下自然语言编程工具Dify,前几天在我的周刊里推荐过。

我尝试了一下自然语言编程工具Dify,前几天在我的周刊里推荐过。花了20分钟用这个应用写了一个东西,非常惊艳,完全没有写代码。如果没有Dify的话,我可能需要很长时间才能搞定它。这个应用可以根据简短主题生成Midjourney提示词,效果很好。接下来我会分享一些创建过程,让大家更加了解这个平台。你可以在这里访问Dify:https://dify.ai/教程的详细内容也可以在这里查看:https://mp.weixin.qq.com/s/4hGe2hoPmMkl2IDSILDwdA正式开始我们的教程。Dify可以选择两种应用一种是对话型应用类似于chatgpt那种,另一种是文本生成类应用没有多轮对话的机制点击按钮直接生成文本内容。我们要创建的Midjoureny提示词机器人,所以我们选择文本生成应用就行。我们输入名称创建完成之后看到的页面就是我们的看板页面里面有一些数据监控和应用设置。我们先点击左侧的提示词编排,这里就是主要的工作页面了。这个页面左侧是提示词设置和一些其他功能,右侧可以实时预览和使用你创建的内容。前缀提示词就是用户每次输入内容后触发的提示词了,可以理解为每次GPT都会按照你的前缀提示词内容去处理用户输入的信息。可以看一下我的前缀提示词结构,主要有两部分前面是中文写的让GPT按照下面英文的结构输出照片的描述。英文的结构就是生成提示词的模板了,主要意思是【主题彩色照片,错综复杂的图案,鲜明的对比,环境描述,相机型号,与输入内容相关的镜头焦距描述,与输入内容相关的构图描述,四位摄影师的名字】这个就是提示词的主要内容了。理论上你现在保存到右边预览区域输入你想生成的主题就能生成对应提示词了。那可能有人注意到了后面的{{proportion}}和{{version}}是什么呢,可以看到我右边需要用户选择图像比例和模型版本这两个变量就是用来传递用户选择的信息的。我们看一下如何设置。我们的功能是把用户选择的信息填到提示词的最后方便用户直接复制不用重新填写和记忆这些命令,这里就要用到下面的变量功能。变量的作用就是把用户表单填写或者选择的内容动态的带入到提示词里面。比如我这里创建了两个变量一个代表图像比例一个代表模型版本。点击添加按钮创建变量。

封面图片

整理一下国内最近 AI 影像比赛:

整理一下国内最近AI影像比赛:1.猫眼电影“造梦师”AI短视频大赛主题:造梦师进入TA人的梦里截止:5.4奖品:猫眼电影动画项目合作等2.新世相AI影像创作计划主题:爱恨情仇截止:5.6奖品:阿那亚线下展览3.V中文版&故事接龙社群主题:法国主题AI短片影像截止:5.10奖品:5.24-5.26在成都当代影像馆展出4.上影全球AI电影马拉松大赛主题:神话/科幻+IP截止:5.19奖品:影院展映5.歌德学院AI生成短片竞赛主题:自由意志截止:5.31奖品:中德往返机票、线上展示6.Bilibilix央视AI影像征集大赛主题:奇幻/科幻/创想截止:6.28奖品:每一赛道有10W奖金池,最高5W最近比赛真的好多哇,还有三个我知道有的但还没宣的,等正式发布了添加进来。春末夏初是创作的季节!

封面图片

LayerDiffusion 这个可以直接生成透明背景图片的项目已经可以在forge的扩展上使用了,试了一下确实非常牛批。#ai

LayerDiffusion这个可以直接生成透明背景图片的项目已经可以在forge的扩展上使用了,试了一下确实非常牛批。不仅支持直接生成透明的图片元素,还支持在已有图片上生成跟环境融合的透明图片,这个就可以做很多事情了。不得不怀疑老哥只支持forge是为了推广他的项目,哈哈forge是WebUI的一个分支操作逻辑和交互完全跟WebUI一样不过进行了一些底层修改,让生成速度更快,插件运行时会自动下载模型。你可以在这里下载LayerDiffusion扩展:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人