快手可灵 AI 网页端正式上线,限时免费,集成文生图、文生视频相关能力。此外,可灵 AI 基础模型再度升级,推出更加清晰的高画质

快手可灵 AI 网页端正式上线,限时免费,集成文生图、文生视频相关能力。此外,可灵 AI 基础模型再度升级,推出更加清晰的高画质版,以及首尾帧控制、镜头控制等全新编辑能力,同时,创作者单次生成的文生视频时长增加至 10 秒,在对用户开放使用的产品中实现最长时长。(澎湃)

相关推荐

封面图片

安替认为快手的文生视频应用可灵值得一试。

安替认为快手的文生视频应用可灵值得一试。 Michael Anti: 刚才在朋友们的帮助下,我拿到了可灵AI的测试账号。做了几个,好爽啊,每个提示,几分钟就搞定。感觉大家也别等sora这种又贵又费时的工业级AI了,先可灵免费用起来。快手这次真是让人惊喜。 via

封面图片

快手发布国内首个效果对标Sora的视频生成大模型“可灵”,现已开放邀测

快手发布国内首个效果对标Sora的视频生成大模型“可灵”,现已开放邀测 近日,快手“可灵”视频生成大模型官网正式上线。据介绍,可灵大模型为快手AI团队自研,基于快手在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。可灵大模型不仅具备强大的概念组合能力和想象力,还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。目前,可灵大模型已在快影App开放邀测体验。(36氪) 标签: #快手 #Sora #可灵 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

AI开始对音乐人下手了

AI开始对音乐人下手了 "我和团队已经在想办法改行了。"音乐人Ferry对第一财经记者开了个玩笑。Ferry毕业于伯克利音乐学院,此前是香港交响乐团作曲家,现在是上海音乐工作室的音乐总监,主要工作内容是音乐制作和游戏配乐。他说,自己做了15年音乐,经历了很多不同风格的洗礼,有了很多经验。但对Suno而言,只是几秒钟的事情。如果换算一下,Suno写十首Demo的时间只需5分钟,换音乐人可能要一个月。他预计,"AI音乐对音乐制作人是毁灭性的(打击),发展成熟后,在音乐制作这一块会取代90%的音乐人,也会有大量音乐人失业。"但AI并非全能。音乐的精髓远超过技术的堆砌和算法的编织,它是情感的表达和创造力的展现。这种源于内心深处的情感和独特的创造力,是人工智能目前难以触及和全然复制的。第一财经记者采访的多名音乐人也认为,目前AI仍然是一个需要人类引导的工具,代替不了10%的顶尖音乐人。记者实测:几十秒至1分钟内生成流畅歌曲Suno水平到底如何?记者在Suno AI网站进行了实测。记者输入的歌曲描述为:"创作一首关于旅行的歌曲,曲风明快,由吉他、钢琴、小提琴、鼓演奏。表达旅行的轻松愉快,以及对人生的感悟"。几十秒后Suno就生成了歌曲并可播放,该歌曲标注的关键词是"piano(钢琴)、violin(小提琴)、folk(民间音乐)、joyful(快乐的)、guitar(吉他)、drums(鼓)"。该歌曲使用钢琴和鼓伴奏,但记者并未听到小提琴的声音,歌词则出现了钢琴、小提琴、吉他、鼓点的字眼。歌曲时长1分40秒,由两段主歌和一段副歌组成,女声歌唱,流行乐风格,十分流畅,但歌词还是有些许生硬。记者随后让通义千问生成一段关于"失恋后自己旅行并表述旅行感受和人生思考"的歌词,将歌词输入Suno,音乐风格输入"粤语,流行,哀伤",大约一分钟生成歌曲并可播放。此次生成的歌曲曲风依然流畅,但仍是用普通话演唱。记者将提示词改为英语,并输入《再别康桥》作为歌词,这次AI终于在前几句用粤语歌唱,但马上又变成了普通话演唱。第一财经记者实测Suno这三次Suno生成的歌曲都很流畅,可以发现它对流行、摇滚风格的把握也比较精准,但记者可以感受到Suno对于中文的理解不如英语,Suno对提示词的理解也有限,要生成方言歌曲不太顺利。Suno自己生成的歌词有些许生硬,结合其他大语言模型生成歌词效果会更好。在Suno的"每日推荐"榜单中,有更多生成效果更好的歌曲,歌词包含各国语言。记者点进去试听,发现排名前列的歌曲人声都非常清晰,歌曲流畅且风格鲜明,歌曲自成一体。中文歌曲中,儿歌《让我们荡起双桨》被"改"成重金属风格,《春天在哪里》"改"成爵士蓝调曲风,《蜀道难》变成摇滚风,宋词《声声慢·寻寻觅觅》则以古风呈现。还有网友做了AI工具"全家桶",用OpenAI创作歌词,Midjourney生图、Runway让其动起来,最后再让Suno配乐。不过近日,在运营成本压力之下,Suno调整了价格体系。记者看到,目前在Suno AI网站上,注册新账号每天可获50个积分,共可用于10次生成歌曲(50 credits renew daily /10 songs),随后要继续使用就要充值,1个月内生成500首歌曲需要8美元,每个月内生成2000首歌需要24美元。Suno AI渗透音乐圈Roro 去年刚毕业,目前在一家唱片公司当练习生,她向记者感慨,最近Suno太火了,身边好多音乐人朋友都在用这个软件。"刚接触这个软件时觉得‘哇’太吓人了,因为大家只要在这个软件点点我们想要的要求,作词、作曲、编曲就能马上出来,而这些我们创作人是需要花很漫长的时间去学习、累积练习才能做出来。""这个地球上任何的风格Suno都能实现, 在这个意义上,现实中被认为天花板的音乐人,也会比不过Suno。"在Suno半年前开始公测的时候,Ferry就已经开始体验和使用, 在强大的生成能力背后,他认为,Suno或许学习了几十亿首曲子这样的数据库。作为伯克利音乐学院的学生,王钰初次接触到AI音乐生成工具则是在2024年初受同学推荐。"一开始大家觉得比较好玩,但其实也不是非常新奇,人工智能在图像生成领域之前就有一些软件出来,我们之前也预测,AI用于音乐创作是迟早的事。用了几次之后发现,对我们日常编曲和创作灵感的激发都有帮助,所以一直在使用来协助创作。"王钰告诉记者,虽然他所在专业的教授禁止学生用AI做作业,但允许利用AI进行辅助作曲。除Suno外,记者了解到,AI对于音乐领域的其他工具也正在渗透,音乐创作者越来越难以忽视AI带来的改变。王钰告诉记者,现在有很多编曲混音软件正向半AI模式发展。"比如一些做音乐母带的软件,你可以直接告诉软件需要什么风格和场景,软件会自动帮你做参数,本来这是混音师的工作,但现在看下来,人工智能生成的效果确实不错。""此外,AI音乐制作软件更大的作用在于可以生成音乐最终的样本,比如当作者写完某段音乐,希望做一个预混,模拟一下做完所有后期之后的录音室效果。这个时候就可以套一个AI插件,让AI帮助模拟各种风格效果,就类似修图软件可以套滤镜一样。"王钰称。AI此前在美术领域,已替代了部分人类画师,在音乐领域会不会重现这一过程?不少音乐界人士对第一财经表示,目前AI音乐工具可以取代简单的音乐创作。听到Suno AI创作的音乐后,就匠音乐创始人张昭轶对第一财经记者评价,"完成度很高,质量也很好。"他认为,那些功能性音乐和快餐类音乐,可以被AI低成本量产。他提到,国内做同质化歌曲的人不少,尤其是一些所谓资本加持下的音乐工作室,甚至"抄袭"量产再赛跑,这些"简单算法"的词曲,很容易被AI取代,因为AI厉害之处在于词曲能够根据诉求,大量提供水准不低的作品。熟悉娱乐经纪和音乐版权领域的袁原告诉记者,据她所知,Suno的上一个版本在行业里已经有人用于商业场景如发布会上的使用。她对记者解释道,因为版权原因,过去行业做垫乐、配乐的价格不比做音乐便宜,还有各种情绪上的要求,但又没有足够的商业价值,很难有优秀的音乐人专门为此创作。"Suno3.0版本我听到的片段,用在场景音乐上已经完全没有问题。"袁原还透露,围绕Suno3.0的商业化,业内已经有音乐公司考虑利用AI创作、真人演唱的方式来进行音乐直播了。音乐制作人、钢琴老师余亮(化名)最近也在与同行交流AI工具的影响。"很多独立音乐人认为低端编曲作曲已经没有生存空间了。Suno创作的作品虽然音质不怎么样,但只要向Suno投入的数据量足够多,创意还是不错的,可以满足低层次编曲作曲的需要。音乐人只要参考Suno的创意,再加入一些自己的想法,重新编曲混音,就可以完成部分低水平商业作品创作。"余亮解释,低端作曲编曲的范围包括为作词爱好者提供编曲服务、为企业团建合唱编曲、为学校创作校歌、为大中小学艺术节比赛编曲等。在电商和社交平台上,这种编曲单很多,一单的价格可低至100元左右,这是编曲者的收入来源之一。Roro认为,AI对于一部分音乐人会有一定威胁。如果作品不够好,AI完全可以取代。"你写的东西AI也能写,那作为客户,一样的作品我为什么要花更多钱让你写?"Roro觉得市场会淘汰一些粗制滥造的音乐人和音乐作品,但会留下能写出好的作品的音乐人。王钰则表示,类似Suno的AI音乐制作软件可以替代一些需求下的人工音乐创作,"比如广告配乐,游戏配乐,还有像抖音配乐,网红热曲等商业性、功能性较强的音乐在未来都有可能利用AI直接生成。"与音乐相关的影视界... PC版: 手机版:

封面图片

苹果的AI终于掏出来了 但说实话一点也不炸裂

苹果的AI终于掏出来了 但说实话一点也不炸裂 加上穿插在 iOS 、 iPadOS 等系统中提到的 AI 功能,苹果把几乎一半的时间都给了 AI 。先说系统更新吧,这次除了 iOS 18 、 iPadOS 18 、 macOS Sequoia 和 watchOS 11 等常客之外,还有仅问世四个月就火速更新的 visionOS 2 。然后就是大家都在期待的 AI 了,苹果官方还玩了个 “ 谐音梗 ” ,叫做 Apple Intelligence ,简称 AI ……直接从概念层面截胡对手:别人的 AI 是 “ 人工智能 ” ( Artificial Intelligence ) ,苹果的 AI 是 “ 苹果智能 ” ( Apple Intelligence ) 。咱也就说,Google下次给自家 AI 命名成 AGI ( Alphabet Google Intelligence ) 得了。综合之前不少外媒爆料说,苹果会在 AI 方面发布一些很有意思的新功能,把我们整个编辑部的预期都拉的很高。所以今年,我们编辑部的二狗也是飞到了美国苹果总部现场观看这场发布会,我们也是通宵给大家写完了这条推文。这次的更新内容属实不少,有新鲜好活也有咱们国内厂商早就玩过的东西,首先我们打算跟大家聊聊 Apple Intelligence ,看看苹果理解的 AI 到底是啥样的。在前段时间铺天盖地的宣传里,所有人都知道了这次 WWDC 的科技与狠活会是苹果的 AI ,所以在例行公事介绍完其它系统更新之后,苹果专门在压轴环节,留给了 Apple Intelligence 足足接近 40 分钟时间。冲着各种爆料、新闻,再加上 OpenAI CEO 奥特曼还被发现早早到了现场,所有人几乎都以为苹果和 OpenAI 签订了恶魔的契约,整个苹果 AI 可能都是 OpenAI 的形状。但让人出乎意料的是,他们只是给了 ChatGPT 一个入口,只要你不点开就可以当它不存在。这次苹果 AI 有设备端和云端两套模型,大部分用户需求都靠部署在本地设备中的模型解决。在生态方面, Apple Intelligence 带来变化最大的就是 Siri 。全新版本的 Siri 更骚了,也更强了。更骚在于 Siri 调整了一波设计,包括换了新皮肤、互动特效也加上了光晕特效,甚至还支持文字对话了。更强则是 Siri 开始 “ 长脑子 ” 了,不再像个智障,能理解上下文了、能处理复杂问题。另外, Siri 还长出来眼睛,有了 “ 极为领先 ” 的识屏功能加持,可以理解屏幕上的文字、图片等等。根据苹果的说法,有了识屏功能, Siri 能够越来越熟悉你,去理解你的交际圈,成为你的私人小管家。而在这些能力的加持下, Siri 成为了 AI 时代下苹果应用间的连接线。它可以深度融入系统中,然后串联起了各个应用,高效地完成各种任务。比如你可以直接从桌面要求 Siri 找到某些特定的图片文件,然后直接和 Siri 说修修照片就能直接搞定。而应用间的协同也完全不在话下,比如你在照片应用里直接呼出 Siri ,让某张照片添加到备忘录里,一气呵成。新 Siri 已经能实现数百种 App 内以及跨 App 的新操作,未来更多的第三方应用,也能用上 Siri 和 Apple Intelligence 来实现类似的丝滑联动。除了全新的 Siri ,有了 Apple Intelligence 后苹果的生态协同也能再次提升,比如系统能自动识别、汇总推送通知的内容,并且按照它理解的重要程度,来个 1 、 2 、 3 排序,对于我这种强迫症患者实在是世纪福音。不过有个小疑问,咱先姑且认为它真能理解人类对 “ 重要程度 ” 判断,可即便如此,会不会有人根据这些 AI 的判断习惯,在广告、营销推送里进行关键词优化呢?就跟如今微信列表满屏幕的 AAA 房产中介 *** 一样,存在被人为攻陷的风险。而刨去协同上的优势, Apple Intelligence 在常规的 AI 应用和能力上,多少就有点乏味了。比如在文字写作方面, Apple Intelligence 可以在任何场景下,帮你检查文字错别字、帮你重写消息、邮件、文档,也可以一键总结文字甚至直接把文字做成表格等格式。说实话,这些功能在 2024 年的今天,已经有无数 AI 工具能实现了,实在是有些干巴。反而让大家爽到的是,如今苹果用户打电话也能录音了 ( 被录音方会收到通知 ) ,并且支持一键转成文字。而在图片方面,苹果推出了 Image Playground ,大家可以直接在几秒里进行文生图,甚至可以在 Notes 应用里通过手写笔记生成配图。不过目前只支持动画、插图或素描三种风格,而且这个生成的图片质量,实在让人不敢恭维。甚至有网友吐槽说,这几张生成的 AI 图片,简直和苹果发布会的画风格格不入。至于在这个基础上,进行的一些什么头像创作、好友间分享,说实话,不如给大家发张火锅帅照。反倒是什么照片 AI 消除这些功能,看起来效果挺不错的,但不少手机厂商早就用了类似的功能,并不新鲜。当然,图片功能里还是有个比较有趣的,就是可以用自然语言直接制作 Emoji ,在这里你可以完全发挥自己的想象力,甚至可以让 AI 照着相册里自拍照,整出个独一无二的 Emoji 。总的来说,光从 WWDC 演示来看,整个 Apple Intelligence 其实算不上太震撼。他们的 AI 发展之路,可能还真就像他们自己说的:“ 征程刚刚起步 ” 。但从今天的发布会里,我感觉苹果 AI 最大的优势还是在体验上。他们今天发布的不少功能,对于初次接触 AI 应用的人来说,用起来是符合直觉的,哪怕性能不强,起码在交互上应该是顺手的。只不过目前展示的功能,还是以苹果自家的软件为主。未来咱们常用的软件适配得咋样,现在暂时还说不清楚。除此之外,隐私也是个比较大的卖点。苹果表示他们为云端大模型开发了一套私有云计算 ( Private Cloud Compute ) ,沿用了在 iPhone 上的隐私策略,保证硬件、软件甚至编程语言都足够安全。但即便做成这样,隔壁的马斯克还是先喷为敬,表示还是信不过。不过,咱也劝马斯克和大家伙都先别急, Apple Intelligence 的测试版,得等到秋季才上线,到时候也就支持美国地区的部分设备,全员推送至少得明年了。OK ,把最重要的 Apple Intelligence 看完之后,我们再来看看 “ 软件系统 ” 上的其他更新吧。除了 AI ,这次 iOS 18 的更新一如既往没有整出什么好活,很多东西都是Android八百年前就玩过的……比如什么呢,我们 iOS 18 支持图标随意放置,也支持更换颜色啦!iOS 18 也支持锁屏快捷应用自定义和隐藏桌面应用啦!说实话,这些真的不能算是卖点,估计Android用户看到这里已经在想笑了……虽然图标换色确实很不错,但如果你用过 vivo 的 OriginOS ,你就知道这东西不新鲜了。但经过我们的实测,iOS 18 支持所有第三方图标换色,而 vivo 只支持部分图标换色,很难做到统一。但 iOS 18 这个换色就是粗暴地统一色调,而不像 vivo 做了一定程度的适配和美化,所以这两种方案哪个更好,就看大家的个人喜好了。对了, iOS 18 现在终于支持图标无字模式了,但是图标会变得很大,有种老年模式的美……不仅如此,这次提到的游戏模式也是国产厂商几年前就标配的功能,不过它能让 AirPods 和手柄的延迟低一些,也算是个好事儿。对你没看错,演示游戏是《 绝区:零 》……控制中心支持卡片和更加自由的布局挺不错,比如你可以改变控制中心里图标的大小,这一点甚至比Android自由程度还要高,而且你不用担心苹果的动画细腻程度。并且现在即使没有网络或者 WiFi , iPhone 14 和 15 系列更新 iOS 18 后,也能通过卫星通信发送 iMessage 和短信。对了,就连通过卫星通信发送的 iMessage 短信,都是端到端加密的。该说不说,这一点确实符合苹果一贯强调的隐私保护,哪怕到了天上也没把这事儿落下。另一个叫做 Tap to Cash 的新功能,意思就是两台 iPhone 一碰就可以面对面支付了,看上去确实很方便快捷。但是这个功能又把Android用户孤立掉了,你们... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人