故事背景主角苍井翔以美术(绘画)特招生的身分进入樱乃杜学园就读。

故事背景 主角苍井翔以美术(绘画)特招生的身分进入樱乃杜学园就读。 但他入学后很快就迷上了模型,沉浸在模型制作这个二次创作之中。 对于拿不出像样成绩的翔,学校下了最后通牒── 如果没有在下一次竞赛中入选的话,就剥夺其特招生资格 父母知道这件事后,为了让他把精力集中在绘画上,强迫他住进了宿舍。 宿舍里可没有能制作模型的设备,这样他就不能做出令人满意的模型了! 为了能够顺利在 HOBBY FES 中出展,回到家里成为了他的当务之急! 他不怀好意地下定决心:“既然这样那我就好好参赛啦!”。 但是,之前的他一直靠着与生俱来的感性直接画下所见所感。 这的确是一种很了不起的天赋,但模型的二次创作很大地转变了他的想法。 对于二次创作来说最重要的就是,对于角色的爱! 那个角色是什么样的人物,会如何思考又会如何行动,有着如何的身世背景, 对于作品的世界观是否有深刻的造诣。这会使得做出的成品有着天差地别的区别。 虽然他已经决定以女孩为模特了,但只看着对方的坐姿作画没有任何意义。 还要先知道她不经意的举动,还有她的实际性格, 要知道她的思考方式,在想什么,有什么秘密,有什么身世背景。 画画之前得先准备好这些!于是,有这想法的他决定开始观察女孩。 随着观察的进展,他开始接触对方的内心,同时也了解了对方的烦恼。 那么,他究竟能不能顺利入选竞赛呢? 他和那名女孩的关系又会有何发展呢? #女友与我的恋爱日常 #Kirikiroid2

相关推荐

封面图片

Niji官方最新推出了一系列免费的绘画课程-Niji Academy。这门实验性课程将艺术基础与人工智能技术巧妙结合。

Niji官方最新推出了一系列免费的绘画课程-Niji Academy。这门实验性课程将艺术基础与人工智能技术巧妙结合。 不管AI绘画技术如何发展,要创作出精彩图像所需的学习内容决非仅限于抄写他人的提示或敷衍其间。 因此,我对Niji官方的课程选择感到非常欣喜。他们从最基础的地方开始讲起。 下面是第一节课程的内容: 由于篇幅很多我精简了一些内容,详细的内容可以去这里看: 这里是第一节的课后练习: 我也会跟着翻译这套课程的每一期笔记和相关的练习题,好我们开始第一期的内容:测量和抽象的基础知识:(如何绘制)一切的理论。 万物理论(为什么万物皆美?) 我一生中的大部分时间都是在这两幅图画之间度过的 为什么我的美术老师不认为左边那幅是 "真正的艺术"?为什么我的朋友觉得右边那幅 "无聊" (还有一些东西,似乎每个人都认为很了不起,但我就是不明白) 我可以把这一切归咎于 "品味 ,但我想知道一个全面的艺术理论。 意外的文艺复兴 基本原则:永恒的组织概念,甚至适用于你的手机相机! 上面的照片通过模糊信息来讲述一个故事。保留一些未说出的内容,给观众留下想象的空间。 你可以在Bouguereau的作品中看到同样的技巧。他并没有画出圣母的手臂,但他也不需要画:从画中的其他部分已经足够看出她有手臂。 视觉抽象 现在,你可能会想,我们如何将“抽象”应用到艺术上? 考虑以下这些句子的演变过程。 [你认为这些图片怎么样?你会如何排序它们的抽象程度?]下面四张图从左到右分别对应上面的四个提示词。 你会注意到,这个比例尺最抽象和最真实的两端都感觉奇怪。“真实”并不一定是最真实的。 真实与抽象是辩论的两种方式。 现实主义:从外向内的论证 如果看起来是真实的,那它就一定是真实的。现实主义就是通过证明来达到真实。 抽象主义:从内向外的论证 如果它像人一样走动,那么它就一定像人一样可爱。抽象主义就是通过归纳来达到真实。 那么对于超抽象的东西呢? 所以在这个背景下,你可能会说毕加索的《格尔尼卡》是难以接近的。 你挠头想,这种类型的文本有什么用呢?(除了文学“东西”) 原因1:有时候新的想法不完全成形,所以很难理解。

封面图片

Sora封的第一个“神”,塌了

Sora封的第一个“神”,塌了 也正是黑框眼镜、流利的口条、199元的AI课以及高频出现的“还剩不到10个名额”“我是清华大学博士”等诸多要素,构成了李一舟“AI巨头”的人设。据媒体援引飞瓜数据,上述的199元AI课程,李一舟一年合计卖出了约25万份,营收5000万元。2月16日,OpenAI发布最新文生视频Sora惊艳全球,李一舟当然没有放过这一时机,在各大平台密集开播卖课,精准收割流量。但不少人很快发现,这位“巨头”实属经不起推敲。其所经营的一舟智能官网上的许多模型其实是由独立开发者所制作加工的开源模型,是一舟智能未经授权就私自上架并商用了。而几乎同时,有付费学员质疑199元AI课质量低劣、割“韭菜”而遭到李一舟工作人员反驳,辩驳不过后,更是直接解散了课程群。有人讲道,李一舟并没有强AI学术或从业背景,只是在蹭热点,翻车是早晚的事,“但没想到会是这么快。”对于风波,李一舟对媒体《鞭牛士》表示目前不便回复,“过一阵再说吧”。一场闹剧,以荒诞的方式划下了休止符。而关于他的诘问,还在继续。“AI巨头”陷入97个模型侵权争端2024开年不久,来自北京航空航天大学的AI绘图模型开发者“LEOSAM是只兔狲(以下简称“兔狲”)”突然发现,自己亲手训练微调的3个模型作品出现在了“一舟智能”的网站上,而自己对此一无所知。兔狲对“市界”介绍,这3个模型都是Stable Diffusion AI绘图模型,即坊间俗称的AI绘画工具,原本都发布在国内最大的AI模型分享社区“LiblibAI”上。“其中有两个还是我和Liblib签署了独家的协议合同的,所谓的独家就是LiblibAI和我们模型作者进行一个约定,该模型在国内市场中,只在liblibAI上独家发布,同时liblibAI会对本模型提供更多激励以及更好的推广机会。”他讲道。大模型应用开发者、清华大学讲师“ROST印”对“市界”解释道:“国内AI圈的生态现在是,所有号称自研AI绘画的产品跟平台,其实底层都是采用了基础模型Stable Diffusion(简称SD),由知名创企StabilityAI开发。”“而SD更多是提供一个基础的算法框架,它上面能直接用来生成图片的模型是很少的。所以会有一些圈内爱好者,基于SD来不断调节参数,最后生成一个带有自己强个人色彩和用途的模型作品。”更通俗的来说,SD与兔狲发布的模型之间的关系,就相当于GPT-4与微软Copilot之间的关系、百度文心系列大模型与“文心一言”的关系、字节跳动云雀大模型与对话机器人“豆包”的关系……或者用兔狲本人的话来说:“这就像是原味饺子和酸汤饺子、可乐和姜汁可乐的关系,存在原版产品是否经过二次加工的区别。”不同的是,完成应用开发设计的不再是公司,而是个人开发者,就像有人基于开源大语言大模型构建了一个自己的特殊用途AI工具(可能是法律AI、金融知识AI……)。这类工具常被称为“第三方模型”。兔狲的遭遇并非孤例,炼丹科技创始人忠忠,独立开发者娜乌斯嘉等人也发现,自己在其他平台发布的模型出现在了一舟智能的官网首页。Liblib官网上对于商家的第三方模型是否为“独家”、是否可商用做了明确标注。在兔狲等人看来,一舟智能刻意忽略了这一点。以开发者麦橘的作品为例,一舟智能不仅隐去了模型来源,还在网站首页将模型标注为“一舟模型”,并在模型页面将算法来源也标注为“一舟”。( 图源/开发者麦橘供图)对于开发者而言,这带来的最直接影响是他们将无法从自己制作的模型产品中获得任何收益。客观而言,训练模型是一个非常耗时且耗费资金的工作,兔狲讲道:“以我为例,我差不多从去年的这个时间开始制作SD模型,365天里投入工作的时间达到了起码半数,而且为了训练模型,我会在云计算平台Autodl上租赁算力,至今花费了大约两万元人民币,此外我购买了英伟达4090和6000ada这两块显卡,也花了大概8万元。”他进一步分享道:“LiblibAI会根据模型的运行量、下载量等数据,对作者进行一个普适性的分成;签署独家协议的话,平台也会对模型有进一步的流量扶持或激励补助;此外我在LiblibAI上留下了我的联系方式,很多商业客户会联系到我,进行商用模型定制之类的,间接带来部分收入,这样才能平衡支出。”收益之外更重要的影响是,“在精神上,我们受到了极大的不尊重。”兔狲讲道,许多开发者开发模型并非为了盈利,而是“享受创作和分享的过程,让更多人可以用到我们制作的模型来生成美好的图片。所以很多人包括我在网站发布模型时,都是(仅与上线平台方签订协议,但允许)普通用户免费下载的。”为此,开发者们已经在统计被搬运至一舟智能上的模型数量,并逐一联络了这些模型的开发者:“目前搬运的合计有97个模型,除1个模型为stable diffusion XL官方模型外,其余均为国内或国外开发者所制作第三方模型。”兔狲告诉“市界”,成功联络到并且愿意共同发声的开发者人数,已经达到了17人,对应着25个模型。AI知识付费走上流水线开发者与一舟智能进行的沟通并不顺利,对方只承认平台上的模型来自“SD官方接口”。“市界”联络到了一舟智能的业务相关方、一舟智能软件的服务提供商“提示语科技(北京)有限公司”,后者对“市界”反复强调,开发者们所主张的侵权模型,一舟智能方面“都没用于盈利”“绝对和割韭菜不沾边”“我们切切实实地帮助了几十万人”。这位相关方人士讲道,一舟智能官网上的模型“是用户都可以上传的”,也就是说,被指存在侵权的97个模型均是由用户从其他网站下载后、二次上传到一舟智能官网。未能署名开发者,或是从开发者处获得授权,亦是由于用户跳过了这部分环节。但本次陷入争议的许多模型,在一舟智能官网页面上并未标注“上传用户”的信息。另外,据李一舟本人在其线上课中的表述,使用其公司官网上的“一舟生图”功能需要“消耗算力”,AI课程包中附带了100万个“算力单位”,消耗完后得继续购买。( 图源/左-李一舟视频号;右-一舟智能官网付费套餐详情)在开发者们看来,这无疑是通过打包售卖,来对商用他人作品进行包装的恶劣行为。兔狲透露,这种行为并非孤例,在开发者群友的提示下,他发现了:“抖音上还有一个作者叫张诗童,大概有200多万粉丝,他自己也有一个网站,同样搬运了我们的模型,甚至网站界面都和一舟智能高度相似。所以我们怀疑,实际上抖音等平台上的不少所谓AI知识付费博主,可能都有这么样的一个操作的流程,包括服务商怎么给他们设计网站、他们怎么获取收益,其实都是同样的套路。”但在知识付费博主司强眼中,李一舟的行为则展现出了对风口的超强把控力。司强讲道,他与李一舟同为全国最大的付费创业副业社群“生财有术航海家社群”的付费会员,曾有简短交谈,“我们抛开外界的成见,他抓住的风口是很多人遥不可及的,我原本还打算抽时间去拜访他。”这个风口指的是AI浪潮之下,不少人深陷在“掉队”的时代焦虑和对渴望造富的夹缝中,渴望拥抱机遇、改变命运。受情绪驱使,这部分下沉人群汇成了铺天盖地的流量,也成为了李一舟的掘金密码。根据清华大学官网刊载的一篇采访文章,李一舟的确曾经在清华美院攻读博士。但在此之前,李一舟的本硕就读于湖南大学设计艺术学院。而李一舟第一次出现在公众视野,当属2012年,已经进入清华就读的他出现在了天津卫视播出的职场真人秀节目《非你莫属》,与周鸿祎、陈向东、李... PC版: 手机版:

封面图片

Sora证明马斯克的是对的 但特斯拉和人类可能都输了

Sora证明马斯克的是对的 但特斯拉和人类可能都输了 随后他在 X 上转发了一条 2023 年的视频,内容是特斯拉自动驾驶总监 Ashok Elluswamy 向外界介绍特斯拉如何用 AI 模拟真实世界驾驶。视频中,AI 同时生成了七个不同角度的驾驶视频,同时只需要输入‘直行’或者‘变道’这样的指令,就能让这七路视频同步变化。当然,这不意味着特斯拉早在一年前就掌握了 Sora 的技术,毕竟特斯拉的生成技术只用于模拟车辆行驶,而 Sora 能够处理的环境、场景、Prompt、物理规律等信息更加复杂,二者在难度上不可同日而语。但特斯拉 AI 和 Sora 训练的思路是一致的:并不是训练 AI 如何生成视频,而是训练 AI 理解和生成一个真实的场景或者世界,视频只是从某一个视角观察这个场景的一段时空。这是两家在现有业务上完全不同的公司,以彼此不同的方法来感知真实世界,而他们共同希望通向的,都是 AGI(通用人工智能),甚至更具体一些,就是具身智能和智能体。理解这个观点的核心,是理解 OpenAI 为 Sora 赋予的使命,并不只是替代视频生成的创作者,而是将视频生成作为帮助 AI 理解真实世界的‘模拟器’。如果说特斯拉数以百万计的车辆仍然需要用‘肉身’感受这个世界,那么 Sora 则是单纯依靠数据的输入,建立起对世界的认知。OpenAI 官网上,关于 Sora 的这篇研究论文名为《把视频生成模型作为世界模拟器》。请注意‘世界模拟器’(world simulators)这个关键词,它是比生成视频更关键的核心所在。其实,早在特斯拉发布 FSD V12 的时候,这家以汽车为主要消费产品的人工智能公司,就已经展示了类似的能力。如何理解呢?首先,在 FSD V12 上,工程师删除了超过 30 万行定义驾驶规则的代码,系统将从被‘投喂’的驾驶视频中,学习如何应对真实的驾驶场景,而不是向过往那样,按照写好的规则,在某个特定场景下执行某一个具体的命令。当然,和作为‘生成式模型’的 Sora 不同,FSD 的目标是实现自动驾驶,所以它并不需要真正生成一个具体的视频。你可以想象成一个人(或者智能体)正在进行‘防御性驾驶’,基于过往经验,可以对周围环境中交通参与者的下一步移动趋势做出判断。这个判断存在在头脑里就行了,不需要真正把它画在纸上。因此,特斯拉的 FSD 也不需要把对未来的想象,生成为一个真实视频,并呈现在车辆的某一个屏幕上。所以,现在有 OpenAI 和特斯拉两家完全不同的公司,用截然不同的方式和路径,实现‘通过视频生成,让 AI 理解物理世界’这个相同的目标。简单了解一下 Sora 的运行逻辑:OpenAI 表示,Sora 结合了 Transformer 和 Diffusion 两个过去几年最重要的模型。ChatGPT、Gemini、LLaMA 等语言模式都是基于 Transformer 模型,它对词语进行标记,并生成下一个单词;Diffusion 模型则是‘文生图’的代表。如果从‘理解世界’的角度来审视 Sora,那么某一帧图像的画质、画面关系绝不是模型质量高低的评判标准,甚至官网释出的 60 秒一镜到底视频也不是最核心的部分。重要的是这个生成的视频可以被剪辑在不同的机位下,无论是广角、中景、近景、特写,视频中人物和背景的关系都保持着高度的‘一致性’。这才是 Sora 遥遥领先并接近真实的地方。这一点和特斯拉在 FSD 上采取‘纯视觉’方案可以结合理解。简单来说,99% 的车企或者智驾团队都会在车辆上保留激光雷达,通过激光束的发射和接收,辅助计算周围物体和车辆间的距离关系。但马斯克不仅删除了 30 万行代码,还移除了雷达,只依靠高清摄像头采集和神经网络学习来判断距离关系。无论是对特斯拉,还是对 OpenAI,这都是巨大的挑战。毕竟输入的画面是 2D 的,但输出的结果(无论是驾驶指令还是视频)都需要基于对 3D 世界的深刻理解。规模和质量是训练模型的核心。特斯拉的数据来源于真实道路上,搭载了传感器的车辆;而 OpenAI 的大量数据,从目前的公开信息来看,来源于网络。在质量的维度,在《马斯克传》里,作者艾萨克森写道特斯拉通过和 Uber 合作,获取‘五星司机’的素材训练 FSD;而从规模出发,奥特曼最近希望筹集万亿规模的资金,就是重注算力和规模的具体体现。最后,回到一开始的那个问题,为什么我们会认为 Sora 和 FSD v12 是相似的?Sora 和 OpenAI 未来的想象空间又是什么呢?它们和 AGI 又有什么关系?在马斯克看来,当人工智能可以真正解决一个问题(物理、数学、化学等等)的时候,AGI 就到来了。不过还有另外一个理解维度,那就是具身智能。毕竟现实世界里,并不是只有数学公式和文字规则,拥有一定的智商的小猫小狗也可以依靠运动真实地和物理世界进行互动。这点对于过去只能输入二维信息的 AI 来说很难做到。这也是为什么马斯克看到 Sora 后在 X 上评价是‘GG Humans’,在他看来 Sora 今天做到的,已经打破了过去的次元壁,而能理解真实世界并继续学习,AI 也就有了更进一步影响真实世界的能力。而就像特斯拉把这种生成能力用于训练车辆,Sora 的价值也不仅仅是生成一个难以让人区分真假的视频,用作影视创作者的生产力工具(尽管这是一个非常困难且刚需的场景)。就像周鸿祎所说,‘Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。’ ... PC版: 手机版:

封面图片

NeurIPS开辟高中赛道引爆争议 爹妈代理人战争要开始了?

NeurIPS开辟高中赛道引爆争议 爹妈代理人战争要开始了? -入选的优秀论文可以在NeurIPS主页展示-最多5个获奖项目的作者将受邀参加在温哥华举行的NeurIPS大会-还特别提到欢迎作者使用大模型作为研究工具就,emmm……一夜之间,引起学术圈各大社区广泛争议。反对者比较集中的一个观点在于,这样会加剧教育资源的不平等。也有不少人觉得,这样会进一步导致低质量论文泛滥:为了发表而写论文正在取代正经研究。甚至有UCSD计算机科学教授透露,已经被海量申请暑期实习的高中生邮件淹没了。当然,这种时候总少不了用玩梗来讽刺的网友。也有熟悉东亚内卷文化的网友指出,我们都知道将会发生什么:代理人战争。就感觉,和最近热传的另外一些事对上了?可以说是一种不那么讨喜的“梦幻噩梦联动”了。NeurIPS开设高中赛道NeurIPS这次尝试是否会向大家担心的那样变成一个“反乌托邦”,还是先来看看公告具体是怎么说的。每份提交的作品必须是完全由高中生作者独立完成的作品。我们希望每份提交的内容都能突出显示出使用机器学习产生积极社会影响或有积极社会影响的潜力。应用领域可能包括但不限于:农业、气候变化、教育、卫生保健、流浪汉问题、饥饿、食品安全、精神健康、贫困、水质。其他格式要求等不重要的先略过,公告中还有以下值得注意的地方:-论文提交截止日期在6月27日,距公告发布时还有两个半月时间。-需要提交高中就读证明,由每位作者所在高中签署、带有学校信头。-所有补充材料应完全由作者创作,包括视频、Demo演示、海报、网站或源代码。-审核流程将由匿名审稿人进行,不会向作者提供书面反馈。对于使用大模型来辅助,会议主办方表示欢迎,但也提出了两个重要标准:-在论文中充分描述具体使用的方法,包括数据处理或过滤、可视化、促进或运行实验或证明定理的工具。-作者对论文的全部内容负责,包括所有文本和图形,须确保所有文本都是正确且原创的。总得来说,主办方确实考虑到了一些可能导致不正当竞争的因素,并做出限制。比如必须完全由高中生完成,有网友开玩笑说,想求中学哥中学姐带飞的硕博同学可以死了这条心了。但实际执行起来会不会走样呢?也有人设想了一些可能性。CVPR做法更值得借鉴目前,NeurIPS官方账号发布公告后,还没对质疑做出正式回应。综合各大社区网友意见来看,除了前面讨论过的担心“家长代练”之外,反对一方还有几个顾虑之处:首先是对于学术圈来说,垃圾论文会更加泛滥。还有人举出具体的高中生已经发表的低质量论文例子。其次是对于AI学术会议来说,审稿已经不堪重负。近年来,向AI顶会提交的论文数量不断激增,ChatGPT发布之后更甚,审稿人数量严重不足,也导致评审意见质量下降。以至于有人提出,与其让高中生投论文,还不如让高中生参与审稿,评审意见质量都不一定比现在的差……另外,对于参加项目的高中生来说,也是一种额外的竞争压力。也可能导致部分学生过于功利化,过度追求发表论文而忽视全面发展。不过支持的一方也有人在。比如一位Databricks研究科学家就志愿参与高中赛道的审稿工作。他认为高中生最大的挑战是弄明白自己以后想做什么,参与学术研究是很好的切入方式。有网友指出,事实上过去也确实已经有一些高中生向NeurIPS、CVPR等顶会投稿了。现在的问题是,为他们单独开设一个赛道会更好吗?最后,同样作为AI顶会,CVPR也在积极接触和影响高中生,他们的做法就是好评更多了,更值得借鉴。总之,点赞最高的中立意见认为,NeurIPS难以兼顾顶尖学术会议和迎合高中生项目。此举太过激进,没有考虑周全可能产生的后果。保守一些,应该先从鼓励本科生,或者让高中生先从参加workshop开始。对于NeurIPS开设高中赛道这件事,你有什么看法或建议?欢迎在评论区聊聊。参考链接:[1] ... PC版: 手机版:

封面图片

回顾我的 prompt 能力从小白到熟练的一些重要节点:

回顾我的 prompt 能力从小白到熟练的一些重要节点: 防杠叠甲: 1. 仅代表我自己的认知,没啥权威性。 2. 认为提示词那么简单至于搞那么复杂么的朋友,你对 3. 本文是语音转写的,比较随意。 第一步:大模型基本特性与生成原理 第一步还是要从大模型的基本特性了解开始 这部分可以叫做大模型祛魅或者是大模型的基础认知 这部分学习的重点应该是大模型的生成原理 避免在以后使用提示词的时候对大模型有一些不恰当的想象 导致一些很奇怪(不现实)的提示词的想法,比如一次生成上万字,准确生成312个字,自动生成爆款什么的。 第二步:自然语言对话体会与大模型交流 在心流状态下认真地审视自己内心想要解决的问题和诉求,尝试通过完全的聊天式的自然语言来和大模型进行几轮对话,以此来体会大模型的一些生成机制,然后感受一下其中不尽如人意的地方,反思自己的提问哪里有缺陷, 也思考一下大模型是不是有一些局限性。 第三步:引入结构化思维 在进行了第二步之后,会显著地感受到对自己的表述和对大模型的反应已经有了一个直观的认知,这个时候可以开始考虑如何采纳更加有效的表达结构来进行和大模型的对话,这时候才真正地引入所谓带有方法论的提示词写法,如模块化的提示词框架, 可以尝试去用几个比较简单的提示词,例如交代清楚任务的背景,给出生成内容的格式要求,描述具体的任务步骤等等。 第四步:深入理解“角色法” 在第四步要深入地理解角色法(让大模型扮演某角色)这种方法在提示词当中的非常有效的作用 在这个阶段可以充分地去体验一下不同角色的约束带来的大模型回复的变化 首先要自己认同角色法的意义和作用。 在角色法的基础上加上结构化表达,所谓结构化提示词事实上就是基于角色法的一种结构化表述方法。 同时,在结构化提示词的 workflow 部分融入了思维链的思路,将复杂的任务拆分成清晰的、环环相扣的、分步实施的清晰的任务指令。 结合了角色法、结构化表达和思维链提示的三种方法论与一体的结构化提示词,在一些复杂任务当中或在一些复杂的角色塑造当中起到了非常显著的作用,但这只是提示词创作的方法之一。 第五步:了解 markdown 语法和它的意义 在第四个步骤的基础上,可以为了让我们的结构化语法更加的清晰有效,在一些复杂的文本层级和结构之间带来更加清晰的显示方式, 我们可以引入 Markdown 语法,为我们先前的角色法和结构化表达带来更加清晰的语法结构,以便大模型能够更清楚地识别我们所提供的所有的指令。 提示词中使用 Markdown 语法的核心是符合 OpenAI 的官方六个最佳实践里面的使用清晰的表达结构和分隔符、符号等方式使得我们的大段文本的结构变得更加清晰。 这样做的目的只有一个:就是让大模型不至于混淆在我们复杂的文本指令过程中的一些层级问题,或者因为分隔不当而导致一些有不同含义的文本被混淆在一起导致大模型的误解。 在这一点上,很多同学有着诸多的困惑或误解,事实上,Markdown 语法并不局限于我们广为流传的结构化语法当中的那些固定格式和单词, 只要是基于清晰表述的框架层级下采用 Markdown 语法, 你完全可以自定义你的每一级的标题的内容和文本的内容, 以及灵活地使用 Markdown 当中的其他的一些写法, 例如有序列表,无序列表,缩近符,分隔符,在提示词当中嵌入一部分片段式的代码等等,都是可以的。 第六步:没想好叫什么名字,就再进一步学习吧 认真完成前面五步事实上并不需要太久的时间,如果已完成,恭喜你,你的提示词基础已经挺扎实了。 接下来是两个层面的进阶学习: 1. 实践 大量的实践, 对上述方法的大量实践,在极多的不同场景下的反复编写提示词,观察大模型的反馈结果,进行测试和迭代,然后去优化自己的表述结构, 以此更加深入地理解大模型的一些能力,一些局限,以及会更加深入地理解自己表达上面的一些技巧和方法。 2. 表达能力 向内审视自己的表述,这背后是我们的逻辑思维和表达能力,我们的词汇量,我们的语言组织,我们的语法习惯,都会影响我们在对大模型输出指令时的文本的质量。 在前一个步骤里采用的结构化提示词的好处在于,它已经规范了一套相当标准的表述结构,那么就可能会在一定程度上弥补个体在表达上缺乏逻辑性和条理性的这样局限和缺陷。 在我们运用结构化提示词非常熟练的场景下,我们需要进一步地去融合和提炼,学会在更加复杂的情况下使用复杂提示词,而在更加简单或连续追问的心流场景下,找到准确表述自己的意图的一种方法。 这是需要建立在大量的对话实践的基础上的,如果你在之前已经了解过大模型的特性,也采用结构化提示词,采用别人提供的框架和模板,进行过大量实践的情况下,你可以在极其精简的几个句子中就明确表述自己的意图,并且对大模型接下来的生成有一定的判断。 在大模型的生成不符合你预期的结果时,你也可能很快地找到如何调整自己表述的方式。这些是我称之为一种和大模型对话语感的能力,这种语感的背后有经验的累积,有对方法论的思考,更多时候也是形成一种潜意识的表达的一种条件反射的语言素养。 第七步:提示词封装与工作流 当我们对外掌握了足够的技巧和方法,对内也深刻思考了自己的深层逻辑思维与表达能力,我们该考虑如何把我们熟练运用的提示词作为工具分享给他人使用,或作为工具沉淀下来用于提升自己的生产力工具。 这时候我们必须要考虑到引入一个提示词封装的方法。 目前市面上比较主流的工具有 OpenAI 官方推出的 GPTS 或者叫 Gizmo, 当然也有我们国内国产大模型的很多智能体封装的工具, 例如智谱清言的智能体,百度文心一言的智能体,以及Kimi Plus版本最近推出的官方智能体(暂不支持用户自己上传), 这些都是很成熟的平台化的智能体封装方式。 对于提示词学习者来说,仅需要花较少的时间去了解平台的特性、智能体的设置规则, 以及一些最基础的简单的参数设置即可。 但当我们来到这一步时,我们必须面临的一个问题是, 在我们独自使用一个提示词的时候, 很可能这个提示词的某些约束语句仅出于我个人的语言习惯或我个人对提示词的使用场景, 所以在我们测试和迭代的时候不会发生太多的问题。 但当我们把一个提示词封装为一个智能体去发布或者是传递给更多其他人使用的时候, 由于使用场景的差异和思维方式的差异, 很可能我们的提示词会遇到很多用户层面的问题。 如果我们有机会和我们的用户交流的话, 可以极大的提升我们在提示词的编写迭代上的认知和见解。 这是非常宝贵的经验,值得大家在这个领域投入更多精力,建立和你提示词使用者的沟通机制是非常有帮助的。 同时我们在这个阶段也会面临另一个困境,就是单一的提示词很难解决较为复杂的任务或生成非常长篇的复杂文本。 这是大模型单词对话窗口的局限性和大模型的注意力机制所决定的。 当你的提示词足够复杂的时候,意味着大模型的注意力也被大量的稀释。 那么分散在一些特定的重要约束语句上的注意力可能就会不足以让大模型来理解并完成这一个指令和约束。 在这种情况下,单个提示词的能力会变得让我们感到非常无力,这种情况下,我们需要引入提示词链或工作流程,把多个提示词和大模型能力以及外部工具的能力链接起来,形成一个特定的工作流来解决我们对复杂任务的要求。 第八步:RAG技术 同时,为了解决大模型的世界知识不足或产生幻觉等等问题, 我们在这个时候需要适时地考虑引入基于 RAG 技术的自主上传的知识库文本或自己去创建清晰的数据集来作为引用文本, 方便大模型基于更加严谨的参考文本来解决我们特定的任务场景。 到这里,提示词应该可以想写什么写什么了,祝 AI 旅途愉快。

封面图片

AI开始对音乐人下手了

AI开始对音乐人下手了 "我和团队已经在想办法改行了。"音乐人Ferry对第一财经记者开了个玩笑。Ferry毕业于伯克利音乐学院,此前是香港交响乐团作曲家,现在是上海音乐工作室的音乐总监,主要工作内容是音乐制作和游戏配乐。他说,自己做了15年音乐,经历了很多不同风格的洗礼,有了很多经验。但对Suno而言,只是几秒钟的事情。如果换算一下,Suno写十首Demo的时间只需5分钟,换音乐人可能要一个月。他预计,"AI音乐对音乐制作人是毁灭性的(打击),发展成熟后,在音乐制作这一块会取代90%的音乐人,也会有大量音乐人失业。"但AI并非全能。音乐的精髓远超过技术的堆砌和算法的编织,它是情感的表达和创造力的展现。这种源于内心深处的情感和独特的创造力,是人工智能目前难以触及和全然复制的。第一财经记者采访的多名音乐人也认为,目前AI仍然是一个需要人类引导的工具,代替不了10%的顶尖音乐人。记者实测:几十秒至1分钟内生成流畅歌曲Suno水平到底如何?记者在Suno AI网站进行了实测。记者输入的歌曲描述为:"创作一首关于旅行的歌曲,曲风明快,由吉他、钢琴、小提琴、鼓演奏。表达旅行的轻松愉快,以及对人生的感悟"。几十秒后Suno就生成了歌曲并可播放,该歌曲标注的关键词是"piano(钢琴)、violin(小提琴)、folk(民间音乐)、joyful(快乐的)、guitar(吉他)、drums(鼓)"。该歌曲使用钢琴和鼓伴奏,但记者并未听到小提琴的声音,歌词则出现了钢琴、小提琴、吉他、鼓点的字眼。歌曲时长1分40秒,由两段主歌和一段副歌组成,女声歌唱,流行乐风格,十分流畅,但歌词还是有些许生硬。记者随后让通义千问生成一段关于"失恋后自己旅行并表述旅行感受和人生思考"的歌词,将歌词输入Suno,音乐风格输入"粤语,流行,哀伤",大约一分钟生成歌曲并可播放。此次生成的歌曲曲风依然流畅,但仍是用普通话演唱。记者将提示词改为英语,并输入《再别康桥》作为歌词,这次AI终于在前几句用粤语歌唱,但马上又变成了普通话演唱。第一财经记者实测Suno这三次Suno生成的歌曲都很流畅,可以发现它对流行、摇滚风格的把握也比较精准,但记者可以感受到Suno对于中文的理解不如英语,Suno对提示词的理解也有限,要生成方言歌曲不太顺利。Suno自己生成的歌词有些许生硬,结合其他大语言模型生成歌词效果会更好。在Suno的"每日推荐"榜单中,有更多生成效果更好的歌曲,歌词包含各国语言。记者点进去试听,发现排名前列的歌曲人声都非常清晰,歌曲流畅且风格鲜明,歌曲自成一体。中文歌曲中,儿歌《让我们荡起双桨》被"改"成重金属风格,《春天在哪里》"改"成爵士蓝调曲风,《蜀道难》变成摇滚风,宋词《声声慢·寻寻觅觅》则以古风呈现。还有网友做了AI工具"全家桶",用OpenAI创作歌词,Midjourney生图、Runway让其动起来,最后再让Suno配乐。不过近日,在运营成本压力之下,Suno调整了价格体系。记者看到,目前在Suno AI网站上,注册新账号每天可获50个积分,共可用于10次生成歌曲(50 credits renew daily /10 songs),随后要继续使用就要充值,1个月内生成500首歌曲需要8美元,每个月内生成2000首歌需要24美元。Suno AI渗透音乐圈Roro 去年刚毕业,目前在一家唱片公司当练习生,她向记者感慨,最近Suno太火了,身边好多音乐人朋友都在用这个软件。"刚接触这个软件时觉得‘哇’太吓人了,因为大家只要在这个软件点点我们想要的要求,作词、作曲、编曲就能马上出来,而这些我们创作人是需要花很漫长的时间去学习、累积练习才能做出来。""这个地球上任何的风格Suno都能实现, 在这个意义上,现实中被认为天花板的音乐人,也会比不过Suno。"在Suno半年前开始公测的时候,Ferry就已经开始体验和使用, 在强大的生成能力背后,他认为,Suno或许学习了几十亿首曲子这样的数据库。作为伯克利音乐学院的学生,王钰初次接触到AI音乐生成工具则是在2024年初受同学推荐。"一开始大家觉得比较好玩,但其实也不是非常新奇,人工智能在图像生成领域之前就有一些软件出来,我们之前也预测,AI用于音乐创作是迟早的事。用了几次之后发现,对我们日常编曲和创作灵感的激发都有帮助,所以一直在使用来协助创作。"王钰告诉记者,虽然他所在专业的教授禁止学生用AI做作业,但允许利用AI进行辅助作曲。除Suno外,记者了解到,AI对于音乐领域的其他工具也正在渗透,音乐创作者越来越难以忽视AI带来的改变。王钰告诉记者,现在有很多编曲混音软件正向半AI模式发展。"比如一些做音乐母带的软件,你可以直接告诉软件需要什么风格和场景,软件会自动帮你做参数,本来这是混音师的工作,但现在看下来,人工智能生成的效果确实不错。""此外,AI音乐制作软件更大的作用在于可以生成音乐最终的样本,比如当作者写完某段音乐,希望做一个预混,模拟一下做完所有后期之后的录音室效果。这个时候就可以套一个AI插件,让AI帮助模拟各种风格效果,就类似修图软件可以套滤镜一样。"王钰称。AI此前在美术领域,已替代了部分人类画师,在音乐领域会不会重现这一过程?不少音乐界人士对第一财经表示,目前AI音乐工具可以取代简单的音乐创作。听到Suno AI创作的音乐后,就匠音乐创始人张昭轶对第一财经记者评价,"完成度很高,质量也很好。"他认为,那些功能性音乐和快餐类音乐,可以被AI低成本量产。他提到,国内做同质化歌曲的人不少,尤其是一些所谓资本加持下的音乐工作室,甚至"抄袭"量产再赛跑,这些"简单算法"的词曲,很容易被AI取代,因为AI厉害之处在于词曲能够根据诉求,大量提供水准不低的作品。熟悉娱乐经纪和音乐版权领域的袁原告诉记者,据她所知,Suno的上一个版本在行业里已经有人用于商业场景如发布会上的使用。她对记者解释道,因为版权原因,过去行业做垫乐、配乐的价格不比做音乐便宜,还有各种情绪上的要求,但又没有足够的商业价值,很难有优秀的音乐人专门为此创作。"Suno3.0版本我听到的片段,用在场景音乐上已经完全没有问题。"袁原还透露,围绕Suno3.0的商业化,业内已经有音乐公司考虑利用AI创作、真人演唱的方式来进行音乐直播了。音乐制作人、钢琴老师余亮(化名)最近也在与同行交流AI工具的影响。"很多独立音乐人认为低端编曲作曲已经没有生存空间了。Suno创作的作品虽然音质不怎么样,但只要向Suno投入的数据量足够多,创意还是不错的,可以满足低层次编曲作曲的需要。音乐人只要参考Suno的创意,再加入一些自己的想法,重新编曲混音,就可以完成部分低水平商业作品创作。"余亮解释,低端作曲编曲的范围包括为作词爱好者提供编曲服务、为企业团建合唱编曲、为学校创作校歌、为大中小学艺术节比赛编曲等。在电商和社交平台上,这种编曲单很多,一单的价格可低至100元左右,这是编曲者的收入来源之一。Roro认为,AI对于一部分音乐人会有一定威胁。如果作品不够好,AI完全可以取代。"你写的东西AI也能写,那作为客户,一样的作品我为什么要花更多钱让你写?"Roro觉得市场会淘汰一些粗制滥造的音乐人和音乐作品,但会留下能写出好的作品的音乐人。王钰则表示,类似Suno的AI音乐制作软件可以替代一些需求下的人工音乐创作,"比如广告配乐,游戏配乐,还有像抖音配乐,网红热曲等商业性、功能性较强的音乐在未来都有可能利用AI直接生成。"与音乐相关的影视界... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人