试了好几个AI画图工具，Dalle & Midjourney都可以画的很好。（附图2，3，4）

试了好几个AI画图工具，Dalle&Midjourney都可以画的很好。（附图2，3，4）但是在实现个人意图方面，我试过了很多prompt，想要AIGC呈现出我所期待的画面（附图1）非常困难。附图1是我很多年前画的画。一直想把它精加工，变成一个更立体、更完整、更有层次感的作品。但是苦于我自己画工有限，无法实现。对于一些三维/立体/视错觉叠加的思维过程，如果AIGC可以接受按顺序来进行的instruction，也许我完成这幅画的数字化，就有据可循了～【ChainofthoughtPrompting】

在Telegram中查看

相关推荐

最近满屏基于多种AIGC工具生成的视频，看来看去就那几种工具，挺乏味的，不用点开都知道啥样。其实明明有更多优秀的AIGC工具！本

最近满屏基于多种AIGC工具生成的视频，看来看去就那几种工具，挺乏味的，不用点开都知道啥样。其实明明有更多优秀的AIGC工具！本帖搜集了AIGC搜索平台List，可以实时淘自己想要的，Web3+AIGC结合，就是超级生产力+数据确权工具，极快卷动超级个体创作与品牌创意策划。AIGC工具可以帮助更多本就具有输出能力的创作者成为超级个体，甚至与品牌共创产生更大的商业价值，这个例子就很适合参与欧莱雅DAO的共创。每个人都可以利用AIGC工具快速把自己的idea落地，生成自己专属的创意产品，再来参与与品牌的共创DAO，并使用Web3工具上链确权，实现二度变现，增加个人资产。图一为AIGC工具集合搜索平台合集，均可订阅Newsletter，实时更进上新，可以都订阅，多方比较，选自己更满意的一款长期看看。（1）Futurepedia：futurepedia.io，更新快，每日更新，工具说明也比较一目了然。（2）Melobytes：melobytes.com/en/专注于艺术工具的AIGC搜索平台（3）Getinference：airadar.getinference.com，3K+members,500+products，专注创造和Marketing,还有热榜更新（4）Creaitives:creaitives.com,输入邮箱订阅Newsletter，接收有关新AI工具、文章和新闻。还有培训班服务。（5）There'sanAIForThat：theresanaiforthat.com，目前集合了1733个工具for463项任务。（6）GPT3demo：很多ChatGPT、AI和GPT-3应用程序和用例，https://gpt3demo.com/（7）FutureTools：futuretools.io，还有APP可以下载图二为目前我觉得值得期待或是试用的一些好用的AIGC工具集合，详细可自行查阅（1）ChatGPT（2）Midjourney（3）Dall-E-2（4）Fireflies（5）D-ID（6）ElevenLabs（7）NotionAI（8）Githubcopilot（9）ElboAI（10）Writesonic（11）POE（12）NVIDIABroadcast

#群友投稿b瘾犯了，昨天去修车我以为我要完犊子了现在路口确实有交警，好几个在一起。就是cod后面那条路往前有个大立交桥下。有很多

#群友投稿b瘾犯了，昨天去修车我以为我要完犊子了现在路口确实有交警，好几个在一起。就是cod后面那条路往前有个大立交桥下。有很多交警再一起。但是应该不是查中国人。我是shore到星际战舰修车的b瘾犯了。在路口没敢拍照打的摩托车。特么的小菲摩托车等红灯死命往前靠。距离交警就二米。我还以为我要完犊子了。我低着头闭着眼。这个几把红绿灯一分多钟。我感觉等一年和打车图。在路口真不敢拍照。就像群里朋友发的。专门查中国人。我穿着就是中国人打扮。反正这个时期少出门是对的trx能量自助兑换:@LYTRX_BOT欢迎投稿爆料：@linyihaokeai金三角特区追寻梦想的地方【@tequvip8】

#网友投稿#甲米地我要为甲米地洗白有一说一，我和好几个朋友19年来的菲，没多久就疫情了，公司也是花了高价进到甲米地，基本都是没事

#网友投稿#甲米地我要为甲米地洗白有一说一，我和好几个朋友19年来的菲，没多久就疫情了，公司也是花了高价进到甲米地，基本都是没事不能出岛，但是外面乱也没有必要出去！在岛基本度过了疫情期，22年回国也是公司报销的机票和在外面的住宿的费用！23年再次来菲也还是选择来甲米地，虽然在网上名声不好，有段时间曾经有过黑公司报出的打人问题，但是已经被物业全部黑公司，不合规和出现人口买卖的公司全部清理出去！曾经甲米地人最多的时候有三万多国人，现在只有一万左右，除了不合规的公司外，很多公司觉得费用高，目前大部门公司都是越南人！岛上有POGO站岗，移民局直接入驻岛上，办理9G都不用跑移民局！

SUNO V3 有点像 Midjourney 的 V3，GPT 的 3.0 版本，给音乐产业带来了很多变化的可能：

SUNOV3有点像Midjourney的V3，GPT的3.0版本，给音乐产业带来了很多变化的可能：1）UGC音乐平台：音乐是创作者头部效应最明显的产业之一，在pre-AI时代，普通人拍的视频可能是具备被消费价值的，因为拍摄的对象可能很有意思，但是普通人创作的音乐或者翻唱的歌是完全达不到及格线的。所以之前做音乐UGC平台的公司基本都没有起来，音乐版权拥有者赚钱很容易，天下苦三大久已。但现在SUNO为代表的AI作曲工具，有点像摄影的发展从一开始要用胶片拍摄和冲洗，变成了数码相机，再变成了手机摄像头。当大量的人突然可以按照自己的想法和歌词生成达到及格线的音乐时，这里面就可能会诞生新的音乐家和大作。于此同时，SUNO也是AIGC应用里面难得的可以形成「内容生产者+消费者闭环」的平台。妙鸭和Midjourney的问题都在于AI产生的内容在本平台上的再消费价值不大。一个人用MJ生成的图片一般来说只对这个生产者本人有价值，但用SUNO生成的音乐不一定。我发现我很自然地就在SUNO上开始听推荐的音乐了，有的还真的有点意思：例子：https://app.suno.ai/song/5c16c93d-0c60-4be1-a65f-c0fafe001a1b这个应该是用了自定义歌词，但听起来真挺可以的。2）个性化音乐：70分的音乐单独听可能价值不大，因为我总可以去听95分的佳作，实际上只有音乐存在「单曲循环」的场景，我们会不断的听最好的歌。但70分的音乐配合合适的场景可能是有用的，尤其是可以随时生成个性化歌词音乐的时候。例子：https://www.bilibili.com/video/BV1Xu4y1n7Jd用AI产生自定义音乐点评电影。3）背景音乐生成器：有一些场景是70分音乐也OK的场景，并且感觉器乐会更容易，因为音乐底层和数学其实是很像的？想起小时候有个假乐队叫班得瑞，就是台湾一个乐队公司把很多风格类似的器乐包装在一起出专辑，而SUNO现在生成的钢琴曲质量已经不错了，感觉凑合可以作为很多咖啡厅的背景声。例子：https://app.suno.ai/song/a0f12ca5-0833-49ce-97f1-cd6094510f2c4）音乐人的Copilot：就跟我们不能现在要求Chatgpt直接写出一部小说一样，对SUNO的要求也不应该是直接生成一首完整的歌，而是作为再创作的起点。SUNO可以首先作为音乐创作者的Copilot。这个地方看起来难点是如何生成专业创作者需要的工程文件（和3D生成遇到的问题类似），分轨的原始音乐素材也是现在最难获得的训练数据。

文心一言的理性思维能力距离GPT-4差多少？我们第一时间测试了一下

文心一言的理性思维能力距离GPT-4差多少？我们第一时间测试了一下在GPT-4发布之后，我们第一时间测查了它在理性思维能力测验上的表现，并将其与GPT-3.5的结果、253位受过高等教育的进行对比。结果发现，GPT-4实现了大跃迁，达到了一个超越人类的水准。测试流程在百度文心一言发布之后，我们第一时间获得邀请码，选择了在前文中测试GPT-3.5与GPT-4一致的题目、流程。详细说明请参考前文。这里不再啰嗦。简而言之，我们挑选了认知科学家用来评定人类理性思维的四类经典测试任务：语义错觉类任务；认知反射类任务；证伪选择类任务；心智程序类任务。四类任务总计26道题目。在测试之前，我们已经预估文心一言的表现会不如GPT-4，但最终实际测试结果还是令人大跌眼镜，可能与百度开发团队的认知有关系。在下文中，我会略作分析。需要提醒的是，本报告仅仅是一个早期工作，并不完善。测试流程有无数可以改善之处。结论未来随时可能被修正、被推翻。各位读者请理解。现在，让我们来详细看看测试结果。分项测试结果语义错觉类任务在语义错觉类任务这里，我们挑选了4个任务。测试结果如下图所示：文心一言全部答错。其中，第四题未指出错误，只说蒙娜丽莎是达·芬奇的，在卢浮宫。应该是通过百度百科获得了该事实性数据。如下图所示：认知反射类任务在认知反射类任务这里，我们挑选了三类任务。直觉减法操作，测试结果如下图所示：文心一言答对第一题，其他都答错。尤其是第三题，没读懂题目，在做加法。如下图所示：直觉序列操作，测试结果如下图所示：文心一言全部答错。尤其是第一题，没读懂题目，解的是3名研究人员发表1篇论文要多久。如下图所示：直觉除法操作，测试结果如下图所示：文心一言全部答错。如下图所示：证伪选择类任务在这里，我选择了经典的沃森四卡片测验。这是一个对于人类来说，超级困难的题目。能够很好地完成这项任务，意味着这个人的理性思维能力很不错。同样，对于AI来说，也是同等困难。GPT-3.5与GPT-4均无法很好完成，同样，文心一言也无法很好完成。测试结果如下图所示：心智程序类任务这部分，我挑选了九道题目。这九道题目，是一个更庞大的人类理性思维测验中的一部分。这九道题目，相对来说较有代表性，代表了人类理性思维知识的方方面面，能够较好地区分理性思维低下与理性思维较高的人。三个模型测试结果，如下图所示：文心一言唯一答对的是第二题，但答得也不够好。如下图所示：而有三道题，要么是答案正确，但是解释错误；要么是同样的提示语，但有时答案正确，有时答案不正确，并且解释不够对。这类测试结果，我们都统一判为错。而人类被试测试结果如下：这些统计数据来自253位人类。他们普遍受过高等教育，不少拥有硕博学历，属于较为典型的高学历高收入高认知群体。大语言模型有多么像人？整体测试结果，如下图所示：26道题目，GPT-3.5答对15道；GPT-4答对23道；文心一言答对2道。需要提醒的是，这仅仅是一项早期，测试流程、测试方法都有很多可以完善之处，未来结论随时会被推翻。由于时间缘故，我们并没有前三类任务人类的测试结果数据，但按照过往的经验数据，大约在40%-60%左右的正确率，如果我们略微高估，前三类任务17道题总计估算为答对10道题，加上第四类任务，人类大约答对6道。最终将人类的正确率估算为26道题目，答对16道。正确率大约为62%。62%，这也许就是什么时候，你觉得一个大语言模型像是一个真正的人一样的临界值。GPT-3.5接近这个数值，所以人们被它大大地震惊住了。而GPT-4远远超越了这个值。而百度的文心一言，只有8%。路漫漫其修远矣。给百度研发团队的一点小建议不懂NLP的吃瓜群众，其实对百度NLP团队做出的努力，一无所知。我说个事实，大家就明白了。在中文自然语言处理领域，百度提供的NLP开源项目是数量最多的、维护最勤奋的、质量最好的。包括我带队研发的写匠项目，调用的也是百度NLP团队开发的分词开源包。但是，文心一言表现这样，我觉得还是无法简简单单地用研发时间不足来解释、产品是第一版上线来敷衍。这类话可能是拿来敷衍李老板可以，但是敷衍全球同行是非常危险的。我深深怀疑，百度该项目的研发团队，极可能走错路线了。作为一名既懂认知科学又懂NLP的从业者，我觉得，以百度的技术实力，表现不至于这样。极可能是团队领导者定错目标了：拿到尽可能多的知识单元。所以，新品发布会上，从CEO到CTO，两位专家，还在拿百度拥有全球最大的中文知识单元说事。但是，这压根不是GPT-4令人震惊的原因啊！！！GPT-4这类产品真正令人震惊的是，从GPT-3.5开始，它真的像一个人类了。这才是形成全球性碾压式传播的根本。这是完全不同的另一种开发目标。也就是，如何让GPT-3.5更像是一个人类，能够更快地自我学习、自我纠错。中文知识单元的数量，在这个事情上毫无意义啊。好比，我们要教会一个三岁的小朋友尽快学会说话，这个时候，有两个重要任务：1）生命：让她尽快明白语义、语音之间的各类规则以及如何用语义、语音表达一个物理世界。2）生态：我们是想方设法给她在家里创造一个有助于孩子学说话的生态。比如，我雇佣阿姨带小美妞的时候，第一考虑就是这阿姨爱不爱说话，外不外向。显然，一个喜欢说话、外向的阿姨，更容易带动小美妞说话。结果，百度该项目团队的做法好比是，直接给一个三岁的小朋友扔了一千万吨词典，你背着词典走路吧。生命何在？生态何在？如果始终沿着这条技术路线走下去，我怀疑在OpenAI团队开源之前，不可能产生一个近似于数字生命的产品。而OpenAI团队是将大语言模型当作真正的生命来对待，从构建一个数字生命的基本机制开始设计，一切工作都是围绕两个基本出发点：1）生命：尽量促进“智能”的自发涌现；2）生态：尽量设计一个促进有助“智能”诞生并发育的生态。在早期，这个数字生命很幼稚，但过了千亿参数级别之后，很多早期打好的良好基础，就会带来极其多的“智能”涌现。好比小朋友从三岁学说话，长大之后，流利使用语言完成诸多大事。我们不能在还没有涌现“智能”之前，就急匆匆地去卖应用、搞数据对接。那压根与GPT-4不是一类产品啊。我们究竟要的是一个数字生命，以及这个新兴的数字生命与生态带来的新世界；还是又多了一个更方便地查询知识单元的工具。我相信答案不言而喻。正如我七年前在文章：认知科学看人工智能文末所写的一样：其实，不可思议之事才是硅谷与中关村的区别。创业者生来当作不可思议之事，而非可以看见未来的事。这份小小报告及建议，希望对如今蜂拥而入大语言模型研发领域的团队，略有启发。也期待中国诞生足够多、足够好的数字生命，带着国人一起步入新世界。...PC版：https://www.cnbeta.com.tw/articles/soft/1350053.htm手机版：https://m.cnbeta.com.tw/view/1350053.htm

孙燕姿都管不了AIGC了平台怕也难

孙燕姿都管不了AIGC了平台怕也难图：依照（目前还不成型的）AI传播道德，这里只放一张被打过叉的原图事件经过一天时间的发酵，现在我们知道：图片是AI合成的。假消息的源头之一是Twitter上一个叫作“BloombergFeed”的账号，原推的附文煞有介事地说：“华盛顿特区五角大楼建筑附近发生巨大爆炸。——初步报道”。这次的假新闻风波，意味着Twitter的内容监管没能兜住AI内容风险。而且这不是个案，随着AI内容生态的萌发，平台的监管问题正逐一显露出来。Twitter的难题“五角大楼附近发生爆炸”事件在爆发的几小时内，就经历了几轮发酵。根据各方考证，假消息的源头不止一个，最早的发布时间可以追溯到当地时间早8点42分。最原始的图在上午10点多被一些蓝标账号捡起来，配上“五角大楼附近发生爆炸”之类的图再度发布。其中，前面那张图中的发布者@BloombergFeed看起来最为可信，因为名字中含有Bloomberg（彭博社），并且获得了Twitter的蓝标认证。但其实该账号和彭博社毫无关系。消息发出来之后，好几条原推都被数百万人看到，被其他的蓝标认证用户转发，甚至被印度和俄罗斯带着Twitter“金标”的正规媒体账号。早上十点多，美国股市也发生了小幅下跌。很多分析人士认为，这是该图片引发的市场恐慌。图：当地时间5月22日的美国道琼斯工业平均指数行情。在10点之后发生了小幅下跌不过很快，网民掀起了对该消息真实性的讨论。首先，虽然很多最早发出来的推都说这是在五角大楼附近，但是照片上的楼并不是五角大楼。另外，照片里面路灯是歪的，并且栅栏与周围景物的遮挡关系也不很写实。图：AI伪造图的细部。虽然像素不高，但还是看得出物体之间的穿插、遮挡关系非常不自然到了10点40多，图片引起了官方的注意。当地的消防机构首先辟谣说，当地没有爆炸发生。之后陆续又有别的组织出面辟谣，公众才确认这则消息为假消息，并且照片是AI生成的。尘埃落定之后，一些网络舆论的矛头开始指向Twitter的蓝标政策。在马斯克收购Twitter之后，改变了蓝标用户的认证方式。在此之前，蓝标是免费授予经过身份认证的机构和名人的。去年11月，马斯克把蓝标政策改成了“付费+认证”的形式。但是，新的认证方式十分的不透明，被解读为“拿钱买认证”。本次“五角大楼爆炸”假新闻事件也进一步印证了，马斯克掌管下的Twitter，认证制度存在重大缺陷。不过，这真的只是认证的问题吗？国内“AI内容监管第一枪”？舆论对本次“五角大楼爆炸”假新闻事件的问题意识，盯住的是Twitter的“蓝标认证”制度，因为“蓝标”意味着账号是由真实、负责任的人或组织运营的。这实际上的诉求在于“AI的使用者不能脱责”，这是目前针对AIGC（人工智能生成内容）监管的一种典型策略。同样，像微信朋友圈、微博这种即时分享类型的平台让每个人都成了新闻资讯的发布者。那么，每个发布者为自己发布的信息负责，这一治理原则在这些平台强化AI内容治理时也被延续了下来。在“可追责”的考虑之上，一些平台开始考虑给AI内容加标识，以防止观者混淆AI生成的内容与真实内容。5月9日，抖音祭出了被称为国内“AI内容监管第一枪”的举措，要求创作者给AI视频内容打上“AI生成”的水印。图：抖音规定的“AI生成”水印样式。图片截取自《抖音关于人工智能生成内容标识的水印与元数据规范》但眼下，随着AI内容生态的演化，我们可以得出一些新的判断：说抖音的举动是“AI内容监管第一枪”，可能夸大了其行业意义。AI水印政策与抖音自身的属性有关。抖音的内容本质上是一个博眼球、争流量的注意力生意，所以抖音理应更关注为了争取流量而不顾道德原则的AI内容。把AI内容在明显的位置标出，或许能减少类似Twitter这次事件，有人把AI虚构的图当作真实图像来传播，造成意料之外的麻烦。类似地，抖音平台要阻止用户利用AI生成的劣质内容来冲流量。所以抖音禁止了单纯读文案带货的虚拟人直播。这些虚拟人主播可以永不停歇地一直播，并且可以被低成本复制，同时用多个账号播出，但是它在视觉、文案、表达上都十分粗制滥造。这种内容对于抖音的问题在于，用大规模低质量内容冲流量，冲淡平台上的优质内容。抖音的一些AIGC治理举措，其出发点还是抖音平台自身的一些特征。抖音对AIGC的问题意识不一定是普适的。监管重点的分化在逻辑不同的内容平台，例如B站这种看重用户创意的平台，AI内容治理又是另一个样貌。3月30日，B站董事长陈睿在中国网络视听大会上放出豪言，说B站是目前AIGC内容质量最高、最丰富的平台。果然不久之后，“AI孙燕姿”就在B站火了。纯从内容上说，“AI孙燕姿”是比较原始形态的AIUGC，即“AI辅助用户生成内容”。它是AI内容的另一种样态，甚至可能是未来AI内容的主流样态。和抖音对“用AI虚构内容博眼球”的担忧不同，AIUGC内容拼的依然是创意，这是UGC/PUGC生态的延续。只不过，正如“AI孙燕姿”所暴露出的问题，AIUGC目前暴露出了知识产权保护方面的重大缺陷。在“AI孙燕姿”这件事上，B站不曾站出来表达自己的监管立场。倒是孙燕姿本人被炸出来，对“AI孙燕姿”表达了一种“无奈地宽恕”态度。孙燕姿的原话是：“我的粉丝们已正式改换门庭，接受我就是一名冷门歌手的事实，而我的AI角色成为了目前的顶流。我想说的是，你跟一个每几分钟就推出一张新专辑的人（虎嗅注：指AI孙燕姿）还有什么好争的。”虽然孙燕姿个人很慷慨大度，但是AIGC的知识产权争议仍在。“AI孙燕姿”爆火之后，有人又提起了“数字水印”技术。简单讲，这种技术是在图像、声音、数据等载体上加标记，这些标记是人看不到、听不出的，但可以用技术手段识别，并且在原始版权素材被改动之后，依然可以识别出其中的版权标记。这种技术颇受看好，但其规模性的落地尚需时日。但总之，B站这类重创意的内容平台，或许能在AIGC的某些元问题上压过那些重流量的内容平台。正如Pinterest——知名的创意分享平台、“设计师之友”——的首席执行官BillReady近期在评论AIGC时多次强调：AI内容应该是人们生活的“调味品”（additive）而非“瘾品”（addictive）。如果内容平台的核心算法原本就是让用户上瘾，那么AIGC会在这种算法中把人性的缺陷进一步放大。Pinterest自身在推荐算法上，坚持探索如何推送具有创意、灵感、个性化价值的内容。这使得Pinterest对低质量的AIGC有一定的抵抗力；同时富有新意的AIUGC艺术作品开始在Pinterest上涌现。图：Pinterest上一位AI辅助创作者的作品目录。他把自己利用Midjourney生成出来的近百个主题（如“科幻场景”“通灵旅程”“政治画”“圣经风格”等）分门别类，整理成库图片来源：Pinterest@Vellectrum所以在讨论AIGC平台监管的时候，也不能忽视AIGC反过来对平台的改造，以及潜在的相互成就的机会。在较短的时间尺度上，AI内容给平台带来一些监管上的挑战，并且不同运营逻辑的内容平台，其AI治理重点还有分化之势。而在远期，AI内容或许反过来决定平台的发展前景。这个远期趋势，或许才是内容平台面临的终极挑战。...PC版：https://www.cnbeta.com.tw/articles/soft/1361585.htm手机版：https://m.cnbeta.com.tw/view/1361585.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人