发现一个很有意思的应用 Simply News，它会使用 Agents 查找特定领域的新闻内容自动生成播客。#ai#

发现一个很有意思的应用 Simply News，它会使用 Agents 查找特定领域的新闻内容自动生成播客。

发现一个很有意思的应用SimplyNews，它会使用Agents查找特定领域的新闻内容自动生成播客。相对于AI生成视频，现在来看自动个生成对应播客的技术可能更成熟，最近也看到了很多探索，比如Perplexity也有个类似的播客。他们的Agents主要由四部分组成：TheSorter：扫描大量新闻源，根据文章的相关性和对播客类别的重要性进行筛选。ThePitcher：为每篇筛选出的文章制作引人入胜的提案，考虑文章呈现的叙事角度。TheJudge：评估提案并做出编辑决定，选择哪些应该被报道。TheScripter：为Judge选中的文章草拟吸引人的脚本，确保听众能清晰、准确地理解。这里收听：https://www.simplynews.ai/

a16z发布了他们最新调查的前100个生成式AI应用，这次会包括移动应用，里面有些数据分析很有意思

a16z发布了他们最新调查的前100个生成式AI应用，这次会包括移动应用，里面有些数据分析很有意思下面是一些报告中的要点：ChatGPT每月接近20亿次网络访问量，大约是榜单上第二名公司Bard（现在是Gemini）的五倍。在所谓的新来者中，排名最高的包括AI研究副驾驶Liner；Anthropic的通用助手Claude；以及三个未经审查的AI伴侣应用程序：JanitorAI、Spicychat和CrushOn。有五家人工智能公司真正实现了“跨界”，旗下的网络产品和移动应用都进入了前50名单：ChatGPT、CharacterAI、聊天机器人聚合平台Poe，以及图像编辑器Photoroom和Pixelcut。ChatGPT的规模大约是第二和三名选手微软Edge和Photomath的2.5倍截至2024年1月，有九个人工智能产品或社区在邀请流量排名前100的Discord服务器中，其中Midjourney位居榜首。该列表中的第二个显著新类别是生产力。AI原生平台可以提升人们与软件的互动，使他们能够委派琐碎的任务并减少在行政开销上花费的时间。生产力类别包括排名中的七家公司：Liner、Eightify、Phind、MaxAI、BlackboxAI、Otterai和ChatPDF。对于那些有移动应用的伴侣产品来说，用户参与度异常高。在这个类别中最成功的产品成为用户日常生活的核心部分，变得和给朋友发短信一样普遍（甚至更普遍！）。这玩意是真赚钱啊。根据SensorTower的数据，CharacterAI每个用户平均每月有298个会话，而PolyAI平均有74个会话。AI在移动应用和Web上的使用类别有很大的区别。一般来说，Web产品支持更复杂、多步骤的工作流程，涉及内容生成和编辑。这些产品包括AI语音工具包ElevenLabs、AI艺术生成器Leonardo和AI演示文稿生成器Gamma，它们在基于Web的AI产品中排名前20位。应用列表中有七个专用的头像产品；大多数人手机上保存的许多自拍照作为可随时使用的训练数据。此外，排名前三的应用——Facemoji（第9名）、Bobble（第31名）和Genie（第37名）——是专为移动设备设计的键盘应用，可以帮助用户发送带有AI辅助的文本。

#晚安提示词看 Midjoureny 的探索页面的时候发现了一个很有意思的效果。

#晚安提示词看Midjoureny的探索页面的时候发现了一个很有意思的效果。很像修真小说里面的画面，一个人虚空走在很多写着经书的布料上面。优化了一下提示词，去掉了原来矮小的说明和一些词。加了权重。需要注意的是，这个提示词生成的人物总会有问题，如果氛围好人物有问题的话可以用局部重绘试一试。为了让画面更丰富我还加了一个--c10。提示词：DroneView.AnancientChinesecultivatorwalksamongmanyundulatingscrollsofcalligraphyandpaintings.Thescrollsarecoveredwithcalligraphiccharacters.HeisholdingalongswordandwearingaflowingsilkChinesedresswithlonghairflowinginthewind::33DrenderingofaChineseinkpaintingscene.Palegoldandemeraldgreen.Thescenelooksgrandinscalefromabove.Clearlightandshadow,subtlestarlightfloatinginthesky,creatingadreamysurrealatmosphere.Ultra-highresolution,theoverallcompositionisveryartisticandspatial.Brushstrokes,softflow,historypainting,3Drendering::1--chaos10--ar16:9--styleraw--stylize250

一个非常有意思的项目可以用 SD 直接生成透明的 PNG 图片，也可以直接生成带有透明度分层的图片。#ai画图#

一个非常有意思的项目可以用SD直接生成透明的PNG图片，也可以直接生成带有透明度分层的图片。这个想象力很大能带来很多玩法。也可以使用现有的SD社区模型。项目介绍：LayerDiffusion使得大型已经过预训练的潜在扩散模型（latentdiffusionmodel）能够创造透明图像。这项技术不仅可以生成单独的透明图像，还能生成多层透明图层。它通过一种被称为“潜在透明度”的方法，将透明度（即alpha通道）整合到预训练的潜在扩散模型的潜在结构中。这样做的好处是，它通过以潜在偏移的形式加入透明度，几乎不改变模型原有的潜在分布，从而保持了模型的高质量输出能力。基于这种方法，任何一个潜在扩散模型都可以通过对潜在空间的微调，转化为透明图像生成器。我们训练这个模型时，使用了一种涉及人机互动的方法，收集了一百万组透明图像层数据。我们的研究显示，这种潜在透明技术不仅可以应用于不同的开源图像生成器，还可以适配多种条件控制系统，实现例如基于前景/背景条件的层生成、层的联合生成、对层内容进行结构控制等多种应用。一项用户研究发现，大多数情况下（97%），相比于之前的临时解决方案（如先生成图像再进行抠图处理），用户更喜欢我们直接生成的透明内容。用户还表示，我们生成的透明图像在质量上可媲美真实的商业级透明素材，例如AdobeStock提供的素材。论文地址：

微软提出的TaskMatrix.AI，想通过大模型和数百万个API来完成任务还是有意思的。

微软提出的TaskMatrix.AI，想通过大模型和数百万个API来完成任务还是有意思的。TaskMatrix.AI:CompletingTasksbyConnectingFoundationModelswithMillionsofAPIs链接：https://arxiv.org/pdf/2303.16434.pdf论文中提出的这个TaskMatrix.AI主要是想理解多模态的输入，然后生成代码，代码里面调用API来完成任务。它有统一格式的API平台和任务库，方便开发人员定制模型，也方便大模型调用。TaskMatrix.AI拥有终身学习能力，可以通过学习组合模型和API来完成新任务，而且这是可以解释的。关键组件有四个：-多模态对话模型-API平台-APISelector-APIExecutor论文中还使用RLHF来提高多模态模型和APISelector的能力。能够完成的任务：-视觉任务，比如图像编辑，图像问答等-多模态长内容生成，比如生成图文-自动化比如：操控手机，浏览器-访问云服务比如:发现新API-控制物联网设备比如：机器人，家用智能设备我的想法，大模型或者多模态模型出现确实提高了以前对话系统的能力，以前智能音箱大战畅想的很多东西都可以拿出来继续做。

Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做

AndrejKarpathy提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做的不好。同时他还把前几天自己的视频教程转成了文字内容，觉得视频太浪费时间的可以看文本。AK设想的完整工作流：一个有趣的大语言模型(LargeLanguageModel)挑战是：将我的2小时13分钟的分词器视频转换成一本书的章节（或者博客文章）形式，专门讨论分词。具体步骤如下：为视频添加字幕或解说文字。将视频切割成若干带有配套图片和文字的段落。利用大语言模型的提示工程技术，逐段进行翻译。将结果输出为网页形式，其中包含指向原始视频各部分的链接。从更广泛的角度来看，这样的工作流程可以应用于任何视频输入，自动生成各种教程的“配套指南”，使其格式更加便于阅读、浏览和搜索。这听起来是可行的，但也颇具挑战。LLMTokenization课程文字版本：

相关推荐