最近在 kimi 和 ChatGPT 的帮助下，逐字逐句地精读了三篇AI相关的文章，觉得收获非常大。

最近在 kimi 和 ChatGPT 的帮助下，逐字逐句地精读了三篇AI相关的文章，觉得收获非常大。很多困扰我已久的问题，在这三篇文章里看到了些线索。比如，生成式 AI 生成的内容，当前无法实现精准控制，这个问题是否就无解呢？其实不是的，第一篇文章中就提到了他们的解法。再比如，RAG 在处理幻觉方面这么牛，各种 RAG 技术的通用性如何呢？答案可能没那么乐观，因为他们可能只是某个特定 use case 上做得很好，但不意味着可以轻易推广到其他所有场景。

在Telegram中查看

相关推荐

elvis写了一篇非常详细的文章来介绍 RAG 生态的所有部分，还会添加清晰易懂的参考文献列表以及技术性编程教程帮助提高 RAG

elvis写了一篇非常详细的文章来介绍 RAG 生态的所有部分，还会添加清晰易懂的参考文献列表以及技术性编程教程帮助提高 RAG 系统的性能。主要内容来自《大语言模型的检索增强生成：一项调查》这篇论文，我简要总结了一下文章每个部分的内容，感兴趣可以去看原文：检索增强生成（Retrieval Augmented Generation, RAG）技术，旨在通过结合外部知识源，如数据库，来提升大语言模型（LLMs）的能力。它主要用于解决领域知识的缺失、事实性问题和生成错误。RAG特别适用于那些需要最新知识、又不需针对每个特定任务重复训练LLM的应用场景，比如对话代理和知识密集型任务。 RAG如何工作 RAG通过接收输入的提示信息，从资源如维基百科中检索相关文档，再将这些文档作为上下文来生成回答。这种方法使LLMs能够访问最新的信息，并生成更准确、更可控、更相关的内容。它能及时适应不断变化的信息，这对于LLM来说至关重要，因为它们的知识库本身是静态的。 RAG系统的发展 RAG系统已经从初级阶段（Naive RAG）发展到高级阶段（Advanced RAG）和模块化阶段（Modular RAG），以解决性能、成本和效率的限制。高级RAG通过优化不同阶段，如预检索、检索和检索后处理，来提高检索质量。模块化RAG则通过调整不同的功能模块来适应特定问题的背景，提供了更大的灵活性。 RAG系统的关键组成检索：包括提升语义表示、对齐查询与文档，以及调整检索器输出以符合LLM的偏好。生成：涉及将检索到的信息转化为连贯的文本，并在检索后对LLM进行微调。增强：在生成任务中融合检索到的段落的上下文，包括不同阶段和增强数据源。 RAG与模型微调 RAG适合用于集成新知识，而模型微调则有助于提升模型的性能和效率。这两种方法可以互补，结合提示工程（Prompting Engineering），能够优化LLM在复杂和可扩展应用中的表现。 RAG的评估 RAG系统的评估基于检索到的上下文质量和生成的内容质量。评估指标包括规范化折扣累计增益（NDCG）、命中率、F1值和精确匹配（EM）等。评估重点是上下文的相关性、答案的准确性和相关性，以及抗噪声能力和信息整合能力。 RAG面临的挑战与未来展望

彭博社的一篇文章《》称：

彭博社的一篇文章《》称：一名德国高中老师 Christoph Schuhmann 创立了一个名为“Large-scale AI Open Network”（LAION）的免费AI训练数据集。该数据集已经包含了超过50亿张图片，并被广泛应用于训练文本到图像生成器，如Google的Imagen和Stable Diffusion。Schuhmann和他的志愿者团队从各大网站如Pinterest、Shopify和亚马逊网络服务等爬取了大量图像，并与之关联描述性文本，最终形成了目前最大的免费图像和标题数据集。此举引发了一系列道德和法律问题，例如是否可以利用公共可用的材料来构建数据库，以及这些创作者是否应该得到报酬。虽然Stability AI和Midjourney等公司因版权侵犯而面临诉讼，但Schuhmann并不担心这些问题，他只想将数据开放出来。摘要来自 ChatGPT

本月收到 500 多篇 ChatGPT 生成的文章，科幻杂志 Clarkesworld 宣布关闭投稿渠道

本月收到 500 多篇 ChatGPT 生成的文章，科幻杂志 Clarkesworld 宣布关闭投稿渠道杂志编辑 Neil Clarke 表示近期收到了大量由 ChatGPT 生成的科幻故事投稿，在今年 2 月份数量激增至 500 多篇，今年 1 月数量为 100 篇，去年 10 月则为 25 篇。 ChatGPT 等大型语言模型 (LLM) 已经在数百万本书和网站上进行了训练，可以快速创作原创故事。然而，它们不是自主工作的，人类必须通过提示引导它们的输出，然后 AI 模型会尝试自动完成。 Clarkesworld 自 2006 年以来，出版了著名科幻作家的作品，并多次获得雨果奖。在科幻出版物中，它以开放提交流程而享誉业内，通常每字支付 12 美分。在其提交页面上，该出版物声明，“我们目前不考虑由 AI 编写、合写或协助的故事”。Clarkesworld 官网虽然明确不再接受 AI 生成的投稿，但依然有很多人为了金钱而投稿。来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

最近拜读了去年火热的斯坦福AI小镇文章的作者Joon Sung Park的两篇文章，分别是22年的Social Simulacr

最近拜读了去年火热的斯坦福AI小镇文章的作者Joon Sung Park的两篇文章，分别是22年的Social Simulacra和23年的Generative Agents（斯坦福AI小镇本文）。两篇都发在交互顶会UIST上（后者得了best paper）比起Generative agents，22年发表的Social Simulacra聚焦于一个更小的领域- 交互设计原型（prototyping）。具体的思路是：交互原型设计师常常需要了解一个设计的效果，目前的常用做法是招募少量的真人做用户调查。然而，现实情况下，少量用户的反馈往往并不能体现出这个设计的实际效果，或者使用的潜在隐患。这是因为“用户的行为会彼此影响”。作者在这里举了“反社会行为”作为例子，比如说，一个人在使用社交媒体时，可能只会根据自己的信息发表观点，但是当很多人都参与讨论时，就会带来煽动性言论（inflammatory comments）或者钓鱼引战（trolling）等现象。这样的问题在小规模的用户测试中是无法被检测到的。为了在“设计阶段”就能了解到大规模用户可能涌现的群体行为，有一种特定的方法叫做social computing system。这个方法可以看作代理人基模型（agent-based model）在设计学中的应用。尽管代理人基模型在其他学科里已经有很广泛的应用了，但是在设计和用户体验方面的探索还很少，这是本研究的一个创新点。这篇文章的另一个亮点在于，使用了大语言模型（llm）：首先，设计师把自己的设计意图输入给语言模型，然后语言模型生成一系列的用户行为（比如发帖/回复）。基于大量社交媒体数据训练的GPT3，已经足够生成各种积极或者消极的回复，其中也包含作者关注的反社会行为。最后，作者通过用户实验＋一个类似于图灵实验的方式来说明这个方法的有效性：让用户区分真实的用户行为，和使用Social Simulacra生成的用户行为。结果显示，用户在超过40%的数据上都无法判断这是真人还是生成数据，这说明了Social Simulacra在模拟真实用户的表现上效果很好。阅读22年的Social Simulacra一文，可以看到很多Generative agents的影子：二者都使用了大语言模型（GPT3和GPT3.5），二者都尝试用llm去模拟人（一种是社交媒体行为，一种是生活行为），二者都考虑到了人类互相影响所带来的1+1＞2的集体效应，并尝试用技术的方法去模拟这种人类群体效应。两句话总结体会：1. 阅读Social Simulacra对于理解Generative Agents的想法有很大的帮助，两者结合更可以体现作者思考的连贯性。2. 此外，作者对前沿技术的敏感也让人惊讶。想到这篇文章要在22年3月投稿，而gpt3在20年6月才首次发布beta版本。要在很短的时间内把一项尚不成熟的技术用于解决跨学科问题，作者的技术嗅觉真是很准确也很超强啊。

今天发现了一篇非常牛皮的内容，详细的介绍了AI视频生成中所有的技术分类和对应技术的优劣势，还有对应的工具以及典型的案例。

今天发现了一篇非常牛皮的内容，详细的介绍了AI视频生成中所有的技术分类和对应技术的优劣势，还有对应的工具以及典型的案例。基本上看完就能对AI视频生成有比较完整的了解，所以顺手翻译了一下，一起来看看《生成式 AI 动画技术概述》。这篇文章旨在吸引任何对此好奇的人，特别是那些可能对动画领域飞速发展感到不知所措的其他动画师和创意工作者。希望这篇文章能帮助你快速跟上潮流，并让你对这个领域有更深入的了解，而不仅仅是浏览 TikTok 上的简短内容。翻译及原文链接：

ChatGPT 浏览器扩展精选

ChatGPT 浏览器扩展精选 1. DetectGPT - 检测由神经网络编写的文本。在浏览网页时识别 AI 生成的内容。(Chrome 浏览器） 2. CheatScrub GPT Detector - 类似的插件，但功能更多。(火狐浏览器） 3. ChatGPT for Search Engines - 将 ChatGPT 集成到浏览器搜索栏中。(Chrome、Firefox、Edge） 4.Ghostwrite：ChatGPT电子邮件助手 - 可帮您撰写电子邮件的智能服务。(Chrome 浏览器） 5. Casper AI - 用于执行各种任务的智能助手。例如，可以制作一篇文章的简述。(Chrome) 6. ChatGPT Writer - 适用于所有页面，可修复错误、撰写文本、摘要等。(Chrome） 7. GPT for Sheets - “智能版“谷歌表格。(Chrome） 8. ChatGPT for YouTube - 制作 YouTube 视频摘要。(Chrome） 9. ChatGPT File Uploader Extended - 允许您将文件上传到 ChatGPT。(Chrome 浏览器） 10. editGPT - 允许您编辑神经网络生成的文本。(Chrome 、火狐、Edge） #AI #tools

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人