听完播客最大的感受是：AI行业的非技术人员，如果愿意读论文和测 demo，投资回报率(ROI)将会极高。

听完播客最大的感受是：AI行业的非技术人员，如果愿意读论文和测 demo，投资回报率(ROI)将会极高。一、先说测 demo 多体验demo,多做实验,实际上是在培养我们的认知和思考能力,思考在工程和产品上还有哪些机会可以探索。因为这个行业还处于早期阶段,我们付出一点小小的努力,就能获得很高的投资回报率(ROI)。 1、往大了说，可以发现很多潜在机会在这个过程中,我们会发现一个模型要真正运行起来并不像想象中那么简单。它涉及很多环节,包括数据处理、参数设置等。解决每一个问题的过程中,你可能会发现一些潜在的产品机会。比如,有时候Hidecloud在配置模型时,就会突然发现这个模型产生的结果挺有趣的。但普通用户根本无法直接使用,因为它涉及到很复杂的数据预处理环节。以声音克隆为例,如果讲一分钟的话来克隆,不是直接就能克隆的。那一分钟的内容，需要经过七八步复杂的预处理,普通人很难独立完成。如果普通人搞不定,这不就是一个机会吗?如果我们能帮他们完成整个数据预处理和训练过程,直接交付最终效果,这不也是一个机会吗? 但如果我们不亲自去体验,首先无法感受到看到最终结果那一刻的喜悦,其次也不会知道要达到那个效果还会遇到哪些障碍。 2、往小了看，能甩开国内同行一大截在Twitter上,偶尔会有一些外国人分享有趣的小产品。比如，有人发布了一个有趣的小产品,在聊天过程中你要去猜测对方是AI还是真人。这种东西挺有意思，但国内似乎还没有人做类似的产品。更简单一点,我们可以尝试自己写个GPTs。这种事情不需要编程,对吧?但说实话,就像Hidecloud平时面试产品经理,会问他们有没有尝试过创建自己的GPTs? 可能十个人里面九个都会被Hidecloud淘汰,因为大家还是不太愿意亲自动手,更喜欢看别人的成果。但一旦我们亲自动手,获得的信息量会比看视频或阅读文档都要大得多。二、再说读论文 1、只需8篇核心论文，显著提高认知水平作为产品经理，学习AI的一个有效途径就是阅读论文。 Hidecloud之前总结过Stable Diffusion的发展历史，从2020年至今，这三年间的关键信息其实并不多，大约只有八篇经典论文，把它们串起来就能清楚地理解整个原理。

在Telegram中查看

相关推荐

同时，在特定领域，我们至少需要通读八九篇核心论文，这样才能基本理解，并解释为什么某篇论文让我们感到兴奋。

同时，在特定领域，我们至少需要通读八九篇核心论文，这样才能基本理解，并解释为什么某篇论文让我们感到兴奋。未来五到十年里，很多现在的知识可能会变成常识。到那时，了解与否的差异可能并不显著。但在当前，通过阅读论文获得的信息量是巨大的，它能显著提高我们的认知水平，帮助你做出更准确的判断。 2、去哪找论文，怎么读论文？那么，想要找到新颖或高质量的论文，我们应该去哪里呢？可以关注一些知名平台，如百度学术，或是OpenAI的Andrej Karpathy，看看他们推荐了哪些论文。实际上，你需要让自己沉浸在学术环境中，对感兴趣的论文深入阅读。Hidecloud个人习惯一天至少读两到三篇。 Hidecloud通常将论文分为两类：一类是他认为具有范式创新的，另一类是技术细节有所改进的。对于后者，Hidecloud会快速阅读，关注他们具体优化了哪些方面，提升了多少。但对于那些具有范式创新的论文，Hidecloud会仔细研读。阅读论文的好处是巨大的，它能直接帮助我们在产品设计和技术改进上取得实际成效。比如一些论文不仅提出新模型,还包含了工程优化的技巧,比如加速模型推理等。产品经理阅读这些内容后,可以直接应用于产品中,提升性能。更重要的是，通过阅读前沿论文，可以及时了解最新模型的能力边界,以及新出现的技术创新点。进而，重新审视传统问题，开拓新的解决思路。这种全新的思考方式，有可能带来行业颠覆性的创新机会。三、读完论文、测完demo，如何产研协同？ 1、之前产品更依赖工程师传统的软件开发模式中,产品经理负责需求分析和功能设计,然后把需求文档交给工程师,由工程师将这些抽象的业务逻辑转化为具体的代码实现。这个过程需要产品经理和工程师密切配合,但两个角色的职责划分还是比较明确的。 2、现在产品也能做点开发而现在,一些低代码(Low-code)或无代码(No-code)开发平台的出现,让非技术背景的人也能通过可视化的方式快速构建应用。比如使用自然语言描述业务流程,然后自动生成可执行的工作流(Workflow)。这在一定程度上降低了开发门槛,产品经理可以更直接地参与到原型设计和功能实现中来。 3、工程师可能更专注后台问题借助大语言模型的能力,产品经理用自然语言描述的复杂业务逻辑,可能会被自动转换成更加结构化、标准化的中间表示,如可视化的流程图(pipeline)或特定领域语言(DSL)等形式。这种表示一方面可以清晰地呈现业务逻辑,另一方面也更容易转化为最终的代码实现。在这种趋势下,产品经理在功能决策上可能会有更大的自主权,可以通过灵活组合各种逻辑单元来快速响应业务变化。而工程师则会更专注于系统架构、性能优化、弹性扩展等技术问题,去建设一个高可用、高并发的稳定平台。

练手项目：基于ReAct手搓一个Agent Demo

练手项目：基于ReAct手搓一个Agent Demo “这里基于ReAct的方式，我们手动制作了一个最小的Agent结构（其实更多的是调用工具），暑假的时候会尝试将React结构修改为SOP结构。一步一步手写Agent，可能让我对Agent的构成和运作更加的了解。以下是ReAct论文中一些小例子。”

惊喜发现又祛魅一项能力：读论文

惊喜发现又祛魅一项能力：读论文 CS 专业一路走来被论文折磨，现以为脱离苦海，但又不得不紧跟看 LLM SD 论文，痛点就是：看不下去，精神涣散啃能读完，但留不脑痕我找到了一个适合自己的方法 1⃣祛魅，不畏难与学界的朋友多交谈之后，逐渐理解论文掐头去尾直接看核心思想是可以很快用大白话解释的。我很大程度是因为怕数学、怕文字、怕章节，而不是真的这些概念难。比如 Transformer 这篇论文公认的“写”得烂。不信权威，祛魅格式。思想一般就两三个创新点。 2⃣虚拟心理环境假想我是那些厉害的学界大佬，他们是如何如呼吸一般的读这些论文的呢？预加载他们的心理环境。我会假想自己是一个很厉害的数学学家（然后跳过数学证明 hhh） 3⃣ 专注：用划线工具和沉浸式翻译我使用 Glasp 插件（免费、可 notion 同步、有数据库管理界面、标签系统），双语阅读可以用沉浸式翻译、Aminer、Yiyibooks 哪个顺手用哪个。 arxiv 论文可以用沉浸式翻译+Glasp 直接划线高亮记录和评论，还自动保存数据库方便后期整理。不喜欢经常打断的复制粘贴。划线让我专注。 4⃣ GPT 如何过脑子留下点东西？看完后或看的时候一定要提问。为什么它这样做实验？为什么解决这个问题？解决的怎么样？之后还要做什么？如果比较久远的经典论文，问 GPT 可以直接得到答复。 5⃣ 自己的话记录这个环节就是强化留给自己脑子的东西。自己写出来的才是真正理解了的概念。用自己的大白话解释一遍，就真的懂论文了。比如我会写“transformer 架构就是叠了很多层一样的 block，每个 block 里面有 Q K V 三个矩阵” blablabla 推荐从下面的精选开始读经典论文：

看GPT-4现场demo的感想：

看GPT-4现场demo的感想： 1. 相比于官方宣传里强调的GPT-4在SAT、GRE考试上取得的成绩，它在多模态中展现出的能力更加让人感到惊艳。Demo中，Greg尝试了几张截图和照片，GPT-4都能够详细地讲述内容和细节，甚至可以根据一张手绘的草图写出对应的网页HTML代码。等视觉方面的能力开放出来之后我想要好好试试。 2. 在demo中，GPT-4基于开发者文档的内容提出有效的解决方案和代码，基于法律条文解答税务问题，并用通俗易懂的语言一步一步地解释，这种使用方式非常有趣。现实社会中的很多文章并不是为普通人写的：从法律条文到专业文献再到开发者文档，写作所追求的往往是准确度、覆盖面、专业度，但偏偏并不是普通人易读性。因此，我们需要雇佣专业工作者，例如律师、咨询顾问，来作为中间的桥梁，从一个实际问题中找到对应的文献，获得准确的解答。Demo中展示出来的效果是，GPT-4可以做类似的事情，基于专业文献找到答案，用通俗易懂的语言解答个人的疑问，达到为普罗大众赋能的作用。 3. 和上面第二点相关，像是专业的工具文档，之前是针对开发者写作，那未来是否会变为针对LLM写作，从格式到内容到呈现方式，都为了能够更好地被模型输入而优化？ 4. OpenAI的现场demo感觉非常好，苹果为硬件产品发布会树立了标杆，OpenAI为AI软件发布会也树立了一个好的榜样。 5. 一遍一遍提醒自己做预期管理：不要根据demo去推断GPT-4的能力，还是得到手之后试试。Interpolation不可取……

开源了，这是一个足够简单（调用ChatGPT的API）却又功能俱全（有登录和支付）的demo级产品。

开源了，这是一个足够简单（调用ChatGPT的API）却又功能俱全（有登录和支付）的demo级产品。 [技术栈] 前后端：Next.js+Tailwind+Prisma 登录：Next-Auth 支付：Lemon Squeezy 部署：Vercel 你可以基于这个项目快速开发自己的SaaS产品。求Star：如果你对以上技术栈不熟悉，可以到这里边学边练：

如何阅读论文? || #经验 #论文

如何阅读论文? || #经验 #论文摘要研究人员在阅读研究论文上花费了大量时间。然而，这项重要技能往往没有得到适当的教授，导致了许多不必要的努力浪费。本文提出了一种实际高效的阅读研究论文的三遍方法，并讲述了如何利用这种方法进行文献调研。 1. 引言研究人员阅读论文的原因多种多样：可能是为了会议或课程的审阅，为了跟上他们领域的最新动态，或为了对一个新领域进行文献调研。一个典型的研究人员可能每年要花费数百小时阅读论文。学习高效阅读论文是一项至关重要但鲜少教授的技能。因此，刚入门的研究生不得不靠自己摸索，通过试错来学习。在这个过程中，学生不仅浪费了大量努力，还常常陷入挫败感。多年来，我一直在使用一个简单有效的方法来高效地阅读论文。这篇文章介绍了这种“三遍阅读”方法，以及如何用它来做文献调查。 2. 三遍阅读法核心思想是进行最多三遍阅读，而不是从头到尾连贯阅读。每一遍阅读都有特定的目标，并在前一遍的基础上深入：第一遍给你一个关于论文的总体印象。第二遍让你掌握了论文的内容，但不深入细节。第三遍帮助你深入理解论文。 2.1 第一遍阅读第一遍是快速浏览，获取论文的整体框架。你还可以决定是否需要更深入地阅读。这遍阅读大约需要五到十分钟，包括以下步骤： 1. 仔细阅读标题、摘要和引言。 2. 浏览章节和小节的标题，但忽略其他内容。 3. 阅读结论部分。 4. 粗略查看参考文献，心里检查你已经阅读过的内容。在第一遍阅读结束时，你应该能够回答以下五个问题： 1. 类别：这篇论文属于哪种类型？是测量研究？现有系统的分析？还是研究原型的描述？ 2. 背景：它与哪些其他论文有关联？用了哪些理论基础来分析问题？ 3. 正确性：它的假设看起来合理吗？ 4. 贡献：论文的主要贡献是什么？ 5. 清晰度：这篇论文写得清楚吗？根据这些信息，你可能会选择不再深入阅读。这可能是因为论文内容不吸引你，或者你对该领域了解不足，无法充分理解论文，或者作者的假设不成立。对于不属于你研究领域但未来可能相关的论文，第一遍阅读通常已足够。 2.2 第二遍阅读第二遍阅读时，需更细致地阅读论文，但可以忽略诸如证明等细节。边读边记下关键点或在边缘作笔记会很有帮助。 1. 仔细检查论文中的图形、图表和其他插图。特别留意图表。轴线是否标注清晰？结果是否带有误差范围，以便得出统计上有意义的结论？这些常见错误会帮助你区分仓促和精心的工作。 2. 记得标记那些相关但未读的参考文献，以备后续阅读（这是深入了解论文背景的好方法）。第二遍阅读大约需要一个小时。在这遍阅读后，你应该能够理解论文的内容，并能够向别人概述论文的主要观点及其支持证据。这种详细程度适合于你感兴趣但并非你研究专长的论文。 2.3 第三遍阅读要彻底理解一篇论文，特别是作为审稿人时，需要进行第三遍阅读。这遍阅读的关键是尝试实际重现论文的工作：也就是说，在与作者相同的假设下，尝试再创造他们的工作。通过这种重建与实际论文的对比，你可以更容易地识别出论文的创新之处以及它潜在的不足和假设。这次阅读要求极高的注意力。你应该质疑每个陈述中的每个假设，并思考如果是你，会如何表达某个特定的想法。这种实际与理想的比较可以带来对论文证明和展示技巧的深刻洞察，这些技巧可能会成为你的宝贵工具。在这遍阅读中，你还应该记录下未来工作的灵感。对于初学者来说，这次阅读可能需要四到五个小时，对于经验丰富的读者则大约一个小时。在这遍阅读的最后，你应该能够完全理解论文的内容，包括它的创新之处、主要论点、技术论证，以及任何你认为值得进一步探讨的方面。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人