听完播客最大的感受是:AI行业的非技术人员,如果愿意读论文和测 demo,投资回报率(ROI)将会极高。

听完播客最大的感受是:AI行业的非技术人员,如果愿意读论文和测 demo,投资回报率(ROI)将会极高。 一、先说测 demo 多体验demo,多做实验,实际上是在培养我们的认知和思考能力,思考在工程和产品上还有哪些机会可以探索。 因为这个行业还处于早期阶段,我们付出一点小小的努力,就能获得很高的投资回报率(ROI)。 1、往大了说,可以发现很多潜在机会 在这个过程中,我们会发现一个模型要真正运行起来并不像想象中那么简单。它涉及很多环节,包括数据处理、参数设置等。解决每一个问题的过程中,你可能会发现一些潜在的产品机会。 比如,有时候Hidecloud在配置模型时,就会突然发现这个模型产生的结果挺有趣的。但普通用户根本无法直接使用,因为它涉及到很复杂的数据预处理环节。以声音克隆为例,如果讲一分钟的话来克隆,不是直接就能克隆的。那一分钟的内容,需要经过七八步复杂的预处理,普通人很难独立完成。 如果普通人搞不定,这不就是一个机会吗?如果我们能帮他们完成整个数据预处理和训练过程,直接交付最终效果,这不也是一个机会吗? 但如果我们不亲自去体验,首先无法感受到看到最终结果那一刻的喜悦,其次也不会知道要达到那个效果还会遇到哪些障碍。 2、往小了看,能甩开国内同行一大截 在Twitter上,偶尔会有一些外国人分享有趣的小产品。比如,有人发布了一个有趣的小产品,在聊天过程中你要去猜测对方是AI还是真人。这种东西挺有意思,但国内似乎还没有人做类似的产品。 更简单一点,我们可以尝试自己写个GPTs。这种事情不需要编程,对吧?但说实话,就像Hidecloud平时面试产品经理,会问他们有没有尝试过创建自己的GPTs? 可能十个人里面九个都会被Hidecloud淘汰,因为大家还是不太愿意亲自动手,更喜欢看别人的成果。但一旦我们亲自动手,获得的信息量会比看视频或阅读文档都要大得多。 二、再说读论文 1、只需8篇核心论文,显著提高认知水平 作为产品经理,学习AI的一个有效途径就是阅读论文。 Hidecloud之前总结过Stable Diffusion的发展历史,从2020年至今,这三年间的关键信息其实并不多,大约只有八篇经典论文,把它们串起来就能清楚地理解整个原理。

相关推荐

封面图片

练手项目: 基于ReAct手搓一个Agent Demo

练手项目: 基于ReAct手搓一个Agent Demo “这里基于ReAct的方式,我们手动制作了一个最小的Agent结构(其实更多的是调用工具),暑假的时候会尝试将React结构修改为SOP结构。 一步一步手写Agent,可能让我对Agent的构成和运作更加的了解。以下是ReAct论文中一些小例子。”

封面图片

同时,在特定领域,我们至少需要通读八九篇核心论文,这样才能基本理解,并解释为什么某篇论文让我们感到兴奋。

同时,在特定领域,我们至少需要通读八九篇核心论文,这样才能基本理解,并解释为什么某篇论文让我们感到兴奋。 未来五到十年里,很多现在的知识可能会变成常识。到那时,了解与否的差异可能并不显著。但在当前,通过阅读论文获得的信息量是巨大的,它能显著提高我们的认知水平,帮助你做出更准确的判断。 2、去哪找论文,怎么读论文? 那么,想要找到新颖或高质量的论文,我们应该去哪里呢?可以关注一些知名平台,如百度学术,或是OpenAI的Andrej Karpathy,看看他们推荐了哪些论文。实际上,你需要让自己沉浸在学术环境中,对感兴趣的论文深入阅读。Hidecloud个人习惯一天至少读两到三篇。 Hidecloud通常将论文分为两类:一类是他认为具有范式创新的,另一类是技术细节有所改进的。 对于后者,Hidecloud会快速阅读,关注他们具体优化了哪些方面,提升了多少。但对于那些具有范式创新的论文,Hidecloud会仔细研读。 阅读论文的好处是巨大的,它能直接帮助我们在产品设计和技术改进上取得实际成效。比如一些论文不仅提出新模型,还包含了工程优化的技巧,比如加速模型推理等。产品经理阅读这些内容后,可以直接应用于产品中,提升性能。 更重要的是,通过阅读前沿论文,可以及时了解最新模型的能力边界,以及新出现的技术创新点。进而,重新审视传统问题,开拓新的解决思路。这种全新的思考方式,有可能带来行业颠覆性的创新机会。 三、读完论文、测完demo,如何产研协同? 1、之前产品更依赖工程师 传统的软件开发模式中,产品经理负责需求分析和功能设计,然后把需求文档交给工程师,由工程师将这些抽象的业务逻辑转化为具体的代码实现。 这个过程需要产品经理和工程师密切配合,但两个角色的职责划分还是比较明确的。 2、现在产品也能做点开发 而现在,一些低代码(Low-code)或无代码(No-code)开发平台的出现,让非技术背景的人也能通过可视化的方式快速构建应用。 比如使用自然语言描述业务流程,然后自动生成可执行的工作流(Workflow)。这在一定程度上降低了开发门槛,产品经理可以更直接地参与到原型设计和功能实现中来。 3、工程师可能更专注后台问题 借助大语言模型的能力,产品经理用自然语言描述的复杂业务逻辑,可能会被自动转换成更加结构化、标准化的中间表示,如可视化的流程图(pipeline)或特定领域语言(DSL)等形式。这种表示一方面可以清晰地呈现业务逻辑,另一方面也更容易转化为最终的代码实现。 在这种趋势下,产品经理在功能决策上可能会有更大的自主权,可以通过灵活组合各种逻辑单元来快速响应业务变化。而工程师则会更专注于系统架构、性能优化、弹性扩展等技术问题,去建设一个高可用、高并发的稳定平台。

封面图片

惊喜发现又祛魅一项能力:读论文

惊喜发现又祛魅一项能力:读论文 CS 专业一路走来被论文折磨,现以为脱离苦海,但又不得不紧跟看 LLM SD 论文,痛点就是:看不下去,精神涣散啃能读完,但留不脑痕 我找到了一个适合自己的方法 1⃣祛魅,不畏难 与学界的朋友多交谈之后,逐渐理解论文掐头去尾直接看核心思想是可以很快用大白话解释的。我很大程度是因为怕数学、怕文字、怕章节,而不是真的这些概念难。 比如 Transformer 这篇论文公认的“写”得烂。 不信权威,祛魅格式。思想一般就两三个创新点。 2⃣虚拟心理环境 假想我是那些厉害的学界大佬,他们是如何如呼吸一般的读这些论文的呢?预加载他们的心理环境。 我会假想自己是一个很厉害的数学学家(然后跳过数学证明 hhh) 3⃣ 专注:用划线工具和沉浸式翻译 我使用 Glasp 插件(免费、可 notion 同步、有数据库管理界面、标签系统),双语阅读可以用沉浸式翻译、Aminer、Yiyibooks 哪个顺手用哪个。 arxiv 论文可以用沉浸式翻译+Glasp 直接划线高亮记录和评论,还自动保存数据库方便后期整理。 不喜欢经常打断的复制粘贴。划线让我专注。 4⃣ GPT 如何过脑子留下点东西? 看完后或看的时候一定要提问。为什么它这样做实验?为什么解决这个问题?解决的怎么样?之后还要做什么? 如果比较久远的经典论文,问 GPT 可以直接得到答复。 5⃣ 自己的话记录 这个环节就是强化留给自己脑子的东西。自己写出来的才是真正理解了的概念。用自己的大白话解释一遍,就真的懂论文了。 比如我会写“transformer 架构就是叠了很多层一样的 block,每个 block 里面有 Q K V 三个矩阵” blablabla 推荐从下面的精选开始读经典论文:

封面图片

开源了,这是一个足够简单(调用ChatGPT的API)却又功能俱全(有登录和支付)的demo级产品。

开源了,这是一个足够简单(调用ChatGPT的API)却又功能俱全(有登录和支付)的demo级产品。 [技术栈] 前后端:Next.js+Tailwind+Prisma 登录:Next-Auth 支付:Lemon Squeezy 部署:Vercel 你可以基于这个项目快速开发自己的SaaS产品。 求Star: 如果你对以上技术栈不熟悉,可以到这里边学边练:

封面图片

看GPT-4现场demo的感想:

看GPT-4现场demo的感想: 1. 相比于官方宣传里强调的GPT-4在SAT、GRE考试上取得的成绩,它在多模态中展现出的能力更加让人感到惊艳。Demo中,Greg尝试了几张截图和照片,GPT-4都能够详细地讲述内容和细节,甚至可以根据一张手绘的草图写出对应的网页HTML代码。等视觉方面的能力开放出来之后我想要好好试试。 2. 在demo中,GPT-4基于开发者文档的内容提出有效的解决方案和代码,基于法律条文解答税务问题,并用通俗易懂的语言一步一步地解释,这种使用方式非常有趣。现实社会中的很多文章并不是为普通人写的:从法律条文到专业文献再到开发者文档,写作所追求的往往是准确度、覆盖面、专业度,但偏偏并不是普通人易读性。因此,我们需要雇佣专业工作者,例如律师、咨询顾问,来作为中间的桥梁,从一个实际问题中找到对应的文献,获得准确的解答。Demo中展示出来的效果是,GPT-4可以做类似的事情,基于专业文献找到答案,用通俗易懂的语言解答个人的疑问,达到为普罗大众赋能的作用。 3. 和上面第二点相关,像是专业的工具文档,之前是针对开发者写作,那未来是否会变为针对LLM写作,从格式到内容到呈现方式,都为了能够更好地被模型输入而优化? 4. OpenAI的现场demo感觉非常好,苹果为硬件产品发布会树立了标杆,OpenAI为AI软件发布会也树立了一个好的榜样。 5. 一遍一遍提醒自己做预期管理:不要根据demo去推断GPT-4的能力,还是得到手之后试试。Interpolation不可取……

封面图片

如何阅读论文? || #经验 #论文

如何阅读论文? || #经验 #论文 摘要 研究人员在阅读研究论文上花费了大量时间。然而,这项重要技能往往没有得到适当的教授,导致了许多不必要的努力浪费。本文提出了一种实际高效的阅读研究论文的三遍方法,并讲述了如何利用这种方法进行文献调研。 1. 引言 研究人员阅读论文的原因多种多样:可能是为了会议或课程的审阅,为了跟上他们领域的最新动态,或为了对一个新领域进行文献调研。一个典型的研究人员可能每年要花费数百小时阅读论文。 学习高效阅读论文是一项至关重要但鲜少教授的技能。因此,刚入门的研究生不得不靠自己摸索,通过试错来学习。在这个过程中,学生不仅浪费了大量努力,还常常陷入挫败感。 多年来,我一直在使用一个简单有效的方法来高效地阅读论文。这篇文章介绍了这种“三遍阅读”方法,以及如何用它来做文献调查。 2. 三遍阅读法 核心思想是进行最多三遍阅读,而不是从头到尾连贯阅读。每一遍阅读都有特定的目标,并在前一遍的基础上深入:第一遍给你一个关于论文的总体印象。第二遍让你掌握了论文的内容,但不深入细节。第三遍帮助你深入理解论文。 2.1 第一遍阅读 第一遍是快速浏览,获取论文的整体框架。你还可以决定是否需要更深入地阅读。这遍阅读大约需要五到十分钟,包括以下步骤: 1. 仔细阅读标题、摘要和引言。 2. 浏览章节和小节的标题,但忽略其他内容。 3. 阅读结论部分。 4. 粗略查看参考文献,心里检查你已经阅读过的内容。 在第一遍阅读结束时,你应该能够回答以下五个问题: 1. 类别:这篇论文属于哪种类型?是测量研究?现有系统的分析?还是研究原型的描述? 2. 背景:它与哪些其他论文有关联?用了哪些理论基础来分析问题? 3. 正确性:它的假设看起来合理吗? 4. 贡献:论文的主要贡献是什么? 5. 清晰度:这篇论文写得清楚吗? 根据这些信息,你可能会选择不再深入阅读。这可能是因为论文内容不吸引你,或者你对该领域了解不足,无法充分理解论文,或者作者的假设不成立。对于不属于你研究领域但未来可能相关的论文,第一遍阅读通常已足够。 2.2 第二遍阅读 第二遍阅读时,需更细致地阅读论文,但可以忽略诸如证明等细节。边读边记下关键点或在边缘作笔记会很有帮助。 1. 仔细检查论文中的图形、图表和其他插图。特别留意图表。轴线是否标注清晰?结果是否带有误差范围,以便得出统计上有意义的结论?这些常见错误会帮助你区分仓促和精心的工作。 2. 记得标记那些相关但未读的参考文献,以备后续阅读(这是深入了解论文背景的好方法)。 第二遍阅读大约需要一个小时。在这遍阅读后,你应该能够理解论文的内容,并能够向别人概述论文的主要观点及其支持证据。这种详细程度适合于你感兴趣但并非你研究专长的论文。 2.3 第三遍阅读 要彻底理解一篇论文,特别是作为审稿人时,需要进行第三遍阅读。这遍阅读的关键是尝试实际重现论文的工作:也就是说,在与作者相同的假设下,尝试再创造他们的工作。通过这种重建与实际论文的对比,你可以更容易地识别出论文的创新之处以及它潜在的不足和假设。 这次阅读要求极高的注意力。你应该质疑每个陈述中的每个假设,并思考如果是你,会如何表达某个特定的想法。这种实际与理想的比较可以带来对论文证明和展示技巧的深刻洞察,这些技巧可能会成为你的宝贵工具。在这遍阅读中,你还应该记录下未来工作的灵感。 对于初学者来说,这次阅读可能需要四到五个小时,对于经验丰富的读者则大约一个小时。在这遍阅读的最后,你应该能够完全理解论文的内容,包括它的创新之处、主要论点、技术论证,以及任何你认为值得进一步探讨的方面。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人