在这篇文章中,作者将分享一种新兴的LLM应用堆栈的参考架构。这展示了作者在AI初创公司和先进技术公司中看到的最常见的系统、工具和

在这篇文章中,作者将分享一种新兴的LLM应用堆栈的参考架构。这展示了作者在AI初创公司和先进技术公司中看到的最常见的系统、工具和设计模式。| 这个堆栈仍然非常新,随着底层技术的进步可能会发生实质性的变化,但希望它能成为现在使用LLM的开发者的有用参考。

相关推荐

封面图片

Redis 作者 Antirez 写了篇文章,分享用 LLM 编程的体验,相当务实。他提到 LLM 能极大缩短学习新技术的时间,

Redis 作者 Antirez 写了篇文章,分享用 LLM 编程的体验,相当务实。他提到 LLM 能极大缩短学习新技术的时间,非常适合写一些“用后即丢”的代码,但在本身已是专家的领域中帮助略小。 另外, Antirez 也发现了一些局限:对于写个布隆过滤器这样复杂的代码,目前质量不行。上下文长度也不够。他认为如何向 LLM 提出正确的问题,会成为非常重要的技能。 |

封面图片

中美两国在投资和获得先进技术方面的紧张关系日益加剧之际,硅谷最著名风险投资公司之一的红杉资本进行自我分拆。

中美两国在投资和获得先进技术方面的紧张关系日益加剧之际,硅谷最著名风险投资公司之一的红杉资本进行自我分拆。 该公司计划拆分为三个独立的合作伙伴,中国和印度的业务将采用新品牌,欧美业务将保留原有名称。多名红杉高管表示,该公司全球业务管理已变得“越来越复杂”。

封面图片

美国限制对华出口芯片和芯片制造设备的举措势必会令中国一些快速崛起的半导体公司遇挫,进而遏制中国在先进技术方面追赶美国的尝试。

美国限制对华出口芯片和芯片制造设备的举措势必会令中国一些快速崛起的半导体公司遇挫,进而遏制中国在先进技术方面追赶美国的尝试。 不过,研究人员表示,位于荷兰、日本等地的外国公司也是芯片制造设备的主要供应商,如果没有这些政府的协调努力,美国新规的影响可能有限。

封面图片

#本周热读 美国限制对华出口芯片和芯片制造设备的举措势必会令中国一些快速崛起的半导体公司遇挫,进而遏制中国在先进技术方面追赶美国

#本周热读 美国限制对华出口芯片和芯片制造设备的举措势必会令中国一些快速崛起的半导体公司遇挫,进而遏制中国在先进技术方面追赶美国的尝试。 研究人员称,位于荷兰、日本等地的外国公司也是芯片制造设备主要供应商,如果没有这些政府的协调努力,美国新规的影响可能有限。

封面图片

在这本书里,作者分享了数十个来自新创公司和各领域企业的人工智慧应用案例,讲述了从事人工智慧部署工作者的个人经历,生动形像地向读者

在这本书里,作者分享了数十个来自新创公司和各领域企业的人工智慧应用案例,讲述了从事人工智慧部署工作者的个人经历,生动形像地向读者展示了人工智慧的实践思路,继而描绘了未来熟练应用人工智慧的场景。 如何在现实生活中高效应用AI?这是人们面临的新难题。 当人工智慧发挥作用时,它无疑是高效的,既能帮助公司赚取或节省大量资金,又能以前所未有的效率满足客户需求。但当它不受控制时,其结果可能是毁灭性的。 探索智慧科技前沿,预见未来生活变革! 身处2024年的科技浪潮中,本书以其前瞻性的视角和深度剖析,引领读者走进一个全新智慧时代。翻开此书,邀您共赴这场令人兴奋的科技创新之旅,共同塑造与享受人工智慧所带来的崭新时代! 作者以其专业的洞察力和生动的笔触,描绘了一幅宏大的AI应用蓝图,让读者不仅能够洞悉AI如何赋能产业升级、推动科技进步,更能领悟人工智慧在未来社会发展中所扮演的关键角色及其带来的机会挑战和社会责任。 揭秘智慧革新力量,点亮未来生活之路!本书引导读者跨越理论与实践之间的鸿沟,亲历人工智慧从概念走向现实的每一步演变。无论是科技领域的专业人士,或是热衷于理解未来世界发展趋势的社会各界人士,都将在这部作品中寻得珍贵的启示与思考。 专业评论: 我想不出比人工智慧更有前景的技术了,《AI图景: Sora时代的人工智慧应用》让产品团队和产品负责人对这个强大的新工具有了清晰的认识。 马蒂凯根,矽谷产品集团合伙人 如果你是一名正在考虑如何利用人工智慧和机器学习的商人,但不​​知道从哪里开始,该问什么问题,或如何赋能你的团队这本书就是为你准备的。作者从工作实践中获得了来之不易的经验,书中的许多例子会让你很容易理解一些新概念,并将它们应用到你的公司环境中。 克莉丝汀康奈尔,加州蓝盾公司高阶主管 要建立一个高效率且负责的人工智慧系统,以期获得较高的投资报酬率,绝非易事。但是,如果公司想要蓬勃发展并保持竞争力,那么就必须找到成功应用人工智慧的方法,真的没有别的选择。好消息是,这本书提供了坚实的路线图,它有真实的案例和可操作的建议作为后盾。 汤姆‧陶利,富比士网站专栏作家、《如何成为下一个 Facebook》作者 把握时代脉搏,预见智慧未来,共赴这趟令人兴奋的科技创新之旅! 本书不仅是每位科技从业人员实用的案头参考,更是所有关注未来科技的读者启迪智慧、拓展视野的引路之作。 作者简介: 阿莉莎‧辛普森‧罗赫韦格(Alyssa Simpson Rochwerger) 毕业于美国三一学院,曾担任澳鹏(Appen)的人工智慧和资料副总裁以及 IBM Watson 的产品总监。目前,她是加州蓝盾公司(Blue Shield of California)的产品总监。她致力于为人们解决难题,成功地把产品从概念扩展到大规模投产,是一位以客户为导向的产品领导者。 逄伟(Wilson Pang) 毕业于浙江大学电机工程专业,于 2018 年 11 月加入澳鹏(Appen),担任技术长。他曾担任全球第二大线上旅行社携程(Ctrip)的首席资料长、加州易贝(eBay)的高级工程总监,在IBM 担任架构师,带领资料工程师、分析师、资料产品经理和科学家改善使用者体验,提高营运效率,推动业务成长,在软体工程和数据科学方面拥有超过19 年的经验。

封面图片

13家媒体怒告OpenAl等AI巨头背后:内容创作为何成了大模型的“免费午餐”?

13家媒体怒告OpenAl等AI巨头背后:内容创作为何成了大模型的“免费午餐”? 然而,对于到底“投喂”了什么数据,是否获取授权,这些AI公司总是讳莫如深。伯克利计算机科学家Stuart Russell等学者认为,大模型吞噬了大多数互联网信息,以复制人类智能并将其以自动化形式镜像回馈给我们。当意识到其网站上发布的故事都被自动抓取成了大模型的“食物”后,以《纽约时报》为首的媒体/出版机构向OpenAI等发起了版权诉讼。《每日经济新闻》记者在采访哈佛法学院教授丽贝卡•塔什内特、安杰世泽律师事务所合伙人于雯竹后了解到,此类案件判定的难点在于如何确定AI输出内容与媒体报道间的“实质性相似”。而另一方面,OpenAI等科技公司也向媒体/出版机构抛出了橄榄枝,因为数据总有耗光的一天。研究机构Epoch AI近期预测,大模型将在2026年至2032年之间消耗完所有可用数据。“应该大声要求赔偿” !13家媒体发起反击2009年末,媒体大亨罗伯特•默多克曾在一场论坛上说:“有些人觉得他们有权拿走我们的新闻内容,还无需为新闻生产贡献一分钱。他们几乎侵吞了我们的全部新闻,这可不是合理使用。说得直白些,这就是偷。”当时,随着Google等新兴互联网公司的出现,美国报业的广告收入腰斩。而如今,OpenAI等生成式AI公司的强势崛起,类似的一幕似乎又开始重演。新闻集团首席执行官罗伯特•汤姆森就曾表示,“[媒体]的集体知识产权正受到威胁,我们应该大声要求赔偿。”新闻行业律师Steven Lieberman更是直言,OpenAI的巨大成功也要归功于其他人的工作,它在未经许可或付款的情况下获取了大量优质内容。据外媒,ChatGPT主要通过阅读书籍、文章和公开的网络内容来学习,包括来自互联网的在线新闻文章。类似的大语言模型也依赖的是社交媒体帖子、博客、数字化书籍、在线评论、维基百科页面以及您能想到的几乎所有的网络信息。在意识到ChatGPT对历史和时事的了解源自其网站上发布的故事(甚至是付费内容)时,去年年底,《纽约时报》对OpenAI以及微软提起诉讼,指控后者未经授权使用该报版权内容训练AI模型,并在ChatGPT产品中呈现给用户。该案打响了媒体机构起诉OpenAI的第一枪,随后又有多家媒体加入了这一反抗的队列。据《每日经济新闻》记者的不完全统计,截至今年6月底,已至少有13家新闻媒体机构对OpenAI和微软提起了侵权诉讼。这里面有Alden Global投资集团旗下的八家地区性知名报纸,包括芝加哥论坛报、纽约每日新闻、丹佛邮报、圣何塞水星报,还有数字新闻媒体The Intercept、Raw Story和AlterNet,以及非盈利新闻组织The Center for Investigative Reporting。图片来源:每经制图“判断这种数据抓取行为是否侵犯版权,是一个复杂且有争议的问题。”安杰世泽律师事务所合伙人、中国和美国纽约州执业律师于雯竹在接受每经记者采访时表示。这起诉讼只是各行业与生成式AI公司斗争的缩影。美国当地时间6月24日,全球三大唱片公司索尼音乐集团、环球音乐集团和华纳音乐联合多家唱片公司,向AI音乐生成公司Suno和Udio开发商Uncharted Labs发起诉讼,指控后者非法使用版权音乐来训练模型并提供服务。唱片公司指控Suno抄袭了662首歌曲,Udio抄袭了1670首歌曲,正在尝试索取每件音乐作品最高15万美元的赔偿费用。8个月的角力尚无结果:“实质性相似”还是“合理使用”?越来越多的关于生成式AI技术的法律之争也让人开始正视媒体/出版商与颠覆性技术之间的关系。据著名广告周刊Adweek,Google去年5月推出了基于AI的搜索引擎Search Generative Experience(SGE)测试版,接受采访的媒体高管和搜索引擎优化专家称,出版商必须为自然搜索流量的大幅下降做好准备,下降幅度可能在20%到60%之间。而出版商在开放网络上的搜索流量减少通常意味着数字广告收入下降。新型媒体公司Raptive创新执行副总裁Marc McCollum估计,在目前的SGE下,整个出版业每年的广告收入损失可能高达20亿美元。而《纽约时报》的起诉不仅是媒体领域的重要里程碑案件,亦可以为法律业界提供极具参考价值的信息。“就版权法而言,本案的重要影响在于版权法在数字和AI时代的适用范围。特别是对于新闻报道这类具有较高公共利益的文本内容,如何平衡版权保护和信息自由将成为一个关键问题。” 于雯竹对记者说道。在于雯竹看来, 如果《纽约时报》的诉讼获得成功,将树立一个重要的法律先例,鼓励其他文字类媒体、版权机构和作家团体组织跟随起诉OpenAI及类似的AI公司。本案可能会督促AI公司重视AI模型训练的合法性,可能推动相关行业规范的建立。目前,该案件已经持续将近8个月,但还没有定论。1)媒体之难:证明“实质性相似”《纽约时报》在起诉书中称,ChatGPT几乎逐字复制了其新闻报道。该报举例称,2019年,《纽约时报》发表了一篇荣获普利策奖的关于纽约市出租车行业掠夺性贷款的系列文章。该报称,只要稍加提示,ChatGPT就会一字不差地背诵其中的大部分内容。来源:《纽约时报》起诉书在其他多家媒体的起诉书中,记者发现,其法律论证和主张都基于美国1976年版权法和《数字千年版权法》(DMCA)。对于这两部法案中涉及AI的内容,于律师告诉记者,“就1976年版权法而言,侵权的判定通常依赖于原作品和被指控侵权作品之间的相似性,以及实际的复制行为。本案中实际复制行为相对容易证明,因为OpenAI并未否认其训练数据中包含《纽约时报》的文章。”然而难点在于,“证明最终生成的文本构成版权侵权仍需满足‘实质性相似’测试,因为它有助于判断受版权保护的表达元素是否被复制,还是仅复制了其中的思想。版权保护的是表达,而不是思想。你可以用自己的语言重新实现他人的思想,这不构成版权侵权。但如果你使用他人的语言即他们的表达那就是版权侵权。”于律师说道。谈及DMCA,于雯竹解释道:“其中的一项规定鼓励版权持有者在数字资产中添加内容管理信息(CMI),例如帮助识别创作者或权利持有者的信息,并禁止他人移除这些信息。”然而,《纽约时报》起诉书提到,OpenAI在抓取其文章以创建数据库时,移除了这些信息,违反了DMCA。来源:《纽约时报》起诉书“实际上,美国是判例法国家,而其版权法及DMCA并未特别规定与AI相关的法律内容,对于OpenAI的行为是否属于侵权的认定,法院依据的是相关的先例及其对相关法律条文的解释。”于雯竹表示。2)OpenAI的“盾牌”:“合理使用”而在回应《纽约时报》版权侵权诉讼时,OpenAI强调使用公开材料训练AI模型属于合理使用。这一规则基于美国1976年版权法第 107 条规定。哈佛法学院教授丽贝卡•塔什内特(Rebecca Tushnet)在接受《每日经济新闻》记者采访时认为,“美国版权法既提供了广泛的权利,也提供了广泛的例外。关键问题是AI训练是否构成‘合理使用’,以及当AI输出与现有作品过于相似时,该问题到底应该归咎于模型还是用户的滥用。”塔什内特认为,“OpenAI提供了有一个有趣的主张,即(AI)要获得高度相似的输出,必须故意用《纽约时报》原始文章中的大量引文来提示模型,这表明错误在于提示者(用户的滥用)。”“‘合理使用’是美国版权法的一项关键优势,使其能够应对不断变化的情况。它促成了我们所知道的现代互联网的兴起,尤其是搜索引擎。按照同样的推理,只要输出通常不是从特定作品中复制而来,创建AI模型就应该被视为变革性的和公平的。” 她对... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人