对 agent 的一个暴论:现有 (multi) agent workflow 的模式没有太大价值。Agent 今年(在以吴恩达

对agent的一个暴论:现有(multi)agentworkflow的模式没有太大价值。Agent今年(在以吴恩达老师为首的各类大佬的吹捧下)热度很高,但现有的这些所谓的(multi)agentworkflow,本质上是把一个大任务拆分成很多个子任务,每个子任务都有明确的input和output,自己定义一些变量和接口,把这些子任务串起来。这种方式很像是早期的自动驾驶,把感知和规控分开解,或者是上一代的语音助手,把语音转文字、LLM、语音合成这些工作流串起来。终极的解决方案应该不是这个样子的。现有的(multi)agentworkflow,速度慢先不说,最大的问题还是在接口的地方把信息降维了。这些input/output的接口和变量,本质上都是把信息降维到人能理解的维度,这是以高维信息的损失为代价的。每多一层workflow,损失的信息就多了一次。面对简单问题时,(multi)agentworkflow或许是可行的,但它注定无法解决复杂问题。就好比Waymo用感知+规控的架构,搭配高精地图,能够在凤凰城和三藩市勉强把本地L4跑通,但很难scale成一个通用的解法。只有Tesla端到端的方案才是自动驾驶的未来。因此,现有的(multi)agentworkflow方式注定只是一个中间状态,类似自动驾驶中感知+规控+高精地图的拼凑。而最终想要解决复杂问题,需要靠基础模型的进化。当模型能力足够强之后,应该是可以端到端的解决问题。你可以在prompt里提示它去使用某些工具,或者采用某些步骤,但应该不需要人为去把workflow拆出来。Agent的概念依旧重要,但应该回归它更加native的定义,即每一个Agent应该是独立的智能体,拥有自己的memory,planning,tooluse等能力,能够端到端地解决问题,而不是需要人类按照自己的理解一口口地把饭喂到嘴里。一个Agent就应该是一辆独立的L5Autopilot的汽车,而不是一堆弱智L2Workflow凑出来的所谓multiagents辅助驾驶杂牌军团。这听起来就很不优雅。

相关推荐

封面图片

吴恩达谈 Agent 4个模式:Agent 工作流可实现 GPT-3.5 >GPT-4

吴恩达对AIAgent的这个分享,真的很有价值,这可能才是AIAgent未来的打开方式,我自己体验了一下效果确实很好。大多数人使用语言模型的方式是非Agent式的工作流,即输入提示,生成答案;而Agent式工作流是这样的:让AI编写文章大纲,看是否需要做一些研究,然后写初稿,阅读初稿并思考哪些部分需要修改,然后修改草稿,如此反复。多Agent协同很有SaaS里协同带来的价值那种感觉,我觉得协同在AI时代或许仍然非常重要,只不过是将人与人之间的协同更多换成了AIAgent而已,而我猜测AI+Human协同可能会是未来长期的一个状态。

封面图片

游戏特工17 Ver 0.21.3 正式版 / 修复版 【电脑+安卓】 (Agent17-0.21.3)

游戏名称:特工17Ver0.21.3正式版/修复版【电脑+安卓】(Agent17-0.21.3)游戏简介:某年某月某日,你在车祸现场捡到了一部手机。当你打算卖掉它赚点零花钱的时候,突然接到了一个电话。对方自称代号17号,是一位特工,几乎无所不能。但是貌似脑袋不太灵光,把你认作她的顶头上司。那么你会让他做些什么呢,教训欺负你的小太妹?调查你女神的隐私?或者别的什么?—————————————————主要章节:-Sakura(35%-未能完成。)-Saphire(冰雪女王)支线剧情:-Dana按摩-Anriel(蓝毛)新角色-赫拉一些小改动:—————————————现在属于正式发布了,当然也有礼包码,翻译问题应该是修复了别的问题不知道礼包码:267-623-4801308-175-8929夸克下载地址:【】密码:Calibur加入群聊:【】

封面图片

建筑工地成无人车噩梦 Waymo栽跟头多到被约谈

建筑工地成无人车噩梦Waymo栽跟头多到被约谈访问:NordVPN立减75%+外加3个月时长另有NordPass密码管理器发生了什么大概3个月内,Waymo积累上报了22起事故,引起了美国国家公路交通安全管理局的注意。根据NHTSA的文件显示,这些事故包括Waymo无人车和静止和半静止物体(比如门)相撞、与停放车辆相撞以及违反交通安全控制装置的情况。其中“违反交通安全控制装置”官方特别说明是一个重点调查方向,一个典型场景就是自动驾驶系统对交通锥/雪糕筒的检测识别能力。这个点比较罕见。因为这次上报的22起事故中,很多都涉及同一种场景——建筑工地。比如上个月,6辆编队行驶的WaymoRobotaxi,下班收工回停车场,结果遇到了施工现场临时交通管制,直接卡死在雪糕筒围成的临时通行区,造成了大约半个小时交通拥堵。有本地生活经验的网友立刻就认出来,这是旧金山Potrero大道101号匝道,Waymo无人车卡死的地方,刚好是高速入口。最后,是路上的司机老哥直接下车手动挪开雪糕筒,后面的车队依次绕过几辆“瘫痪”的无人车。Waymo方面出了一个简单声明,大意是30分钟内就派人去现场挪车了,没有造成任何伤亡和财产损失,后续会配合调查。不过在凤凰城的建筑工地,就没这么幸运了。同样一辆Waymo无人车,无视了雪糕筒围出的施工区域,直接冲进了建筑工地。幸好速度不快没撞到人,不过车辆本身、工地现场都有不同程度损失。类似这样的事故很多,每次无人车“冲进工地”的小视频,都会在网络上疯传。网友总结的很生动:交通锥就是Robotaxi的氪石(kryptonite),现在再神通广大的自动驾驶,遇到封闭道路的交通锥,都得完蛋。咦?好像跟Waymo官方秀出的视频不太一样呀。为什么建筑工地难?Waymo第五代自动驾驶系统绕行施工区,曾被当做技术亮点专门解析过。官方的Demo中,无人车面对的场景更加复杂,除了交通锥、不规则区域,还有来回走动的工人。Waymo无人车当然是毫不费力完成了一系列避让、绕行动作,顺利通过了施工区域:这里面让人啧啧称奇的是,Waymo无人车似乎能够看懂人类指挥交通的肢体语言,让停就停,让走就走,而不仅仅以路面条件作为依据。怎么做到的?Waymo负责预测算法的工程师MayaKabkab简要解释了一下,大意是第五代技术中,Waymo加强了对不同物体目标的理解能力,以及对可通行区域的识别能力,这两项使得系统能更好规划通行路线。核心是用全新模型VectorNet替代CNN,提取传感器和高精地图信息。简单的说,是将高精地图和传感器输入信息表示为点、多边形或曲线,VectorNet则将所有道路特征和其他对象的轨迹表示为相应的向量。基于这个简化的视图,VectorNet可以提取每个向量的信息以及学习不同向量之间的关系。好处是VectorNet比CNN占用计算资源更少,出结果的速度更快,理论上也能更加清晰的提取出关键场景信息。但VectorNet仍然没有解决“建筑工地”难题的核心——“建筑工地”本身是高精地图的例外,不可能同步更新,只能靠传感器实时感知。但传感器的数据在不同子模型之间依次传递,信息损失难以完全避免。Robotaxi频繁出现被建筑工地卡死,直接原因是对交通锥、异形物的错检漏检。而深层原因,是传统自动驾驶技术范式存在能力的上限、天花板,难以覆盖路上所有的cornercase。所以能不能顺利避让建筑工地,成了一种概率事件:官方Demo精雕细琢反复测试,那没问题;单上路实测,就只能看天吃饭了。端到端能解吗?“遇事不决量子力学”,是一句调侃。但在自动驾驶领域,遇事不决,的确都可以“端到端”一下。所谓“端到端”是针对传统技术范式而言的,其中自动驾驶的感知、决策、规控等等互相独立。传感器采集到的数据,需要通过这一系列不同的算法模块,最终才能“变成”操作指令。每个独立模块之间的信息是逐级传递的,在这个过程中必然会存在信息的丢失和误差,而且前一个模块的误差会影响到下一个,多个模块之间的信息误差会不断累积,进而影响到自动驾驶方案的整体效果。无论是纯视觉感知,还是融合感知,“错检漏检”的根源就在这里。当然也有对应的解决办法,那就是通过人手写的规则,尽量打补丁提高感知识别的可靠性。比如能识别车、人,但识别不了“人站在车前”,那好办,直接将这类目标单独建一个数据集拿来训练模型不就行了?这就是所谓感知“白名单”机制。但问题是,很难穷举所有种类的交通目标和场景,这次解决了“人在车前”的问题,但如果车从乘用车变成大卡车呢?或者一个人变成大人牵小孩呢?对于Robotaxi的建筑工地难题来说也是一样,工地可能临时出现,随机刷新,不会限定区域限定时间,而每家工地的搭建、施工路障都不一样…所以从感知开始就实现信息的无损传递,让系统真正理解环境,需要有一个全新的算法范式——端到端算法模型。两个端分别指数据输入端和指令输出端,中间不再分成几个相互独立的模块。端到端模型能够通过完全数据驱动的模式,将其学到的能力和技巧迁移泛化到其他场景当中,自主且高效解决行泊场景中新出现的各类长尾问题,具备更快的迭代效率,有效降低开城成本。通俗的说,就是让AI司学习人类成熟驾驶行为,看到一种场景,做出相应对策。实际上“端到端”已经摸到了AGI的门槛。2016年端到端模型由英伟达首次提出。但真正得到量产实践这两年才开始。目前只有特斯拉的FSD和中国AI玩家的CVPR2023最佳论文——UniAD。智能车参考也分别就Waymo遇到的工地难题询问了这两家国内自动驾驶头部玩家的看法。地平线从工程实践角度出发,认为:自动驾驶的工地难题和端到端技术范式并不是绑定的。理论上讲,感知能力足够强、感知白名单足够丰富也是能解决问题的。但显然,端到端的自主学习能力、类人思考会更大规模更高效率的解决这个问题。而商汤的看法更加从“第一性原理”出发,绝影智驾相关技术专家相关认为:不对具体的case进行评价。但基于规则的传统智驾方案的感知还是人为定义要素,并对感知信息进行抽象提取,这就会导致信息传递过程的损失和遗漏,让感知决策模块难以作出正确的决策。而端到端是在一个神经网络中,将外部环境的信息无损输入和传递,更准确和完整地理解外部交通环境,并作出规划和决策。规则方案可以通过增加规则、添加补丁解决一个场景。但是这样的场景不会只有一个,是无限的。而足够多的数据进行学习训练之后,端到端方案可以像人一样思考、开车,自己解决更多类似的cornercase。总结一下,地平线和商汤表述不同,但核心一样,都认可端到端是解决Robotaxi工地难题最有效的方法。同时还是解决自动驾驶各类长尾问题的最高效途径。对了多说一句,提出UniAD的CVPR2023最佳论文,地平线和商汤的学者都参与了撰写。端到端对传统技术范式革新,给了所有玩家新的机遇:更好的智驾体验、更低的维护、泛化成本,以及更有竞争力的自动驾驶方案成本。但代价是以往模块化的、规则驱动主导的技术体系,必须推倒重构。昔日自动驾驶绝对领军者Waymo,如今陷入“建筑工地”困境中,更加证明自动驾驶这条赛道“水无常形,兵无常势”:老牌明星可能会优势归零重置,“后来者”也会获得领先优势。...PC版:https://www.cnbeta.com.tw/articles/soft/1431470.htm手机版:https://m.cnbeta.com.tw/view/1431470.htm

封面图片

卢宠茂称维持现有院舍探访标准是保障高危人群免受感染

卢宠茂称维持现有院舍探访标准是保障高危人群免受感染医务衞生局局长卢宠茂表示,疫情近日有升温迹象,一星期平均每日有超过7千宗确诊个案。对于有意见希望放宽院舍及公立医院探访安排,卢宠茂回应指,院舍院友及住院患者属高危人群,院舍近日的确诊个案亦有增加,维持现有探访标准是希望保障高危人群免受感染。政府将于明天推出过渡疫苗通行证安排,卢宠茂表示,有关安排并非针对持有涉嫌滥发俗称「免针纸」医学豁免证明书的市民,而相关市民中,已有约2千人接种疫苗。卢宠茂在立法会出席「与预防及控制疾病相关的附属法例小组委员会」时表示,市民是否适合接种疫苗是医学问题而非法律问题,应该循医学途径解决,所以市民应该按需要咨询其他医生。2022-11-2118:18:06

封面图片

最近和几个朋友聊天记录:

最近和几个朋友聊天记录:1.我问他是怎么建Prompt的验收标准的:准备好Query,归纳抽象理想回答的几条Principle,找一个更聪明的大模型基于这个Principle来给Prompt的结果打分,每次上线前跑1000条。感觉挺makesense,想测试一下。2.perplexity怎么解决搜索引擎响应速度的问题:去年8月份就宣布基于3.5版本的微调模型已经比GPT4快且效果好,且自研了推理堆栈(pplx-api),能大幅度提升响应速度。微调没那么难搞,只要场景垂数据集质量高,一周左右。3.在厂里的朋友说在搞低代码搭建Agent,面向B端,找不到太落地的具体场景,还要搞权限数据集多环境版本,由于B端业务逻辑比较复杂,要依赖现有GUI,要跳卡片或者跳页面,比C端难做太多了。

封面图片

李达志:已有小组就发展数码港元检视现有法律

李达志:已有小组就发展数码港元检视现有法律金管局副总裁李达志表示,目前未有推行数码港元具体立法时间表,但透露金管局内部已经设立小组检视现有法律。他认为,修例或者草拟新法律都是可行方案,但目前未有定案。他指出,现有法例可能从没预计将来以数码形式发行货币,这部分或者可以透过修例,重新定义法定货币即可。但部分电子化交易场景引伸的问题可能史无前例,这部分或未必可以透过修例处理。对于可否选择性先推行较容易掌握的数码港元用例,但限制市场使用未成熟的用例,李达志认为,推出数码港元后,应该容许市场发挥创意,如果因为「取易不取难」而在设定限制下推出数码港元,可能扼杀生存空间。他认为,发展数码港元时,一定要逐步扩大测试规模,直至正式全面推出。他又说,数码港元日后会否收费未有定案。现时坊间绝大多数支付工具的用户端都是免费,但零售商户则可能收费。数码港元如果要成功推出,不单止金管局努力,亦需要其他持分者建立客户群,以及协助商户上线等。即使金管局不需要收回成本,其他支援是否需要收费,都是将来需要思考的问题。2023-10-3018:57:25

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人