我是云九资本的yy.前周末看完了斯坦福的gerative agent的paper后觉得多年前想象的那种npc也许变得可搞了很激动

我是云九资本的yy. 前周末看完了斯坦福的gerative agent的paper后觉得多年前想象的那种npc也许变得可搞了很激动. 于是喊上卡子@一笼英俊的烧卖 和坦子我们就开始了一通操作. 我们的项目在前天开源大家可以试试. 这个东西非常有意思,他的目的就是让机器人的行为更像人. 为了达到这个效果具体有三个比较重要的模块: 1.长期记忆模块, 没有这个机器人会失忆 2.计划模块,没有这个机器人会对你跟他11点45的时候吃完饭12点又来跟你吃饭 3.反思系统, 没有这个机器人就不会像人一样对经历的一些重要的事情产生高纬的思考从而改变他的性格初衷等等. 大家如果感兴趣可以去看看我们的代码或者读一下斯坦福的那个paper. 第一次写东西可能看着有点啰嗦 以后会再多写点

相关推荐

封面图片

昨天一篇斯坦福大学的家务机器人比较火

昨天一篇斯坦福大学的家务机器人比较火 dji宣布退出k12教育 智元机器人与北大开始合作 机器人圈(好吧我非常讨要说圈,为什么要说呢,因为我想说一下我讨要说圈) 这是机器人相关的比较有意思的三件事。 斯坦福大学的家务机器人工作很有启发意义,但是复现难度不会太大。距离真的可以用还有较长一段时间。 有启发意义的事情是,这玩意儿不是编程编出来的,而是手把手教的。他的后方有两个采集人手以及手臂动作的机械臂。在人完成了一系列复杂动作50次后,可以有90%的成功率让机器人去【学会】这个动作,这也就是论文的启发性。 首先这个东西是没有移动机构的,也就是他不能在家里自由的移动。为什么要特意强调这一点,因为对于机械臂形的机器人来说,没有移动机构意味着,他的底盘相对来说是比较重的。 而且有了移动机构之后,能否仍然如此顺滑地做家务而不是抖来抖去这就不太清楚了。 机器人的机械结构没有特别大的进步,这里就是纯废话了,因为机械臂真的发展的特别完善,现在在走小型化,轻量化的路线,让机械臂变成一个消费级的产品。值得注意的是很多up主已经开始使用机械臂辅助拍摄,效果还是不错的。 这里cue一个国产机械臂厂商,方舟无限,怎么说呢,如果方舟无限现有的机械臂去实现斯坦福大学家务机器人做出来的事情是没有什么压力的,但是该公司的算法能不能支持就存疑了。(基本不能,但是他家机械臂真的很好用) dji推出了k12教育,机器人在k12,尤其是国内的k12缺乏一些力量的最大原因还是对升学没有什么帮助。不像少儿编程,还能参加信息竞赛(不过信息竞赛也由于一些时间上的问题对升学的帮助越来越低)机器人在国内缺乏一个被教育部认可的竞赛。 不过在国际上还是有的那就是赫赫有名的FRC机器人比赛。这个比赛拿到比较好的名次对于申请藤校还是有很大帮助的,包括机器人教育本身也很费钱,(虽然说费钱但是和补习班比起来我感觉后者就是细水长流但是钱堆起来还是比机器人费的多一点不知道)。由于这玩意儿打出来除了申请国外学校以外没什么别的作用,而申请国外学校,尤其是美本还是比较贵的,所以市场一直不大,(但是客单价很高)。考虑到德国一些学校也认,或许也是一条出路(划掉)。 dji对于本科机器人教育的投资并没有说是不是要砍掉,这里又有一段故事我们下次再说。 这里就不得不提优必选了,一个人形教育机器人,随着每个高校都有了一堆吃灰的优必选机器人展示在学生创新中心的犄角旮旯里,难说还有什么别的市场。 虽然我对人形机器人会首先在中国出现深信不疑的主要原因就是智元机器人的存在,但是这家公司和北大这么快就合作了也是让我感觉到很神奇。高山仰止吧。 出于我朴素的爱国主义和浅陋的见识,我相信且认为,中国未来出现一个庞大的机器人产业。但是我也更加希望,这样的庞大产业是与庞大的市场相互匹配的。 我工作还指望这个呢! 祝大家新年快乐哈。

封面图片

防止聊天机器人“造谣”,谷歌 DeepMind、斯坦福大学研究人员推出 AI 事实核查工具

防止聊天机器人“造谣”,谷歌 DeepMind、斯坦福大学研究人员推出 AI 事实核查工具 (英文) 研究人员推出了一种基于大语言模型的工具 搜索增强事实评估器(IT之家注:原名为 Search-Augmented Factuality Evaluator,简称 SAFE),可对聊天机器人生成的长回复进行事实核查。

封面图片

关于 AI 的顶尖课程(权威且免费,来自吴恩达,coursera,哈佛,斯坦福,谷歌等:

关于 AI 的顶尖课程(权威且免费,来自吴恩达,coursera,哈佛,斯坦福,谷歌等: ChatGPT 开发者提示工程 由 DeepLearning AI 和 OpenAI 为开发者提供的关于 ChatGPT Prompt工程的免费课程。来自@AndrewYNg 在这短短的 1.5 小时课程中,他和@isafulf 会教您如何使用大型语言模型 (LLM) 快速构建应用程序,以及这样做的最佳实践。 吴恩达的0基础人工智能入门经典课程 面向所有人的 AI 入门课程,包括非技术人员。 还是由吴老师@AndrewYNg和DeepLearningAI 在2019年推出,是一个4周的,0基础的系统课程,94万人报名。 哈佛CS50 使用 Python 学习 AI 机器学习的基础知识。 为期7周,66万人报名 斯坦福 CS 224N 介绍自然语言处理 (NLP) 及其工作原理。2022年推出 ,部分课程由克里斯托弗·曼宁老师讲授,斯坦福大学教授、斯坦福自然语言处理组负责人。 学习Prompting 包含 60 多个内容模块的提示工程综合课程。 带你从初级到高级。 机器学习简介 Google 的免费机器学习入门课程 学习 AI,通过微软的GitHub Copilot 4月25日推出 时效性很强 为ML新手,使用python语言的工程师准备的 LangChain 101:Prompts课程 您将学习如何: - 构建 LLM Prompts - 构建聊天Prompts - 使用Prompts选择器 - 使用解析器格式化输出

封面图片

斯坦福大学发布开源远程操作机器人系统 ALOHA

斯坦福大学发布开源远程操作机器人系统 ALOHA 是一个低成本的开源硬件系统,可用于双手远程操作机器人执行精细任务 (例如给线缆轧带或剥鸡蛋壳)、动态任务 (例如颠乒乓球) 以及接触式丰富的任务 (例如给自行车上链条)。 作者 Tony Zhao 基于 Transformer 开发了一种动作学习算法,ALOHA 可以直接从实际演示中执行端到端的模仿学习,然后自主完成相同或类似的任务,也可根据实时反馈调整动作以适应不同的环境和情况。 以往执行这些任务通常需要高端机器人、精确的传感器或仔细的校准,这可能既昂贵又难以设置,而 ALOHA 开源了有关设置的所有内容,并准备了详细教程,任何人都可以3D打印组件然后运行现成的机器人。

封面图片

斯坦福团队新作:喊话就能指导机器人 任务成功率暴增

斯坦福团队新作:喊话就能指导机器人 任务成功率暴增 比如在这个场景中,机器人没能完成系统设定的“把海绵放入袋子”的任务。这时研究者直接朝它喊话,“用海绵把袋子撑得再开一些”,之后就一下子成功了。而且,这些纠正的指令还会被系统记录下来,成为训练数据,用于进一步提高机器人的后续表现。有网友看了说,既然已经能朝着机器人喊话了,那汽车是不是也快点安排上,还在线点名特斯拉和其自动驾驶软件总监Ashok Elluswamy。成果发布后,前Google机器人高级研究员Eric Jang,前DeepMind研究员、斯坦福客座教授Karol Hausman等一众大佬也纷纷表示了肯定和赞许。那么,用喊话调整的机器人,都能实现什么样的动作呢?喊话就能发号施令利用YAY技术调教后,机器人以更高的成功率挑战了物品装袋、水果混合和洗盘子这三项复杂任务。这三种任务的特点是都需要两只手分别完成不同的动作,其中一只手要稳定地拿住容器并根据需要调整姿态,另一只手则需要准确定位目标位置并完成指令,而且过程中还涉及海绵这种软性物体,拿捏的力度也是一门学问。以打包装袋这个任务为例,机器人在全自主执行的过程中会遇到各种各样的困难,但通过喊话就能见招拆招。只见机器人在将装袋的过程中不小心把海绵掉落了下来,然后便无法再次捡起。这时,开发者直接朝它喊话,口令就是简单的“往我这边挪一挪,然后往左”。当按照指令做出动作后,第一次还是没成功,但机器人记住了“往左”这个指令,再次左移之后便成功把海绵捡起来了。但紧接着就出现了新的困难袋子的口被卡住了。这时只要告诉它再把袋子打开一点点,机器人就“心领神会”,调整出了一系列后续动作,并最终成功完成任务。而且不只是能纠正错误,任务的细节也能通过喊话实时调整,比如在装糖的任务中,开发者觉得机器人拿的糖有点多了,只要喊出“少一点”,机器人就会将一部分糖果倒回盒子。进一步地,人类发出的这些指令还会被系统记录并用作微调,以提高机器人的后续表现。比如在刷盘子这项任务中,经过微调之后的机器人清洁力度更强,范围也变大了。统计数据表明,机器人在经历这种微调之后,平均任务成功率提高了20%,如果继续加入喊话指令还能继续提高。而且这样的指令-微调过程可以迭代进行,每迭代一次机器人的表现都能有所提升。那么,YAY具体是如何实现的呢?人类教诲“铭记在心”架构上,整个YAY系统主要由高级策略和低级策略这两个部分组成。其中高级策略负责生成指导低级策略的语言指令,低级策略则用于执行具体动作。具体来说,高级策略将摄像头捕捉到的视觉信息编码,与相关知识结合,然后由Transformer生成包含当前动作描述、未来动作预测等内容的指令。而低级策略接收到语言指令后,会解析这些指令中的关键词,并映射到机器人关节的目标位置或运动轨迹。同时,YAY系统引入了实时的语言纠正机制,人类的口头命令优先级最高经识别后,直接传递给低级策略用于执行。且在这个过程中命令会被系统记录并用于微调高级策略通过学习人类提供的纠正性反馈,逐渐减少对即时口头纠正的依赖,从而提高长期任务的自主成功率。在完成基础训练并已经在真实环境中部署后,系统仍然可以继续收集指令信息,不断地从反馈中学习并进行自我改进。作者简介本项目的第一作者是斯坦福大学的学生研究员Lucy X. Shi,2019年毕业于人大附中后进入南加州大学就读计算机科学专业。其间,Lucy曾到英伟达实习研究多模态大模型,并曾与知名AI学者Jim Fan博士合作。她的论文曾连续两年被机器人顶会CoRL收录,还入选过NeurIPS,本人还被DeepMind邀请发表过演讲。Lucy的导师Chelsea Finn是斯坦福计算机科学和电气工程系助理教授,Google学术论文引用数超4.7万,此前还在Google Brain工作过一段时间。包括本项目在内,在ALOHA团队发表的一系列论文当中,Finn总是作为通讯作者出现。此外,ALOHA团队的Tony Z. Zhao、Sergey Levine等研究人员,也是本文的共同作者。 ... PC版: 手机版:

封面图片

新节目上线,主要这些内容,欢迎大家听哈

新节目上线,主要这些内容,欢迎大家听哈 -刷屏的斯坦福机器人研究(Mobile-Aloha)都有什么亮点?为什么刷屏的新闻竟然是“假的”? -理解一些技术原理:机器人怎么和大语言模型结合;具身智能具体是怎么回事儿; -为什么用上论文里面的机器人这么难?为什么说机器人行业“不像朝阳行业” -我们距离家里有一台机器人,还有多远?哪些技术是关键?

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人