昨天一篇斯坦福大学的家务机器人比较火

昨天一篇斯坦福大学的家务机器人比较火 dji宣布退出k12教育 智元机器人与北大开始合作 机器人圈(好吧我非常讨要说圈,为什么要说呢,因为我想说一下我讨要说圈) 这是机器人相关的比较有意思的三件事。 斯坦福大学的家务机器人工作很有启发意义,但是复现难度不会太大。距离真的可以用还有较长一段时间。 有启发意义的事情是,这玩意儿不是编程编出来的,而是手把手教的。他的后方有两个采集人手以及手臂动作的机械臂。在人完成了一系列复杂动作50次后,可以有90%的成功率让机器人去【学会】这个动作,这也就是论文的启发性。 首先这个东西是没有移动机构的,也就是他不能在家里自由的移动。为什么要特意强调这一点,因为对于机械臂形的机器人来说,没有移动机构意味着,他的底盘相对来说是比较重的。 而且有了移动机构之后,能否仍然如此顺滑地做家务而不是抖来抖去这就不太清楚了。 机器人的机械结构没有特别大的进步,这里就是纯废话了,因为机械臂真的发展的特别完善,现在在走小型化,轻量化的路线,让机械臂变成一个消费级的产品。值得注意的是很多up主已经开始使用机械臂辅助拍摄,效果还是不错的。 这里cue一个国产机械臂厂商,方舟无限,怎么说呢,如果方舟无限现有的机械臂去实现斯坦福大学家务机器人做出来的事情是没有什么压力的,但是该公司的算法能不能支持就存疑了。(基本不能,但是他家机械臂真的很好用) dji推出了k12教育,机器人在k12,尤其是国内的k12缺乏一些力量的最大原因还是对升学没有什么帮助。不像少儿编程,还能参加信息竞赛(不过信息竞赛也由于一些时间上的问题对升学的帮助越来越低)机器人在国内缺乏一个被教育部认可的竞赛。 不过在国际上还是有的那就是赫赫有名的FRC机器人比赛。这个比赛拿到比较好的名次对于申请藤校还是有很大帮助的,包括机器人教育本身也很费钱,(虽然说费钱但是和补习班比起来我感觉后者就是细水长流但是钱堆起来还是比机器人费的多一点不知道)。由于这玩意儿打出来除了申请国外学校以外没什么别的作用,而申请国外学校,尤其是美本还是比较贵的,所以市场一直不大,(但是客单价很高)。考虑到德国一些学校也认,或许也是一条出路(划掉)。 dji对于本科机器人教育的投资并没有说是不是要砍掉,这里又有一段故事我们下次再说。 这里就不得不提优必选了,一个人形教育机器人,随着每个高校都有了一堆吃灰的优必选机器人展示在学生创新中心的犄角旮旯里,难说还有什么别的市场。 虽然我对人形机器人会首先在中国出现深信不疑的主要原因就是智元机器人的存在,但是这家公司和北大这么快就合作了也是让我感觉到很神奇。高山仰止吧。 出于我朴素的爱国主义和浅陋的见识,我相信且认为,中国未来出现一个庞大的机器人产业。但是我也更加希望,这样的庞大产业是与庞大的市场相互匹配的。 我工作还指望这个呢! 祝大家新年快乐哈。

相关推荐

封面图片

斯坦福大学发布开源远程操作机器人系统 ALOHA

斯坦福大学发布开源远程操作机器人系统 ALOHA 是一个低成本的开源硬件系统,可用于双手远程操作机器人执行精细任务 (例如给线缆轧带或剥鸡蛋壳)、动态任务 (例如颠乒乓球) 以及接触式丰富的任务 (例如给自行车上链条)。 作者 Tony Zhao 基于 Transformer 开发了一种动作学习算法,ALOHA 可以直接从实际演示中执行端到端的模仿学习,然后自主完成相同或类似的任务,也可根据实时反馈调整动作以适应不同的环境和情况。 以往执行这些任务通常需要高端机器人、精确的传感器或仔细的校准,这可能既昂贵又难以设置,而 ALOHA 开源了有关设置的所有内容,并准备了详细教程,任何人都可以3D打印组件然后运行现成的机器人。

封面图片

斯坦福爆火家务机器人升级二代:双手稳到能偷钱包 成本降至19万

斯坦福爆火家务机器人升级二代:双手稳到能偷钱包 成本降至19万 开可乐平稳倒可乐都是小case:连不带吸管的便利店牛奶都能轻而易举成功打开:那就更不用多说将玩具放进三个不同碗里这样的简单操作了:而且还能玩抛物游戏:网友们看了直呼excitng!据作者透露,这一套设备的成本是2万7千美元。具体的论文和线上教程,目前都已发布。有哪些新升级?ALOHA2首先改进了机器人的夹持器,让它们能够抓得更牢、更稳。利用低摩擦的轨道设计,能向夹持器顶端输出原本2倍的力。同时还改变了握带的布局,提升抓取小物体的能力。并且取代了ALOHA原有的剪刀导轨式机械手设计,采用低摩擦轨道设计,降低机械复杂性,让遥控操作更流畅。其次,改善了前臂的重力补偿。用一个恒力牵引器和一个弹簧滑轮系统,机械臂可以在更多空间活动、悬停,比原来使用的橡皮筋更牢固。最后,还在保留必需摄像头安装点的情况下,简化了框架周围的工作单元,这让人机合作有更大的空间。同时这一次还发布了一个ALOHA sim模型,可以在没有硬件设备的情况下,在Mujoco中用ALOHA完成复杂任务。ALOHA是啥?ALOHA最初是由斯坦福等推出的一个双机械手远程操作的低成本开源硬件系统。今年1月,斯坦福团队升级版机器人控制方案Mobile ALOHA。让它能做各种家务,当时在网络上爆火。ALOHA支持真人遥控操作和全自动两种工作模式。前不久发布的Mobile ALOHA在堆满家具的复杂环境中,机器人系统仅通过少量的人类示教,就学会了各种复杂移动操纵任务,如叫电梯、开柜门、擦桌子等。学习过程中,移动底座的速度与双手的14自由度等操纵信息,一同作为示范算法的输入,和ALOHA静态数据一起对系统进行联合训练。而且该系统不仅兼容多种示教学习算法,而且对于用户而言,掌握教学的方法也十分容易。而如果采用真人操作,可以做出更为复杂的菜色。值得一提的是,当时Mobile ALOHA爆火后,作者随后放出的翻车集锦也引发巨大关注。“显然机器人还没有做好接管这个世界的准备doge”不过如今随着ALOHA 2的最新升级,大家对于机器人做家务,又能有更多期待了~ ... PC版: 手机版:

封面图片

防止聊天机器人“造谣”,谷歌 DeepMind、斯坦福大学研究人员推出 AI 事实核查工具

防止聊天机器人“造谣”,谷歌 DeepMind、斯坦福大学研究人员推出 AI 事实核查工具 (英文) 研究人员推出了一种基于大语言模型的工具 搜索增强事实评估器(IT之家注:原名为 Search-Augmented Factuality Evaluator,简称 SAFE),可对聊天机器人生成的长回复进行事实核查。

封面图片

昨天斯坦福大学的ALOHA机械臂开源项目因做菜洗碗视频火爆出圈,研发团队今天再发新,展示机械臂完成衣服送洗、叠衣服、使用吸尘

昨天斯坦福大学的ALOHA机械臂开源项目因做菜洗碗视频火爆出圈,研发团队今天再发新视频,展示机械臂完成衣服送洗、叠衣服、使用吸尘器洗碗机和做胶囊咖啡等家政工作的能力。 #观察 根据目前机械臂的学习和执行力进展,如果成本能进一步下降,残障人士和老人的生活自理难题有希望得到解决。

封面图片

关于【宇树】新出的机器人unitree G1

关于【宇树】新出的机器人unitree G1 有两个比较吸引人的点,完成度相对较高和相对较低的价格 1. 先说最大的差别,就是腿是不是反弓,人形机器人的腿有两种不同的形式,一种是鸵鸟腿,一种是人腿。宇树在自己的H1产品中就使用了人腿形的机器人。 2. 反弓最大的优势是在电机的集成度上,也就是可以把电机最大程度的集约到核心区域。这样对于电机的性能要求会有所降低。 3. 但是宇树的核心就在于电机的性能和性价比很不错。 4. 所以这也是机器人公司的盈利手段,人形机器人相比于真的有什么产品力而言。卖电机的收益也不会小。 5. 很多人会觉得这样的机器人如果会做饭用在家里还是不错的,但是我们主要到宇树最后的小字,不要靠的太近,这也是刚体机器人的一个重要安全隐患,电机容易抽搐和发疯,随时随地给你来一个地板动作也不是不可能。 6. 所以具身智能(人形机器人),的投资大头还是我们熟悉的汽车产业。 7. 机械臂的大规模发展,资金就是来源于汽车产业。而现在的机器人学,基本上是建立在机械臂的基础上的。所以与其说咱看到一个两条腿,两个胳膊的机器人,不如说是四条机械臂连在一起(划掉) 8. 最后一个不成熟地展望,具身智能,会成为载人航天,尤其是载人登月,的先驱。相比于地球的环境,月球的低重力环境,和比较严酷的环境,更加适合机器人选手。

封面图片

叠衣服、擦案板、冲果汁……能做家务的国产机器人终于要来了

叠衣服、擦案板、冲果汁……能做家务的国产机器人终于要来了 折叠衣物(3 倍速播放):对柔性物体的操作长久以来都是困扰整个 manipulation 领域的难题,需要高度灵活的操作和精细的动作协调。切火腿(2 倍速播放):复杂的摩擦和阻力,难以用传统方法快速建模,需要精确的力度控制与物体定位。切黄瓜,2 倍速播放:在一种物体上习得的能力直接泛化到不同物体的操作上。用海绵擦掉案板上的污渍(2 倍速播放):自修正的 close loop 控制能力,在不同压力和表面条件下的精细力度控制,实时检测并调整擦拭动作,确保彻底清洁污渍。用勺子从罐子里取出适量的果汁粉(3 倍速播放):使用工具的过程中,处理复杂的摩擦一直以来都是极大难点。冲果汁,举起水壶往杯中倒入适量的水(3 倍速播放) :流体引入大量的随机性,准确操作非常困难。这家去年底成立的公司,汇聚了来自世界著名人工智能 / 机器人学实验室以及国内外顶尖高校的优秀人才,拥有雄厚的科研背景。公司的目标是“将人类从无意义的体力劳动中解放出来”,专注于机器人领域的基础模型(foundation model)研发。目前,团队正在构建一个具备从感知到行动的端到端能力的通用机器人大模型(“中枢神经”),目标是能够控制低成本硬件(如数千元的机械臂),完成包括烹饪、打扫卫生在内的日常家务,并在未来扩展到照顾老人和小孩等更复杂的家庭护理工作,以及完成其他达到人类水平的通用操作任务。基于具身智能大模型,开发通用机器人平台尽管机器人管家是人类对智能未来最具代表性的畅想,但在现实生活中,能够胜任家务劳动的通用服务机器人几十年来的发展一直困难重重。家庭环境的多样性和不可预测性要求机器人具备高度复杂的感知能力、灵活精确的机械操作、智能的决策和规划,以及有效的人机交互能力。此外,技术的集成、机器人的安全性、续航能力、成本等,也是必须克服的重要障碍。传统的机器人通常采用基于规则和单一任务环境的方式,很难根据环境变化自主调整策略,从长远看也几乎不可能规模化。大语言模型(LLM)等人工智能技术的突破,为机器人领域带来了新的曙光。Google的 RT-2 系统将视觉-语言-动作模型与机器人技术相结合,使机器人能够处理复杂场景,并响应人类的指令。DeepMind 的 AutoRT 系统则使用视觉-语言模型(VLM),帮助机器人适应未知环境,并利用 LLM 来为机器人提供指令。大模型在知识迁移和泛化方面的这些优势,有望帮助机器人逼近甚至超越人类的水平。X Square 认为,目前机器人领域正处于技术的代际更迭之际。 斯坦福 ALOHA 等项目表明,通用机器人发展的瓶颈在于智能而非硬件。事实上,机器人领域长期以来面临的两大困难,一是如何在复杂环境中精确感知并做出精细的操作(low level 智能),二是缺乏类似人类的推理、规划、交互等高级认知能力(high level 智能)。从感知到行动,机器人的智能可以被视为一个从 high level 逐步到 low level 的决策过程。大模型的出现为解决上述难题带来了新思路。运用 LLM 或 VLM 来进行高阶推理与规划、与人交互,已经成为业界公认的发展方向。但是,直接用单一的大模型来驱动端到端的机器人 manipulation,目前尝试的团队还不多。X Square 的独特之处便在于此,团队基于过往在模型、算法、系统、硬件等方面的科研成果积累,集合所有技能训练“机器人 Large Manipulation Model”,从手部操作切入,基于具身大模型来构建可以精细操作的通用机器人。团队希望结合 high-level 的推理规划模型与 low-level 的操作控制模型,打造一个类似“机器人大脑-小脑”的通用操作系统。“我们公司名为 X Square,寓意要同时在 high level 推理和 low level 控制这两个维度做大模型,并把两者有机结合。目前我们在两个方向都已有不错的基础,有信心在一年内从追赶到超越目前的世界领先水平。”X Square 指出:“与腿的移动能力相比,手的操作能力包含了更丰富和复杂的动作,要求更高级别的控制精度。人类手部的精细操作是我们智能的根本表现。”不同于很多人形机器人公司关注对人体形态的模仿,X Square 更关注实现接近人类的功能。“采用轮式移动底盘搭配双臂,可以大幅降低成本,2-3 年内整体硬件成本有望降至 1 万美元以下,我们认为放弃 5% 的人形功能来换取数量级的成本优势是值得的。”软硬件一体,驱动数据飞轮“我们希望模型拥有怎样的能力,就需要提供给模型什么样的数据。是数据,而非算法或结构决定了模型的能力,这是当今时代的核心方法论。”机器人的特殊性在于,它是一个具有前所未有复合性的综合系统。相比纯软件的 LLM 和多模态大模型,具身智能大模型虽然在规模上暂时无法与之相比,但在工程上难度要高出许多,它必须在海量的真实和模拟场景中不断实践、学习。因此,能否找准技术方向,在降低开发成本和提高迭代效率的同时,打造高质量的数据采集能力,控制试错成本,最终实现规模化,是决定成败的关键因素。这对团队软硬一体的能力提出了很高的要求,因为是否具有足够的软硬结合能力,在机器人这一多模态集中融合的领域直接关系到迭代速度与数据质量。软硬件一体发展,是 X Square 的核心理念。无论是机器人本体的形态设计,还是数据采集系统,都是为机器人“中枢神经系统”的开发在服务。在模型算法设计上,X square 也有自己独特的理解和创新。“除了需要有专门的数据,还需要针对性的结构设计和训练方法,不能单纯套用其他领域的大模型经验,因为它必须直接面对复杂的真实世界,要在真实世界中不断实践、迭代。”同时,由于大模型与传统 deep learning for robotics 具有相当的 gap,是否真正具备足够的大模型训练落地经验,决定了能否快速构建通用具身智能大模型。这也正是 X Square 的优势所在。“目前语言大模型的训练预测架构在机器人上不完全work,以 Transformer 为底座算法模型不能很好地支持因果关系的推理,而因果性在机器人所在的物理世界中大量出现,并在机器人操作中起关键作用。为了处理因果性,目前有很多 world model 的尝试。但当前的世界模型要么完全集中在图像 / 视频重建上(如 Sora),要么完全集中在高层语义理解上,缺乏适合机器人的形态。”X Square 笃定机器人大模型这个方向,一方面是基于团队成员亲历深度学习从被质疑到一统江湖,以及 LLM 从默默无闻到大放异彩的技术浪潮,另一方面,也是看好中国作为全球硬件中心,拥有得天独厚的产业链优势,也有利于快速缩短机器人的研发周期。团队在不到 3 个月的时间里,就完成了技术架构的搭建和早期模型的训练,展现出惊人的成长速度和卓越的工程能力。“在现阶段,我们也积极寻求与上下游合作伙伴的协作,实现智能的迭代升级。未来,随着具身智能大模型技术的日益成熟,我们会更聚焦于特定应用场景,推出自己的机器人产品,例如能完成做饭、打扫等复杂家务的机器人保姆,甚至进行老年人康养护理等服务。”X Square 表示。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人