just 具身智能和一个做人型机器人/具身智能的朋友交流了一下

just 具身智能和一个做人型机器人/具身智能的朋友交流了一下【四足小狗的意义】像逐际动力、宇树科技这一类四足机器人企业，所面临的主要场景是电厂巡检。我提出的问题是，如果单纯想目前pr中显示的，上几个楼梯，为什么不用导轨+摄像头+边缘盒子的方案？主要的核心在于两点， 1.使用了巡检机器人，则工地的布置，行走检修的路线可以获得比较高的灵活度，而不是工厂一直就只能是那个装修和布局。 2.机器人的路线可以有差别，从而实现摄像机的不同视角，从而达到更好的拍摄密度，实现更精密的巡检。【解耦+轮足一体】其实机器人也可以和汽车一样实现上下解耦，包括研发线上也是，上半身执行器研究和下半身移动平台研究。理论上来讲，上半身基本是仿人的双执行器。而下半身其实是比较值得考究的。双足的问题就在于仿真和控制效率不高，从而导致功耗较大，但优势在于一些复杂路况的翻越。但是大部分情况下没有这么复杂的路况。而轮胎型其实是功耗比较低的方案，比如北欧的机器人NEO。因此，可以做一款轮足一体的移动平台。轮子放在小腿靠膝盖的地方，在不需要双足驱动的时候把轮子放下来变成轮子底盘。【具身智能的难点-高水平电机，高性能线性执行器】目前主要的难点还是聚焦于两块，一个是高性能线性执行器的设计，这一块类似于人类肌肉、关节形成一个锁定三角从而在人类负载的时候不需要持续做功。另一个就是高性能的电机，主要还是在于瞬时最高扭矩无法达到。从而无法实现一些动作。除非通过一些外接的气动/液压等技术，才能做到一个瞬时释放能量。超级电容器也是一种思路，但是会比较大的损伤电机，就类似于目前电动汽车里轴承的电蚀现象包括这种问题也会反应在执行速度上，指令可以很快，1000hz，但是执行会很慢（类似于你才踏板到汽车启动的一个过程，会有比较大的实质），得到反馈倒不慢，rl能到10-100hz 【具身智能的难点】中国5G的基础建设还在进行中，5G基站覆盖面积短衰变大，而具身智能其实需要比较高的5G传输才能实现大模型和具身智能的交互。一旦有信号波动很有可能在执行层面实现误差。因为边缘盒子最多承载几B的模型，而不是几百B的大模型。这个可能是阻碍具身智能实现从B到C比较大的问题。换句话说目前具身智能，只有身，没有具。

在Telegram中查看

相关推荐

#人型 #机器人 #投资 #具身智能

#人型 #机器人 #投资 #具身智能现在大家都在看人型机器人和具身智能，但都没搞明白投资具身机器人到底是投资什么。现在我们看到大部分的投资，讲的故事都是说五年内会有居家性的机器人卖到消费者手上，但如果我们看现在实际的案例和学术理论这种假设是基本上没法成立的。现在机器人技术上能解决的比较好的，就是1）如何在不同的环境能够维持平衡并且行动，这个包括轮式，双足、四足；2）还有就是不同自由度的机器臂进行预定好的，提前设置的，提前规划的移动。这种技术已经非常成熟了，所以在工业场景进行简单的搬运、组装、上下料，这个完全没有任何问题。但是如果要进行在居家环境里面进行稍微比分拣不同东西更复杂的操作的话，现在还没有任何模型能够胜任。甚至现在去进行这些复杂动作的数积集和模型框架都不成熟。现在generative人工智能之所以这么火，是因为在学术界有两个很大的突破，一个是attention is all you need (transformer), 另一个是latent diffusion。那大家可以想一想，在机器人和现实世界的互动中，就现在的理论知识去解决这个问题够吗？这个突破还没出现。那投资人实际应该去投资的是什么呢？答案是5年前类似openai的公司，openai在过去五年期间我一直关注，大家可能忘了，他们做了很多理论的突破，都没有寻求变现，而是去验证模型本身的可行性。我第一次关注到他们是在游戏里面，他们用强化学习模型打赢了星际争霸的韩国冠军。这个没有进行任何变现的技术突破，在后来的GPT 3.5模型的收敛和人工矫正aligment效果上面是有趣大贡献的，就是大家现在所谓的RLHF。第二次关注到他们是基因序列模型，Alpha fold，这个在医疗领域，当时是轰轰烈烈的大突破，但他们也没有将它进行直接变现。第三次关注到他们是GPT3语言大模型的发布，但这个模型出来后，他们也没有进行变现。我想说的是，学术领域的突破到实际应用的落地是需要接受很长一段时间的没有任何变现的（没有任何收入的）积累。

华为云发布盘古具身智能大模型：“夸父”人形机器人亮相

华为云发布盘古具身智能大模型：“夸父”人形机器人亮相据介绍，盘古大模型能够让机器人完成10步以上的复杂任务规划，并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频，让机器人更快地学习各种复杂场景。大模型的多模态能力以及思维能力的快速提升，使机器人能够模拟人类常识进行逻辑推理，并在现实环境中高效精准地执行任务，从而有效解决了复杂环境感知与物理空间认知的难题。通过集成多场景泛化和多任务处理能力，不论是生活场景还是工业场景，都能游刃有余的应对。大会现场展示中，“夸父”可以通过识别物品、问答互动、击掌、递水等互动演示，直观展示了双方基于盘古大模型的合作成果。通过模仿学习策略显著提升了人形机器人的双臂操作能力，实现了软硬件层面的协同优化，不仅增强了机器人综合性能，还克服了小样本数据训练的局限性，推动了泛化操作能力的边界。张平安在大会上表示，除了人形机器人，盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人，让它们帮助人类去从事危险和繁重的工作。具身智能大模型可以让机器人作用更加广泛，未来真正实现让AI机器人帮助我们去洗衣、做饭、扫地，让我们有更多的时间去看书，写诗，作画。 ... PC版：手机版：

昨天闭门会我的观点1、具身智能和机器人的区别：具身智能的核心是通用的脑子。没脑子前就做硬件，很可能就是错的。

昨天闭门会我的观点 1、具身智能和机器人的区别：具身智能的核心是通用的脑子。没脑子前就做硬件，很可能就是错的。 2、具身智能最后一定会是人形，因为能适配人类的工具链和环境。未来机器人分两种：替代人的具身智能（通用人形机器人）、升级版的智能设备。 3、现在的国内问题在哪？1还没脑子，2陷入物理世界的迭代 4、应该怎么做？欢迎来参加闭门会，明晚（周二）北京中关村

今年的机器人开发者大会论坛感受下来，国产具身智能企业各有特点，十分有意思

今年的机器人开发者大会论坛感受下来，国产具身智能企业各有特点，十分有意思 1. 傅里叶智能，CEO顾捷饱含情怀，十几年如一日摸索落地形态与场景，最新人形机器人小批量量产100台 2. 智元机器人，头顶天才少年光环万众瞩目，成立一年多以来还是在本体和机械层面优化中，且看沿途下蛋会交付什么出来吧 3. 银河通用，十分接近我对AGI的想法，合成数据训练小模型GPT的大模型，操作加学习清晰明了，不愧是BAAI合作单位 4. 达闼机器人，搞了套机器人OS，机器人技术表现很一般，未来就卖操作系统？听说是最有可能先上市的机器人公司 5. 科大讯飞，像PPT路演的，一直营销自家的多模态。有模型有智能硬件，离机器人有多远？

DeepMind 推出“足球运动员”智能体机器人

DeepMind 推出“足球运动员”智能体机器人 Google DeepMind 研发的具身智能体(agent)微型人形机器人，不仅可以快速“奔跑”“过人”“进攻”，还可以阅读比赛，正确预测足球移动方向，以及阻挡对手射门等，并且可以在现实环境中进行对抗。使用深度强化学习训练低成本的现成机器人踢多机器人足球，机器人在训练后展现出的敏捷性和流畅性远超期望。智能体也涌现出了一些意想不到的策略，这些策略比脚本策略更充分地利用了系统的全部功能，而这些策略可能是人类根本没有想到的。该研究以4月封面文章的形式已发表在 Science Robotics 上，题为“利用深度强化学习让双足机器人掌握敏捷足球技能”。视频中左侧为具有学习能力的机器人，右侧是作为参照以脚本编程的机器人。 ,

分析框架：观点：具身智能在消费市场五年内没有机会。

分析框架：观点：具身智能在消费市场五年内没有机会。事实：科研、工程、投资、生产、市场不断向前递进迭代。要经历很多年。观点：当下阶段走到哪里了呢？工程试产阶段，早期融资阶段。事实：以驾驶为例，这是一个标准化、价值高的超大市场。但很少有人选择用具身机器人去坐在驾驶位作为自动驾驶解决方案，而是选择将系统内嵌在汽车中。这一方案即将实现。观点：垂直领域机器人会越来越快发展，而具身机器人在软硬件技术、工程、成本、市场等多个方面都存在不成熟，这必定会经历反复很多年的发展。结论：机遇和阶段对于不同的人完全不一样！！！你是投资还是创业，是技术工作还是管理工作？掌握产业发展周期，根据自己的资源禀赋在合适时机切入赛道才是正确的选择。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人