分析框架:观点:具身智能在消费市场五年内没有机会。

分析框架: 观点:具身智能在消费市场五年内没有机会。 事实:科研、工程、投资、生产、市场不断向前递进迭代。要经历很多年。 观点:当下阶段走到哪里了呢?工程试产阶段,早期融资阶段。 事实:以驾驶为例,这是一个标准化、价值高的超大市场。但很少有人选择用具身机器人去坐在驾驶位作为自动驾驶解决方案,而是选择将系统内嵌在汽车中。这一方案即将实现。 观点:垂直领域机器人会越来越快发展,而具身机器人在软硬件技术、工程、成本、市场等多个方面都存在不成熟,这必定会经历反复很多年的发展。 结论:机遇和阶段对于不同的人完全不一样!!!你是投资还是创业,是技术工作还是管理工作?掌握产业发展周期,根据自己的资源禀赋在合适时机切入赛道才是正确的选择。

相关推荐

封面图片

昨天闭门会我的观点1、具身智能和机器人的区别:具身智能的核心是通用的脑子。没脑子前就做硬件,很可能就是错的。

昨天闭门会我的观点 1、具身智能和机器人的区别:具身智能的核心是通用的脑子。没脑子前就做硬件,很可能就是错的。 2、具身智能最后一定会是人形,因为能适配人类的工具链和环境。未来机器人分两种:替代人的具身智能(通用人形机器人)、升级版的智能设备。 3、现在的国内问题在哪?1还没脑子,2陷入物理世界的迭代 4、应该怎么做?欢迎来参加闭门会,明晚(周二)北京中关村

封面图片

just 具身智能和一个做人型机器人/具身智能的朋友交流了一下

just 具身智能 和一个做人型机器人/具身智能的朋友交流了一下 【四足小狗的意义】 像逐际动力、宇树科技这一类四足机器人企业,所面临的主要场景是电厂巡检。 我提出的问题是,如果单纯想目前pr中显示的,上几个楼梯,为什么不用导轨+摄像头+边缘盒子的方案? 主要的核心在于两点, 1.使用了巡检机器人,则工地的布置,行走检修的路线可以获得比较高的灵活度,而不是工厂一直就只能是那个装修和布局。 2.机器人的路线可以有差别,从而实现摄像机的不同视角,从而达到更好的拍摄密度,实现更精密的巡检。 【解耦+轮足一体】 其实机器人也可以和汽车一样实现上下解耦,包括研发线上也是,上半身执行器研究和下半身移动平台研究。理论上来讲,上半身基本是仿人的双执行器。而下半身其实是比较值得考究的。 双足的问题就在于仿真和控制效率不高,从而导致功耗较大,但优势在于一些复杂路况的翻越。但是大部分情况下没有这么复杂的路况。而轮胎型其实是功耗比较低的方案,比如北欧的机器人NEO。 因此,可以做一款轮足一体的移动平台。轮子放在小腿靠膝盖的地方,在不需要双足驱动的时候把轮子放下来变成轮子底盘。 【具身智能的难点-高水平电机,高性能线性执行器】 目前主要的难点还是聚焦于两块,一个是高性能线性执行器的设计,这一块类似于人类肌肉、关节形成一个锁定三角从而在人类负载的时候不需要持续做功。 另一个就是高性能的电机,主要还是在于瞬时最高扭矩无法达到。从而无法实现一些动作。除非通过一些外接的气动/液压等技术,才能做到一个瞬时释放能量。超级电容器也是一种思路,但是会比较大的损伤电机,就类似于目前电动汽车里轴承的电蚀现象 包括这种问题也会反应在执行速度上,指令可以很快,1000hz,但是执行会很慢(类似于你才踏板到汽车启动的一个过程,会有比较大的实质),得到反馈倒不慢,rl能到10-100hz 【具身智能的难点】 中国5G的基础建设还在进行中,5G基站覆盖面积短衰变大,而具身智能其实需要比较高的5G传输才能实现大模型和具身智能的交互。一旦有信号波动很有可能在执行层面实现误差。 因为边缘盒子最多承载几B的模型,而不是几百B的大模型。 这个可能是阻碍具身智能实现从B到C比较大的问题。换句话说目前具身智能,只有身,没有具。

封面图片

【清华大学副教授眭亚楠:大语言模型与具身智能具有强互补性】

【清华大学副教授眭亚楠:大语言模型与具身智能具有强互补性】 10 月 26 日,在 2023REAL 科技大会上,清华大学副教授眭亚楠表示,大语言模型与具身智能是强互补性的,大语言模型已经很大程度解决了感知问题,可以提升具身智能的研究和转化前沿。机器领域的感知来自于视觉,由于视觉的快速提升,使得具身智能和机器人的能力也在快速提升。接下来几年,随着语言能力,机器人的控制、规划能力也在快速提升,大语言模型和多模态能力,更会让具身智能进一步提升。 快讯/广告 联系 @xingkong888885

封面图片

华为云发布盘古具身智能大模型:“夸父”人形机器人亮相

华为云发布盘古具身智能大模型:“夸父”人形机器人亮相 据介绍,盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。大模型的多模态能力以及思维能力的快速提升,使机器人能够模拟人类常识进行逻辑推理,并在现实环境中高效精准地执行任务,从而有效解决了复杂环境感知与物理空间认知的难题。通过集成多场景泛化和多任务处理能力,不论是生活场景还是工业场景,都能游刃有余的应对。大会现场展示中,“夸父”可以通过识别物品、问答互动、击掌、递水等互动演示,直观展示了双方基于盘古大模型的合作成果。通过模仿学习策略显著提升了人形机器人的双臂操作能力,实现了软硬件层面的协同优化,不仅增强了机器人综合性能,还克服了小样本数据训练的局限性,推动了泛化操作能力的边界。张平安在大会上表示,除了人形机器人,盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人,让它们帮助人类去从事危险和繁重的工作。具身智能大模型可以让机器人作用更加广泛,未来真正实现让AI机器人帮助我们去洗衣、做饭、扫地,让我们有更多的时间去看书,写诗,作画。 ... PC版: 手机版:

封面图片

#人型 #机器人 #投资 #具身智能

#人型 #机器人 #投资 #具身智能 现在大家都在看人型机器人和具身智能,但都没搞明白投资具身机器人到底是投资什么。 现在我们看到大部分的投资,讲的故事都是说五年内会有居家性的机器人卖到消费者手上,但如果我们看现在实际的案例和学术理论这种假设是基本上没法成立的。 现在机器人技术上能解决的比较好的,就是1)如何在不同的环境能够维持平衡并且行动,这个包括轮式,双足、四足;2)还有就是不同自由度的机器臂进行预定好的,提前设置的,提前规划的移动。这种技术已经非常成熟了,所以在工业场景进行简单的搬运、组装、上下料,这个完全没有任何问题。 但是如果要进行在居家环境里面进行稍微比分拣不同东西更复杂的操作的话,现在还没有任何模型能够胜任。甚至现在去进行这些复杂动作的数积集和模型框架都不成熟。 现在generative人工智能之所以这么火,是因为在学术界有两个很大的突破,一个是attention is all you need (transformer), 另一个是latent diffusion。那大家可以想一想,在机器人和现实世界的互动中,就现在的理论知识去解决这个问题够吗? 这个突破还没出现。 那投资人实际应该去投资的是什么呢?答案是5年前类似openai的公司,openai在过去五年期间我一直关注,大家可能忘了,他们做了很多理论的突破,都没有寻求变现,而是去验证模型本身的可行性。我第一次关注到他们是在游戏里面,他们用强化学习模型打赢了星际争霸的韩国冠军。这个没有进行任何变现的技术突破,在后来的GPT 3.5模型的收敛和人工矫正aligment效果上面是有趣大贡献的,就是大家现在所谓的RLHF。第二次关注到他们是基因序列模型,Alpha fold,这个在医疗领域,当时是轰轰烈烈的大突破,但他们也没有将它进行直接变现。第三次关注到他们是GPT3语言大模型的发布,但这个模型出来后,他们也没有进行变现。我想说的是,学术领域的突破到实际应用的落地是需要接受很长一段时间的没有任何变现的(没有任何收入的)积累。

封面图片

原淘宝内容电商事业部负责人程道放离职,将投身具身智能事业

原淘宝内容电商事业部负责人程道放离职,将投身具身智能事业 记者从淘宝内容电商事业部负责人程道放处获悉,程道放已于本周离开淘天内容电商事业部负责人的岗位,不再负责淘宝直播和逛逛的相关业务。后续将投身到具身智能的相关工作。 程道放在朋友圈公开表示,“近几年 AIGC(人工智能生成内容)的进展让我很兴奋,我坚信这一轮 AI(人工智能)的浪潮最终会在机器人领域大放异彩。未来已来,碳基生命往硅基生命迁移的大幕已经拉开。后续我会花一段时间学习,也欢迎有机器人相关兴趣和背景的同学找我交流”。(贝壳财经)

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人