开源一下这一年多布具身智能领域的思路 -

开源一下这一年多布具身智能领域的思路 - 第一类,在最hype的时间窗口里拿走桌上的筹码慢慢磨场景 第二类,做最好的铲子,数据服务、计算芯片、电机,活5年,攒技术储备小赢、攒生态壁垒大胜 接下来会看稀缺数据场景,找生化实验室自动化的具身方案 欢迎交流

相关推荐

封面图片

just 具身智能和一个做人型机器人/具身智能的朋友交流了一下

just 具身智能 和一个做人型机器人/具身智能的朋友交流了一下 【四足小狗的意义】 像逐际动力、宇树科技这一类四足机器人企业,所面临的主要场景是电厂巡检。 我提出的问题是,如果单纯想目前pr中显示的,上几个楼梯,为什么不用导轨+摄像头+边缘盒子的方案? 主要的核心在于两点, 1.使用了巡检机器人,则工地的布置,行走检修的路线可以获得比较高的灵活度,而不是工厂一直就只能是那个装修和布局。 2.机器人的路线可以有差别,从而实现摄像机的不同视角,从而达到更好的拍摄密度,实现更精密的巡检。 【解耦+轮足一体】 其实机器人也可以和汽车一样实现上下解耦,包括研发线上也是,上半身执行器研究和下半身移动平台研究。理论上来讲,上半身基本是仿人的双执行器。而下半身其实是比较值得考究的。 双足的问题就在于仿真和控制效率不高,从而导致功耗较大,但优势在于一些复杂路况的翻越。但是大部分情况下没有这么复杂的路况。而轮胎型其实是功耗比较低的方案,比如北欧的机器人NEO。 因此,可以做一款轮足一体的移动平台。轮子放在小腿靠膝盖的地方,在不需要双足驱动的时候把轮子放下来变成轮子底盘。 【具身智能的难点-高水平电机,高性能线性执行器】 目前主要的难点还是聚焦于两块,一个是高性能线性执行器的设计,这一块类似于人类肌肉、关节形成一个锁定三角从而在人类负载的时候不需要持续做功。 另一个就是高性能的电机,主要还是在于瞬时最高扭矩无法达到。从而无法实现一些动作。除非通过一些外接的气动/液压等技术,才能做到一个瞬时释放能量。超级电容器也是一种思路,但是会比较大的损伤电机,就类似于目前电动汽车里轴承的电蚀现象 包括这种问题也会反应在执行速度上,指令可以很快,1000hz,但是执行会很慢(类似于你才踏板到汽车启动的一个过程,会有比较大的实质),得到反馈倒不慢,rl能到10-100hz 【具身智能的难点】 中国5G的基础建设还在进行中,5G基站覆盖面积短衰变大,而具身智能其实需要比较高的5G传输才能实现大模型和具身智能的交互。一旦有信号波动很有可能在执行层面实现误差。 因为边缘盒子最多承载几B的模型,而不是几百B的大模型。 这个可能是阻碍具身智能实现从B到C比较大的问题。换句话说目前具身智能,只有身,没有具。

封面图片

华为云发布盘古具身智能大模型:“夸父”人形机器人亮相

华为云发布盘古具身智能大模型:“夸父”人形机器人亮相 据介绍,盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。大模型的多模态能力以及思维能力的快速提升,使机器人能够模拟人类常识进行逻辑推理,并在现实环境中高效精准地执行任务,从而有效解决了复杂环境感知与物理空间认知的难题。通过集成多场景泛化和多任务处理能力,不论是生活场景还是工业场景,都能游刃有余的应对。大会现场展示中,“夸父”可以通过识别物品、问答互动、击掌、递水等互动演示,直观展示了双方基于盘古大模型的合作成果。通过模仿学习策略显著提升了人形机器人的双臂操作能力,实现了软硬件层面的协同优化,不仅增强了机器人综合性能,还克服了小样本数据训练的局限性,推动了泛化操作能力的边界。张平安在大会上表示,除了人形机器人,盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人,让它们帮助人类去从事危险和繁重的工作。具身智能大模型可以让机器人作用更加广泛,未来真正实现让AI机器人帮助我们去洗衣、做饭、扫地,让我们有更多的时间去看书,写诗,作画。 ... PC版: 手机版:

封面图片

#人型 #机器人 #投资 #具身智能

#人型 #机器人 #投资 #具身智能 现在大家都在看人型机器人和具身智能,但都没搞明白投资具身机器人到底是投资什么。 现在我们看到大部分的投资,讲的故事都是说五年内会有居家性的机器人卖到消费者手上,但如果我们看现在实际的案例和学术理论这种假设是基本上没法成立的。 现在机器人技术上能解决的比较好的,就是1)如何在不同的环境能够维持平衡并且行动,这个包括轮式,双足、四足;2)还有就是不同自由度的机器臂进行预定好的,提前设置的,提前规划的移动。这种技术已经非常成熟了,所以在工业场景进行简单的搬运、组装、上下料,这个完全没有任何问题。 但是如果要进行在居家环境里面进行稍微比分拣不同东西更复杂的操作的话,现在还没有任何模型能够胜任。甚至现在去进行这些复杂动作的数积集和模型框架都不成熟。 现在generative人工智能之所以这么火,是因为在学术界有两个很大的突破,一个是attention is all you need (transformer), 另一个是latent diffusion。那大家可以想一想,在机器人和现实世界的互动中,就现在的理论知识去解决这个问题够吗? 这个突破还没出现。 那投资人实际应该去投资的是什么呢?答案是5年前类似openai的公司,openai在过去五年期间我一直关注,大家可能忘了,他们做了很多理论的突破,都没有寻求变现,而是去验证模型本身的可行性。我第一次关注到他们是在游戏里面,他们用强化学习模型打赢了星际争霸的韩国冠军。这个没有进行任何变现的技术突破,在后来的GPT 3.5模型的收敛和人工矫正aligment效果上面是有趣大贡献的,就是大家现在所谓的RLHF。第二次关注到他们是基因序列模型,Alpha fold,这个在医疗领域,当时是轰轰烈烈的大突破,但他们也没有将它进行直接变现。第三次关注到他们是GPT3语言大模型的发布,但这个模型出来后,他们也没有进行变现。我想说的是,学术领域的突破到实际应用的落地是需要接受很长一段时间的没有任何变现的(没有任何收入的)积累。

封面图片

今年的机器人开发者大会论坛感受下来,国产具身智能企业各有特点,十分有意思

今年的机器人开发者大会论坛感受下来,国产具身智能企业各有特点,十分有意思 1. 傅里叶智能,CEO顾捷饱含情怀,十几年如一日摸索落地形态与场景,最新人形机器人小批量量产100台 2. 智元机器人,头顶天才少年光环万众瞩目,成立一年多以来还是在本体和机械层面优化中,且看沿途下蛋会交付什么出来吧 3. 银河通用,十分接近我对AGI的想法,合成数据训练小模型GPT的大模型,操作加学习清晰明了,不愧是BAAI合作单位 4. 达闼机器人,搞了套机器人OS,机器人技术表现很一般,未来就卖操作系统?听说是最有可能先上市的机器人公司 5. 科大讯飞,像PPT路演的,一直营销自家的多模态。有模型有智能硬件,离机器人有多远?

封面图片

今年 OnBoard! 最后一期压轴上新!今年要谈论AI,怎么能错过这么一个重要的话题: 具身智能。

今年 OnBoard! 最后一期压轴上新!今年要谈论AI,怎么能错过这么一个重要的话题: 具身智能。 这一轮热潮中,从学术到工业落地,如何分别噪音与真实? 这次的嘉宾阵容,真是太适合回答这些问题了:Google DeepMind Robotics 的 Fei Xia,几个最重磅的研究的核心参与者。高仙机器人的深度学习总监 Jiaxin, UCSD做模拟环境相关的研究的Fanbo Xiang。 我们对AI泛化能力在机器人领域的落地的进展、挑战、未来,进行了深入的讨论,来自研究和产业界不同观点的碰撞,精彩纷呈。 其实这一期的录制已经过去了几个月,阴差阳错成了今年的压轴,也算是对于OnBoard 全年的一个圆满句号,又是整个旅程小小的逗号。新的一年,不论世界如何起落,我们都选择相信未来有希望,珍惜每一次对话,赞美每一个在未知中选择的勇士。

封面图片

经过一年多的锻炼,我终于不再怯于跟「硅谷/常青藤 AI 创业者们」沟通了。

经过一年多的锻炼,我终于不再怯于跟「硅谷/常青藤 AI 创业者们」沟通了。 过去的几年,我一直有个心结: 那就是,跟这帮背景好的人比,我在学校成绩不如人家,出来也混得不如人家。 再加上本身就内向,又不懂技术,所以很担心对方会看不起自己。 于是,每次跟他们沟通,我都特别紧张,时刻担心自己表现不好。 1、 毕业的前些年,确实混得贼不好。早期报名群响的时候,填完报名表,都没人愿意联系我。 现在仍然混得也不好,比如今晚聊的那位硅谷创业者,虽然跟我同一年从同一所学校毕业,但人家出完国就进了世界级大厂,干的都是影响几亿人的工作。几年前出来创业,已经融了不少钱。 不过,还是能跟他们聊得比较开心的。 原因在于,我也终于可以给他们提供点增量信息了(也就是,他们之前没听过,但确实会感兴趣的信息)。 最近一年多聊下来,发现我最能勾起他们兴趣的增量信息,一共分两种:水下信息和下沉市场。 2、水下信息 “水下”,是跟“水上”相对应的,所谓“水上信息”就是大家通过公开渠道可以搜索到的,比如各家大厂的产品或新闻。 所以,“水下信息”就是市面上搜不到的一些信息。它们真实发生过且影响过不少的人,但只在一些小圈子流传。比方说,某些国内真正赚到钱的“AI 团队”的生意模式。 “水下”,并不意味着上不得台面,更多属于闷声赚钱类型。赚钱的人,不一定愿意分享出来;外面的人,乍一看觉得不是多么高大上。 例如早期的微商,人家微信生态做得好,确实能提一辆车,但正经人都看不上,只在微商和流量玩家的小圈子里流传。 等到公域流量没有红利了,各家大厂也开始学微商的搞法,顺便搞造了个高大上的概念“私域流量”。 3、下沉市场 下沉市场的信息,又至少可以分两类。 第一类是二三线以下城市的消费者的情况,比如短剧的核心受众。这类他们可能懂一些,但知道的肯定没我多。 因为我本就是西南少数民族地区出来的,又在 58 同城跟乡镇一级的代理们打过一年多的交道,更有切身体会。 第二类则是草根的创业者,他们不奢求融资,不玩高大上,更不会一上来就要造平台。 比如聊创作者经济,今晚的这位非草根的硅谷 AI 创业者,更多会是从平台的角度去分析,有很多基于 web3 的洞察,甚至会带入马化腾等巨头老板的视角。 但我更多会补充真实抖音草根创业者的做法,比方说早在 2020 年他们就不再盲目准求流量,而是争取来的第一个粉丝就会付费。 4、最后的话 在他们还可以聊梦想、谈高科技的时候,看到我还聊这么“LOW”的内容,他们多多少少会觉得高出我一头。 高就高吧,反正我不乐意参与这帮人的鄙视链游戏。因为我确实玩不过,也从来没玩过过。 随着融资越来越难,市场对创业者造血能力的要求,也越来越高了。 在这种时候,某些踏踏实实独立面向市场的能力,也未尝不是他们所缺失的。而这,也正是我得以跟他们平等交流的底气之一。 此外,对某一个事物的热爱,也是不会受鄙视链的影响的。无论彼此处于所谓鄙视链的哪个环节,只要是有共同的热爱,总是能找到畅聊的契机。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人