奥克兰一个乌干达移民的小孩,一口气申请了150所大学的音乐系,被122所录取,提供奖学金总共530万美元,最后决定去他父亲的母校

奥克兰一个乌干达移民的小孩,一口气申请了150所大学的音乐系,被122所大学录取,提供奖学金总共530万美元,最后决定去他父亲的母校UC伯克利学音乐(他父亲是伯克利机械工程系毕业的)。音乐系其实容易进,他申请这么多学校是行为艺术吗?他父亲希望他申请计算机专业有个铁饭碗,那就很难进了,尤其是伯克利的计算机专业,天下第一难进。

相关推荐

封面图片

这事上了电视了。强调加权GPA 4.42很高却没被一批名校录取,很误导人。在那所高中这个GPA不算高,只排21%,而他申请的是最

这事上了电视了。强调加权GPA 4.42很高却没被一批名校录取,很误导人。在那所高中这个GPA不算高,只排21%,而他申请的是最热门的计算机系,这个GPA低于UC计算机系录取的平均分,不被录取很正常。他被得州大学奥斯汀分校计算机系录取,并不比UC差,有啥可抱怨的?

封面图片

图灵奖揭晓:史上首位数学和计算机最高奖“双料王”出现了

图灵奖揭晓:史上首位数学和计算机最高奖“双料王”出现了 加上2021年获得的阿贝尔奖,维格森教授现在一举成为首个同时拿下数学和计算机最高奖的科学家。(阿贝尔奖也被誉为“数学界诺贝尔奖”)。此外,他还是2017年阿里达摩院刚成立时首批“十大祖师”之一。业内人士纷纷赶来表示祝贺,a16z的研发主管表示:除了已有的学术成果外,也是因为他几十年来孜孜不倦的领导力,才带来理论计算机科学界的长青与活力。比如,没有他,可能就不会有西蒙斯计算理论研究所。值得一提的是,他还在5个月前来到清华叉院做客,对当下大语言模型的发展表达了自己的看法。复杂性理论先驱荣获图灵奖作为一名数学家和计算机科学家,维格森最重要的贡献就是增强了人类对计算中随机性和伪随机性作用的理解。具体什么意思?20实际70年代末,计算机科学家们已经发现:随机性和计算难度之间存在显著联系。(这里的计算难度之高指的是那些没有有效算法,即无法在合理的时间内解决的自然问题,它们计算起来比较困难。)通俗一点解释就是:对于许多难题,采用随机性的算法(也称为概率算法)可以远远胜过其确定性方案。例如,在一个被称为“1977证明”的实现中,两位科学家就引入了一种随机算法,可以比当时最好的确定性算法更快地确定一个数字是否为素数。而在20世纪80年代初,维格森与UC伯克利的科学家Richard Karp合作,将随机性的概念与那些被认为计算难度高的问题联系起来,也就是没有已知的确定性算法可以在合理的时间内解决这些问题的问题。尽管不知道如何证明它们很难,维格森和Richard Karp还是发现了一种针对某个难题的随机算法,然后发现:能够将其去随机化,从而有效地揭示了它的确定性算法。大约在同一时间,其他研究人员也发现密码学问题中的计算难度假设能够实现一般的去随机化。这促使维格森思考随机性本身的特质。他和其他人一样,开始质疑随机性在高效问题解决中的必要性以及在什么条件下它可以完全被消除。终于,1994年,他和另一位计算机科学家Noam Nisan阐明了两者之间的联系。他们证明,如果存在任何自然难题,那么每一种有效的随机算法都可以被有效的确定性算法所取代。即我们总是可以消除随机性。更重要的是,他们还发现确定性算法可能使用“伪随机”序列也就是看似随机但实际上并非随机的数据串。换句话总结就是:随机性对于高效计算来说并不是必需的。即使在没有随机性的情况下,我们仍然可以使用有效的算法来解决问题。这一系列研究彻底改变了计算机科学家对随机性的看法,并适用于理论计算机科学的许多领域。今天,ACM就将图灵奖这一重要荣誉颁给了维格森,主要嘉奖的就是他在如上领域的贡献。在普林斯顿高等研究院的采访中,维格森解释自己既是一位数学家也是一位计算机理论科学家,研究的是计算领域的数学基础。我的研究领域是数学的一个子域,但同时,我所研究的主要概念是计算。对于理论计算机科学,他则认为这个学科拥有一个人对学术研究所能期望的所有优点,包含了一系列令人惊叹的深刻且具有重要智力意义的基本问题,而这些问题对人类、科学、生活和技术都至关重要。(看得出老爷子满满的热爱之情了。)而对于本次大奖,维格森则表示:自己很高兴看到ACM再次认可计算基础理论,它确实对计算科学的实践和技术发展做出了巨大贡献。大学被劝学计算机“好找工作”维格森于1956年在以色列出生,是一位护士和一名电气工程师的儿子。他的父亲喜欢拼图,并对数学的基本概念非常感兴趣,然后又经常跟孩子们分享他的想法。维格森这样描述父亲对他的潜移默化的影响:就是他让我感染了这种病毒。不过等他要在当地海法大学上学时,本想主修数学的他,却被他的父母劝导说:选择计算机吧,计算机好找工作!结果他发现这个领域有很多数学问题没有解决,于是开始吭哧吭哧解决了起来。维格森毕业于以色列理工学院和美国普林斯顿大学,1983 年凭借论文《组合复杂性的研究》获得博士学位。他早期的一项开创性工作,就是证明了一个看似矛盾的问题:能不能在不展示证明过程的情况下,让别人相信一个数学论断已经被证明了。是不是想起隐私计算领域姚期智提出的百万富翁问题内味了。那个问题就是两个百万富翁,他们想证明谁更富有,但两个人都不透露他们拥有多少财富。而原本的这个问题其实是叫做零知识证明,这个概念最早在1985年由三位科学家引入。随后由维格森以及他的合作伙伴Micali和Oded Goldreich进一步阐述了这一想法,并发现了一个意想不到的结果:如果真正安全加密是可能的,那么 NP 中每个问题的解也都可以用零知识证明来证明。换言之,零知识证明可以用于秘密地证明任何有关秘密数据的公开结果。数十年来,他始终活跃在学术岗位上,并且获得诸多赞誉和奖项。1994年,他因在计算复杂性理论方面的工作获得1994年的内万林纳博士毕业后,他在加州大学伯克利分校担任客座助理教授,在IBM担任访问科学家,并在伯克利的数学科学研究所担任研究员。1986年加入希伯来大学担任教员。1994年,他与Omer Reingold和Salil Vadhan一起因在图的 zig-zag 乘积方面的工作而获得了 2009 年哥德尔奖。1999年,他加入普林斯顿高等研究院并工作至今。2013年当选美国国家科学院院士。2018年,他因对计算机科学和数学理论的贡献当选ACM Fellow。第二年,又因为“在随机计算、密码学、电路复杂性、证明复杂性、并行计算以及我们对基本图特性的理解等领域对计算机科学基础做出的根本性和持久性贡献”,他荣获高德纳奖。2021年,维格森与László Lovász共同获得阿贝尔奖。也正因为这样根本性且持久性的贡献,网友们得知他才获图灵奖时感到意外而又惊喜,还以为他早就得了。也有人开始看他曾经写过的书籍了。或许有眼熟的朋友吗?谈大语言模型:最重要还是看它不能做什么而他与姚期智以及中国的缘分还在延续。5个月前,他还曾亲自来到清华叉院做客,带来题为“模仿游戏(Imitation Games)”的特邀报告。由姚期智院士亲自主持讲座,并与他展开对话。据报道,维格森从图灵测试出发,叙述了“模仿学习”理论的沿革及其在密码学、随机性、离散数学、数论等领域的现代应用。他基于凯撒密码、恩尼格玛密码机、选举等案例,引导思考安全性的定义、随机性的应用、隐私和效用的平衡等问题。对于理论计算机研究将如何应对人工智能发展这一问题,维格森表示,尽管包括大语言模型在内的人工智能有很多惊人表现,但最重要的问题是还有什么是AI不能做的。对于给现在正置身于科研的同学们,维格森也给出了自己的建议。他表示,自己曾为解决一个开放性问题用了40年时间,建议同学们要选择自己喜欢的研究领域和话题,并享受在失败中不断学习的过程,这样才能在科研道路上走得长远。参考链接:[1] ... PC版: 手机版:

封面图片

揭秘Sora:开发团队成立不到1年 核心技术曾因“缺乏创新”遭拒绝

揭秘Sora:开发团队成立不到1年 核心技术曾因“缺乏创新”遭拒绝 《每日经济新闻》记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由GoogleDeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一William Peebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。如今,Sora团队毫无疑问已经成为世界上最受关注的技术团队。记者查询OpenAI官网发现,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。值得注意的是,这支团队十分年轻,成立时间还尚未超过1年。核心突破一:时空Patch,站在Google肩膀上此前,OpenAI在X平台上展示了Sora将静态图像转换为动态视频的几个案例,其逼真程度令人惊叹。Sora是如何做到这一点的呢?这就不得不提到该AI视频模型背后的两项核心技术DiT架构和Spacetime Patch(时空Patch)。据外媒报道,Spacetime Patch是Sora创新的核心之一,该项技术是建立在GoogleDeepMind对NaViT(原生分辨率视觉Transformer)和ViT(视觉Transformer)的早期研究基础上。Patch可以理解为Sora的基本单元,就像GPT-4 的基本单元是Token。Token是文字的片段,Patch则是视频的片段。GPT-4被训练以处理一串Token,并预测出下一个Token。Sora遵循相同的逻辑,可以处理一系列的Patch,并预测出序列中的下一个Patch。Sora之所以能实现突破,在于其通过Spacetime Patch将视频视为补丁序列,Sora保持了原始的宽高比和分辨率,类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至关重要,使模型能够从更准确的表达中学习,从而赋予Sora近乎完美的准确性。由此,Sora能够有效地处理各种视觉数据,而无需调整大小或填充等预处理步骤。记者注意到,OpenAI发布的Sora技术报告中透露了Sora的主要理论基础,其中Patch的技术论文名为Patch n‘ Pack: NaViT, a Vision Transformer for any Aspect Ratio and Resolution。记者查询预印本网站arxiv后发现,该篇研究论文是由GoogleDeepMind的科学家们于2023年7月发表的。图片来源:arxiv.org图片来源:Google Scholar核心突破二:扩散型Transformer架构,相关论文曾遭拒绝除此之外,Sora的另一个重大突破是其所使用的架构,传统的文本到视频模型(如Runway、Stable Diffusion)通常是扩散模型(Diffusion Model),文本模型例如GPT-4则是Transformer模型,而Sora则采用了DiT架构,融合了前述两者的特性。据报道,传统的扩散模型的训练过程是通过多个步骤逐渐向图片增加噪点,直到图片变成完全无结构的噪点图片,然后在生成图片时,逐步减少噪点,直到还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。OpenAI发布的Sora技术报告透露,Sora采用的DiT架构是基于一篇名为Scalable diffusion models with transformers的学术论文。记者查询预印本网站arxiv后发现,该篇原作论文是2022年12月由伯克利大学研究人员William (Bill) Peebles和纽约大学的一位研究人员Saining Xie共同发表。William (Bill) Peebles之后加入了OpenAI,领导Sora技术团队。图片来源:arxiv.org然而,戏剧化的是,Meta的AI科学家Yann LeCun在X平台上透露,“这篇论文曾在2023年的计算机视觉会议(CVR2023)上因‘缺少创新性’而遭到拒绝,但在2023年国际计算机视觉会议(ICCV2023)上被接受发表,并且构成了Sora的基础。”图片来源:X平台作为最懂DiT架构的人之一,在Sora发布后,Saining Xie在X平台上发表了关于Sora的一些猜想和技术解释,并表示,“Sora确实令人惊叹,它将彻底改变视频生成领域。”“当Bill和我参与DiT项目时,我们并未专注于创新,而是将重点放在了两个方面:简洁性和可扩展性。”他写道。“简洁性代表着灵活性。关于标准的ViT,人们常忽视的一个亮点是,它让模型在处理输入数据时变得更加灵活。例如,在遮蔽自编码器(MAE)中,ViT帮助我们只处理可见的区块,忽略被遮蔽的部分。同样,Sora可以通过在适当大小的网格中排列随机初始化的区块来控制生成视频的尺寸。”图片来源:X平台不过,他认为,关于Sora仍有两个关键点尚未被提及。一是关于训练数据的来源和构建,这意味着数据很可能是Sora成功的关键因素;二是关于(自回归的)长视频生成,Sora的一大突破是能够生成长视频,但OpenAI尚未揭示相关的技术细节。年轻的开发团队:应届博士带队,还有00后随着Sora的爆火,Sora团队也来到世界舞台的中央,引发了持续的关注。记者查询OpenAI官网发现,Sora团队由William Peebles等3人领导,核心成员包括12人。从团队领导和成员的毕业和入职时间来看,这支团队成立的时间较短,尚未超过1年。图片来源:OpenAI官网从年龄上来看,这支团队也非常年轻,两位研究负责人都是在2023年才刚刚博士毕业。William (Bill) Peebles于去年5月毕业,其与Saining Xie合著的扩散Transformer论文成为Sora的核心理论基础。Tim Brooks于去年1月毕业,是DALL-E 3的作者之一,曾在Google和英伟达就职。图片来源:William (Bill) Peebles个人主页团队成员中甚至还有00后。团队中的Will DePue生于2003年,2022年刚从密西根大学计算机系本科毕业,在今年1月加入Sora项目组。图片来源:Will DePue个人主页此外,团队还有几位华人。据媒体报道,Li Jing是 DALL-E 3 的共同一作,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位,于2022年加入OpenAI。Ricky Wang则是今年1月刚刚从Meta跳槽到OpenAI。其余华人员工包括Yufei Guo等尚未有太多公开资料介绍。 ... PC版: 手机版:

封面图片

量化之王谢幕,“用数学赚钱比印钞机还快”

量化之王谢幕,“用数学赚钱比印钞机还快” 数学天才陶哲轩称他对数学和科学的现代基础设施投资举足轻重:他创办的的基金会不仅是arXiv的重要资助方,还支持了SLMath研究所(前MSRI)等主要机构,以及即将在费城举办的2026年国际数学家大会(ICM)。同时,我也有幸在过去十几年间得到Simons Investigator Award的支持,这极大地推动了我在加州大学洛杉矶分校团队的众多研究项目。AQR资本管理公司创始人Clifford Asness评论:丘吉尔曾说伟大与良善很少为一人所有。James Simons(西蒙斯),是这一规则的例外。北大智能学院副院长陈宝权,称他“是量化交易的鼻祖,用数学模型赚钱比印钞机还快”。所以西蒙斯,究竟何方神圣?他是量化交易鼻祖、“量化之王”,创办华尔街神话文艺复兴科技公司,旗下第一支基金产品Medallion,30年年均回报率达66%。他是数学天才,先后在MIT、哈佛任教,拿下奥斯瓦尔德·维布伦几何奖,与陈省身、杨振宁均有过合作。他还是一位慈善家,创立西蒙斯基金会,曾向清华捐赠了一栋“陈赛蒙斯楼”,资助项目涵盖生物学、数学、物理学、理论计算机科学、神经科学等众多领域。他也曾用这样话形容自己的一生:I did a lot of math. I made a lot of money, and I gave almost all of it away.(我做了大量的数学研究,赚了很多钱,然后几乎全部都捐了出去。)James Simons传奇的一生,刚刚画上了句号。但他的成就和影响力还在继续流传。用数学模型赚钱比印钞机还快在西蒙斯一生的诸多传奇经历中,最为人称道的就是创立文艺复兴科技公司(Renaissance Technologies),开创了量化交易的先河。所谓量化交易,简单说就是利用数学模指导交易决策,到现在整个华尔街有三分之一的交易都用到了这种方法。利用数学模型,西蒙斯把四个投资基金变成了“虚拟印钞机”,其中一支名为Medallion的基金,30年年均回报率达到了66%。除了把数学当做工具,缔造出华尔街传奇之外,西蒙斯在数学领域本身同样颇有贡献,陶哲轩将他称为一位著名的微分几何学家。究其原因,是他自幼对数学的热爱。1938年4月,西蒙斯出生于马萨诸塞州的牛顿,他的父亲是一家鞋厂的经理,母亲是全职主妇。他很早就表现出了对数学的热情,甚至打发时间的方式也因此有些与众不同有时会反复研究数字,还时不时思考芝诺悖论(一系列关于运动和时空的哲学难题)。在兴趣的驱使下,西蒙斯也成为了一名数学天才,1958年,年仅20岁的西蒙斯就完成了他在MIT的本科学习。不仅本科毕业得早,西蒙斯的博士生涯也是只用了三年就实现了“速通”1961年,他凭借“黎曼流形的完备性群分类的新证明”,获得了UC伯克利的数学博士学位,并先后到MIT和哈佛任教。但西蒙斯的第一段教授生涯持续时间并不长,然后就被征召参加密码破译工作,接着又在1968年因故被研究所开除。但幸运的是,在这段工作期间,西蒙斯没有放下对数学的研究,加上他之前天才般的经历,在西蒙斯被解雇后就有人递来橄榄枝,邀请他担任石溪大学(纽约州立大学石溪分校)数学系主任。也正是在这里,西蒙斯迎来了他人生中的第一个高光时刻。1974 年,他和陈省身共同发表了一篇题为《特征形式和几何不变量(Characteristic forms and geometric invariants)》的论文,提出了陈-西蒙斯不变量的几何测量。彼时的两人还并不知道,他们的工作不仅在数学领域,而且在量子场论、弦理论和凝聚态物理领域,都发挥了开创性的作用。1976年,西蒙斯因为这项研究,获得了美国数学会的维布伦(Oswald Veblen)奖,这是全美最高级的几何学奖项。后来,他们的发现被美国理论物理学家、1990年菲尔兹奖得主威滕(Edward Witten)构建出了陈-西蒙斯理论。2016年,来自英美的三名物理学家用陈-西蒙斯理论描述了分数量子霍尔效应,并获得2016年的诺贝尔物理学奖。不过西蒙斯曾对TED表示,他和陈省身都“不懂任何物理”,也从来没有想到他们的发现会被应用于物理学,但他们对此感到很满意。但其实,“不懂物理”的西蒙斯,也曾亲身与物理学家展开过合作,这个物理学家就是杨振宁 。那时候的杨振宁已经凭借“宇称不守恒”理论获得了诺贝尔奖,但他并不满足于此,还想建立更大的规范场理论,这个理论就是具有“现代物理基石”之称的杨-米尔斯方程。但在此过程中,杨振宁在数学上遇到了一些困难,在这样的背景之下,通过跨界合作,西蒙斯给杨振宁带来了重要启发,最终促成了理论的建立。按照常规的剧本,西蒙斯应该是会继续高歌猛进,在数学界取得更辉煌的成就,但获奖之后仅过两年,西蒙斯就离开了学术界。当然,这并不是西蒙斯对数学失去了兴趣,而是他想来一次跨界,把自己所热爱的数学应用到更广阔的领域,此时他选择的“实验对象”,是此前从未接触过的金融。1978年,西蒙斯正式离开学术界,创办了投资公司Monemetrics,即日后大名鼎鼎的对冲基金文艺复兴科技公司(Rentec)的前身。后来便有了西蒙斯用数学模型缔造出四支基金的故事,直到2010年他退任文艺复兴的CEO时,个人资产已经达到了110亿美元。至于他赚来的钱,大部分也被用在了慈善事业,1994年,他和妻子Marilyn一起创立了西蒙斯基金会。到2003年,基金会的第一个资助项目促成,资金主要用于自闭症的研究。随着基金会的发展,西蒙斯扩大了资助项目,涵盖生物学、数学、物理学、理论计算机科学、神经科学以及科学推广和教育,基金会的受资助者相继获得了诺贝尔奖、菲尔兹奖和其他领域的最高荣誉,同时该基金会也是arXiv平台的重要资助方。2011年,清华大学110周年校庆之际,为了纪念和两位清华校友陈省身和杨振宁的合作,西蒙斯向清华捐赠了一栋“陈赛蒙斯楼”。2016年,国际天文学联合会将美国天文学家克莱德·汤博(Clyde Tombaugh)于1936年发现的小行星6618以西蒙斯的名字命名,以表彰他对数学和慈善事业的贡献。此后的2023年,西蒙斯一口气向他曾任教过的石溪大学捐赠了5亿美元,创下了美国高校的单笔捐赠记录。“我的生活要么是A,要么是D”去世前,西蒙斯的净资产估计约314亿美元,排在2024年《福布斯》全球富豪榜第55位。不过,亿万富翁、众多成就傍身的背后,西蒙斯也有不为人所熟知的经历。和绝大多数人一样,西蒙斯曾陷于低谷,遭受过质疑。在他最初放弃学术生涯,创立Monemetrics投资公司时,他还从未上过金融课程,甚至对市场也只是略有兴趣。但他相信自己,坚信一个由数学家、物理学家及统计学家(主要是之前的大学同事)组成的小团队,能够分析金融数据,识别市场趋势,并进行盈利交易。长期以来,股票和债券一直是华尔街经纪公司、投资银行和共同基金公司的专属领域。这些机构有大把年轻、精力充沛的MBA分析师会将上市公司研究成果交给资深财富管理者,后者凭借经验和直觉挑选市场赢家。而最初,面对西蒙斯团队及他们的定量方法,这些金融专家对其不屑一顾。有几次,西蒙斯的方法还酿成了高成本的错误。比如有一次公司通过计算机程序大量购买缅因州土豆期货,几乎垄断了市场。这一操作引起了美国监管期货交易的商品期货交易委员会的反对。最后西蒙斯他们不得不出售在缅因州土豆期货中的投资,错失了巨大的潜在利润。除了在事业上,西蒙斯在生活中同样并非一帆风顺。1996年,34岁的大儿子Paul Simons骑自行车出事故身亡;2003年,24岁的小儿子Nicholas Simons在巴厘岛溺水身亡。此外... PC版: 手机版:

封面图片

人形机器人进阶到街头耍宝 与人类贴身热舞

人形机器人进阶到街头耍宝 与人类贴身热舞 这样训练出来的人形机器人,能实现稳健的运动和动态运动跟踪。简而言之,会的活多,表现力还强。比如和人类边贴贴边跳舞,增进增进人形机器人和人类之间的感情:穿着荧光小马甲,就能立刻上岗街头指挥人车交通:研究论文资料显示,这个研究团队共6人,其中过半是UCSD的在读博士生。为什么要对人形机器人做这样的训练呢?论文共同一作Xuxin Cheng在Twitter上卖力宣传的同时,做出了解释。机器人总是被要求化身各行各业的打工人!我们就想跟它一起探索另一条方向的路~当人形机器人“富有表现力”团队的这项研究名为《Expressive Whole-Body Control for Humanoid Robots》,研究目标是让人形机器人在现实世界中产生丰富、多样和富有表现力的动作。在经过团队的调教后,人形机器人能做出什么样的行为呢?路遇朋友迎面击掌,这是不在话下的。我都能脑补出它大声喊了一句Hey Man……亲切一点,路遇兄弟,来个抱抱:有点搞笑的事,不管是击掌还是拥抱,机器人下半身跺脚的行为并不会停止,只是会稍微放缓。眼尖的朋友们可能已经发现了,上面的击掌实验在不同环境、不同地面进行。团队也明确表示,通过新研究训练出来的人形机器人,可以在各种不同的地形地面上健步如飞。除了上文展示过的草地和石板路,沙滩对它来说同样是小菜一碟:平整的办公室地面也可以轻松应对:团队给出的更多展示中,还表现了更多遇到外界阻力时行动自如的demo。狠狠拽它:拿大球砸它:还知道抬手示意,“喂,你可以帮我背上小书包了”。各种操作,看得大伙儿一愣一愣的。纽约大学计算机科学助理教授发Twitter应援,称这么高水平控制力和表现力的研究成果,居然是一个6人组成的学术团队的产出,“难以置信”!更多的网友则选择用“Cool”来形容这项工作:“无他,照着人类学”所以,究竟怎么才能让机器人像以上般“张牙舞爪”、富有类人表现力?设想的思路无他:照着人类学。学习资料既包括各种人体动捕数据集,也包括生成模型、video2pose模型给出的模拟数据。通过在强化学习框架中进行全身控制的大规模训练,机器人就可以在现实世界中进行动作的泛化了。然而,这样的Sim2Real思想实际还是遇到了问题。作者介绍,典型数据集中的人体模型有69个自由度,但他们所用的机器人只有19个。除此之外,理论和实际的扭矩限制也不相同。这就很尴尬了,等于学会的知识实际根本不能拿来就用。那怎么办?那就做一个小小的改动:只让上半身进行模仿,负责各种表现力,下半身则只负责在任意速度内把两条腿控制稳定就行。作者姑且就管这个方法就叫做“表现型全身控制”(Expressive Whole-Body Control (Exbody))。由此,该机器人的整体框架就长这样:首先,在拿到各种数据集后,系统会有一个运动重定向,用于获取一系列与符合机器人运动学结构的运动片段。然后在从这些片段中提取表达目标和根运动目标,进行“Exbody”策略的强化学习训练,最终将指令部署到真实机器人身上。其中,表达目标就是机器人上半身要完成的,根运动目标则归于下半身(当然,这部分也可以用遥控命令直接给出)。所用数据集最终,和各种基线方法相比,该机器人取得了如下成绩:有几项比较突出的指标,整体表现还不错。(MELV:Mean Episode Linear Velocity Tracking Reward,线性速度跟踪奖励 MEK:Mean episode key body tracking reward,关键身体追踪奖励)而从下图来看,Exbody的策略也能让机器人在表现时(例如击掌)膝盖弯曲更多,抬脚时脚离地面更高。言外之意,动作更卖力更富有表现力一些~当然,也更稳。全华人团队出品本研究一共6位作者,全部为华人,全部来自加州大学圣地亚哥分校(UCSD)。共同一作有两位:Xuxin Cheng,UCSD博一在读,硕士毕业于CMU机器人专业,本科则毕业于北理工自动化专业。Yandong Ji,同UCSD博一在读,硕士毕业于UC伯克利机械工程,本科毕业于南开大学电子计算机工程专业。通讯作者为他们的导师Xiaolong Wang,UCSD电气工程系助理教授。他博士毕业于CMU,目前的研究方向集中于CV和机器人技术等等,Google学术显示论文引用次数23000+。哦对了最后,团队成员还包括本次研究所用的机器人:来自宇树科技的Unitree H1。One More Thing要说最近的机器人进展,还真不少。先是OpenAI和微软押注的Figure刚刚宣布,新一轮融资筹集了约6.75亿美元,融资前估值约20亿美元。紧接着发布了个视频,介绍了旗下人形机器人Figure 01的最新进展,称“一切都是自主的”。再有就是那个面部表情极其丰富,有时惊艳有时又惊悚的Ameca,最新宣布已具有视觉能力。她能观察所处房间的整个情况,然后用各种各样的声音语气(包括但不限于马斯克、海绵宝宝)跟你绘声绘色地描述。就怪有意思的hhhhhh ... PC版: 手机版:

封面图片

新型望远镜技术揭示木卫一的火山表面 比以往任何时候都更清晰

新型望远镜技术揭示木卫一的火山表面 比以往任何时候都更清晰 木星卫星木卫一,2024 年 1 月 10 日由 SHARK-VIS 拍摄。这是迄今为止地球望远镜获得的分辨率最高的木卫一图像。该图像结合了红外线、红色和黄色三个光谱带,突出显示了围绕佩莱火山(在月球中心下方和右侧)的红色环和围绕佩莱火山右侧的皮兰帕特拉火山(Pillan Patera)的白色环。图片来源:INAF/大型双筒望远镜天文台/乔治亚州立大学;SHARK-VIS/F.Pedichini 的 IRV 波段观测;D. 处理。Pedichini; processing by D. Hope, S. Jefferies, G. Li Causi这些观测结果得益于一种被称为"SHARK-VIS"的新型高对比度光学成像仪器,以及该望远镜的自适应光学系统,该系统可以补偿大气湍流造成的模糊。这些图像将发表在《地球物理研究快报》(Geophysical Research Letters)杂志上,揭示了直径小至 50 英里的地表特征,到目前为止,只有飞往木星的航天器才能达到这种空间分辨率。据研究小组称,这相当于从 100 英里外拍摄了一张一角硬币大小物体的照片。通过SHARK-VIS,研究人员确定了木卫一最突出的火山之一佩莱火山周围的一次重大复燃事件。据论文的第一作者艾尔-康拉德(Al Conrad)称,木卫一是太阳系中火山最活跃的天体,其火山爆发使地球上同时代的火山相形见绌。大型双筒望远镜干涉仪(LBTI)是一种地面仪器,它将亚利桑那州格雷厄姆山上的两台 8 米级望远镜连接起来,形成世界上最大的单筒望远镜。该干涉仪旨在探测和研究太阳系外的恒星和行星。图片来源:NASA/JPL-Caltech美国国家航空航天局/JPL-加州理工学院大型双筒望远镜天文台的助理科学家康拉德说:"因此,木卫一提供了一个独特的机会,让我们了解在遥远的过去曾帮助塑造地球和月球表面的强大喷发。大型双筒望远镜是亚利桑那大学斯图尔特天文台下属的格雷厄姆山国际天文台的一部分。"康拉德补充说,像这样的研究将有助于研究人员理解为什么太阳系中的一些世界有火山,而另一些则没有。有朝一日,它们还可能揭示附近恒星周围系外行星系统中的火山世界。木卫一比地球的卫星略大,是木星伽利略卫星中最内侧的一颗,除木卫一外,还有木卫二、木卫三和木卫四。由于木卫三、木卫二和木卫一之间的引力"拉锯战",木卫一不断受到挤压,导致其内部摩擦生热这被认为是木卫一持续而广泛的火山活动的原因。通过监测木卫一表面的喷发,科学家们希望深入了解月球表面下物质的热驱动运动、内部结构,并最终了解造成木卫一强烈火山活动的潮汐加热机制。木卫一地壳的横截面,描述了科学家目前对雕刻月球表面和产生月球大气层的地质和化学过程的了解。左侧是类似佩雷熔岩湖产生的硫磺羽流和红环。冰冷岩石圈中的断层是富含硫的硅酸盐岩浆到达地表的通道。木卫一的内部因木星及其两颗卫星木卫二和木卫三的引力牵引摩擦而发热,产生熔融岩浆。资料来源:de Pater 等人,2021 年,《年度评论》,根据 Doug Beckner、James Tuttle Keane 和 Ashley Davies 的图表绘制木卫一的火山活动最早是在 1979 年被发现的,当时美国宇航局旅行者号任务的工程师琳达-莫拉比托(Linda Morabito)在旅行者号进行著名的外行星"大巡游"时拍摄的一幅图像中发现了喷发羽流。从那时起,人们通过太空望远镜和地球望远镜进行了无数次观测,记录了其躁动不安的特性。研究报告的合著者、美国宇航局喷气推进实验室(JPL)首席科学家阿什利-戴维斯(Ashley Davies)说,SHARK-VIS拍摄的新图像细节非常丰富,使研究小组能够确定一个重大的重现事件,即位于木卫一南半球靠近赤道的一座名为佩莱(Pele)的突出火山周围的羽流沉积物正在被邻近的一座火山皮兰帕特拉(Pillan Patera)的喷发沉积物所覆盖。美国国家航空航天局的伽利略号宇宙飞船在 1995 年至 2003 年期间探索木星系统时也观测到了类似的喷发序列。戴维斯说:"我们将这些变化解释为源自皮兰帕特拉火山喷发的深色熔岩沉积物和白色二氧化硫沉积物,它们部分覆盖了佩蕾的红色富含硫磺的羽状沉积物。在SHARK-VIS之前,从地球上是不可能观测到这种重现事件的。"合著者、加州大学伯克利分校天文学名誉教授伊姆克-德-帕特解释说,虽然红外线望远镜图像可以探测到正在进行的火山喷发造成的热点,但它们还不够清晰,无法揭示表面细节,也无法明确确定火山喷发的位置。德-帕特说:"像SHARK-VIS和LBT提供的可见光波长的更清晰图像,对于确定喷发位置和红外线无法探测到的表面变化(如新的羽流沉积)至关重要,"他补充说,可见光观测为研究人员解释红外线观测结果提供了重要的背景,包括来自目前正在木星轨道上运行的朱诺号等航天器的观测结果。SHARK-VIS由位于罗马天文台的意大利国家天体物理研究所建造,由首席研究员Fernando Pedichini领导的团队管理,项目经理Roberto Piazzesi提供协助。2023 年,该仪器与其配套的近红外仪器 SHARK-NIR 一起安装在天文台,以充分利用该望远镜出色的自适应光学系统。该仪器配备了一个快速、超低噪声相机,使其能够以"快速成像"模式观测天空,捕捉慢动作镜头,冻结大气湍流造成的光学变形,并将数据后处理到前所未有的清晰度。意大利国家天体物理研究所 SHARK-VIS 数据处理经理 Gianluca Li Causi 解释了其工作原理:"我们在计算机上处理数据,以消除传感器电子足迹的任何痕迹。然后,我们挑选出最好的帧,并使用我们的同事、佐治亚州立大学的道格拉斯-霍普(Douglas Hope)和斯图尔特-杰弗里(Stuart Jefferies)开发的名为"克拉肯"(Kraken)的高效软件包将它们组合在一起。Kraken 使我们能够消除大气效应,以惊人的清晰度揭示木卫一"。SHARK-VIS 仪器科学家 Simone Antoniucci 说,他预计将对整个太阳系的天体进行新的观测。他说:"SHARK-VIS的敏锐视觉特别适合观测许多太阳系天体的表面,不仅包括巨行星的卫星,还包括小行星。我们已经观测到了其中一些,目前正在分析数据,并计划观测更多。"编译来源:ScitechDaily ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人