汉王科技:公司在多模态识别技术领域有核心技术OpenAI旗下的AI视频模型Sora爆火,记者以投资者身份致电汉王科技,相关人士表

None

相关推荐

封面图片

证监会:优先支持新产业新业态新技术领域突破关键核心技术的 “硬科技” 企业在科创板上市

证监会:优先支持新产业新业态新技术领域突破关键核心技术的“硬科技”企业在科创板上市中国证监会发布深化科创板改革,服务科技创新和新质生产力发展的八条措施。其中提到,强化科创板“硬科技”定位。严把入口关,坚决执行科创属性评价标准,优先支持新产业新业态新技术领域突破关键核心技术的“硬科技”企业在科创板上市。进一步完善科技型企业精准识别机制,发挥好市场机制作用。适应新质生产力相关企业投入大、周期长、研发及商业化不确定性高等特点,支持具有关键核心技术、市场潜力大、科创属性突出的优质未盈利科技型企业在科创板上市,提升制度包容性。

封面图片

Docker核心技术

名称:Docker核心技术描述:将介绍Docker核心概念,是什么、能干什么、Docker整体架构,和传统虚拟机的区别。什么是容器虚拟化技术,深刻理解镜像、容器、仓库的各种概念和操作。通过该课程,能够熟练掌握Dockerfile的编写和构建并使用Dockerfile来制作复杂镜像,能够使用容器卷完成容器间数据共享和持久化工作。能够在Docker容器下进行日常软件的安装开发和工程部署,最终可以通过docker和阿里云平台完成工作的协同和发布。链接:https://www.alipan.com/s/csRGRfo4MLx大小:NG标签:#学习#知识#课程#资源来自:雷锋频道:@Aliyundrive_Share_Channel群组:@alyd_g投稿:@AliYunPanBot

封面图片

揭秘Sora:开发团队成立不到1年 核心技术曾因“缺乏创新”遭拒绝

揭秘Sora:开发团队成立不到1年核心技术曾因“缺乏创新”遭拒绝《每日经济新闻》记者查询这两项技术的原作论文发现,时空Patch的技术论文实际上是由GoogleDeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导者之一WilliamPeebles,但戏剧性的是,这篇论文曾在2023年的计算机视觉会议上因“缺少创新性”而遭到拒绝,仅仅1年之后,就成为Sora的核心理论之一。如今,Sora团队毫无疑问已经成为世界上最受关注的技术团队。记者查询OpenAI官网发现,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。值得注意的是,这支团队十分年轻,成立时间还尚未超过1年。核心突破一:时空Patch,站在Google肩膀上此前,OpenAI在X平台上展示了Sora将静态图像转换为动态视频的几个案例,其逼真程度令人惊叹。Sora是如何做到这一点的呢?这就不得不提到该AI视频模型背后的两项核心技术——DiT架构和SpacetimePatch(时空Patch)。据外媒报道,SpacetimePatch是Sora创新的核心之一,该项技术是建立在GoogleDeepMind对NaViT(原生分辨率视觉Transformer)和ViT(视觉Transformer)的早期研究基础上。Patch可以理解为Sora的基本单元,就像GPT-4的基本单元是Token。Token是文字的片段,Patch则是视频的片段。GPT-4被训练以处理一串Token,并预测出下一个Token。Sora遵循相同的逻辑,可以处理一系列的Patch,并预测出序列中的下一个Patch。Sora之所以能实现突破,在于其通过SpacetimePatch将视频视为补丁序列,Sora保持了原始的宽高比和分辨率,类似于NaViT对图像的处理。这对于捕捉视觉数据的真正本质至关重要,使模型能够从更准确的表达中学习,从而赋予Sora近乎完美的准确性。由此,Sora能够有效地处理各种视觉数据,而无需调整大小或填充等预处理步骤。记者注意到,OpenAI发布的Sora技术报告中透露了Sora的主要理论基础,其中Patch的技术论文名为Patchn‘Pack:NaViT,aVisionTransformerforanyAspectRatioandResolution。记者查询预印本网站arxiv后发现,该篇研究论文是由GoogleDeepMind的科学家们于2023年7月发表的。图片来源:arxiv.org图片来源:GoogleScholar核心突破二:扩散型Transformer架构,相关论文曾遭拒绝除此之外,Sora的另一个重大突破是其所使用的架构,传统的文本到视频模型(如Runway、StableDiffusion)通常是扩散模型(DiffusionModel),文本模型例如GPT-4则是Transformer模型,而Sora则采用了DiT架构,融合了前述两者的特性。据报道,传统的扩散模型的训练过程是通过多个步骤逐渐向图片增加噪点,直到图片变成完全无结构的噪点图片,然后在生成图片时,逐步减少噪点,直到还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。OpenAI发布的Sora技术报告透露,Sora采用的DiT架构是基于一篇名为Scalablediffusionmodelswithtransformers的学术论文。记者查询预印本网站arxiv后发现,该篇原作论文是2022年12月由伯克利大学研究人员William(Bill)Peebles和纽约大学的一位研究人员SainingXie共同发表。William(Bill)Peebles之后加入了OpenAI,领导Sora技术团队。图片来源:arxiv.org然而,戏剧化的是,Meta的AI科学家YannLeCun在X平台上透露,“这篇论文曾在2023年的计算机视觉会议(CVR2023)上因‘缺少创新性’而遭到拒绝,但在2023年国际计算机视觉会议(ICCV2023)上被接受发表,并且构成了Sora的基础。”图片来源:X平台作为最懂DiT架构的人之一,在Sora发布后,SainingXie在X平台上发表了关于Sora的一些猜想和技术解释,并表示,“Sora确实令人惊叹,它将彻底改变视频生成领域。”“当Bill和我参与DiT项目时,我们并未专注于创新,而是将重点放在了两个方面:简洁性和可扩展性。”他写道。“简洁性代表着灵活性。关于标准的ViT,人们常忽视的一个亮点是,它让模型在处理输入数据时变得更加灵活。例如,在遮蔽自编码器(MAE)中,ViT帮助我们只处理可见的区块,忽略被遮蔽的部分。同样,Sora可以通过在适当大小的网格中排列随机初始化的区块来控制生成视频的尺寸。”图片来源:X平台不过,他认为,关于Sora仍有两个关键点尚未被提及。一是关于训练数据的来源和构建,这意味着数据很可能是Sora成功的关键因素;二是关于(自回归的)长视频生成,Sora的一大突破是能够生成长视频,但OpenAI尚未揭示相关的技术细节。年轻的开发团队:应届博士带队,还有00后随着Sora的爆火,Sora团队也来到世界舞台的中央,引发了持续的关注。记者查询OpenAI官网发现,Sora团队由WilliamPeebles等3人领导,核心成员包括12人。从团队领导和成员的毕业和入职时间来看,这支团队成立的时间较短,尚未超过1年。图片来源:OpenAI官网从年龄上来看,这支团队也非常年轻,两位研究负责人都是在2023年才刚刚博士毕业。William(Bill)Peebles于去年5月毕业,其与SainingXie合著的扩散Transformer论文成为Sora的核心理论基础。TimBrooks于去年1月毕业,是DALL-E3的作者之一,曾在Google和英伟达就职。图片来源:William(Bill)Peebles个人主页团队成员中甚至还有00后。团队中的WillDePue生于2003年,2022年刚从密西根大学计算机系本科毕业,在今年1月加入Sora项目组。图片来源:WillDePue个人主页此外,团队还有几位华人。据媒体报道,LiJing是DALL-E3的共同一作,2014年本科毕业于北京大学物理系,2019年获得MIT物理学博士学位,于2022年加入OpenAI。RickyWang则是今年1月刚刚从Meta跳槽到OpenAI。其余华人员工包括YufeiGuo等尚未有太多公开资料介绍。...PC版:https://www.cnbeta.com.tw/articles/soft/1419009.htm手机版:https://m.cnbeta.com.tw/view/1419009.htm

封面图片

Elasticsearch 核心技术与实战

名称:Elasticsearch核心技术与实战描述:快速构建分布式搜索和分析引擎。链接:https://www.aliyundrive.com/s/UtUCqojk9xR大小:未统计标签:#知识#学习来自:雷锋版权:频道:@shareAliyun群组:@aliyundriveShare投稿:@aliyun_share_bot

封面图片

深度学习OpenCV核心技术

名称:深度学习OpenCV核心技术描述:非常详细的OpenCV机器视觉实战,课程内容包括了视觉基础,计算机深度学习,计算机图像分割、目标跟踪,中阶段计算机视觉,神经网络、CNN卷积神经网络进阶及实战等课程,课程还包括了学习的作业级讲解,非常的“保姆级”。建议先收藏保存,不定时失效。链接:https://pan.quark.cn/s/6d3854042c52大小:NG标签:#quark#学习#资源#课程#OpenCV频道:@yunpanshare群组:@yunpangroup

封面图片

【尚硅谷】Promise核心技术

名称:【尚硅谷】Promise核心技术描述:本视频教程,从最基本的回调/异常语法开始,到Promise的基本使用;从Promise难点技术分析,到一步步手写Promise的实现、扩展async和await深入分析、宏队列与微队列详解;最后通过经典的面试题,检验Promise学习的效果。通关之后,你就成为了Promise高级工程师。链接:https://www.alipan.com/s/Q4mhcDQvWDT大小:NG标签:#学习#知识#课程#资源来自:雷锋频道:@Aliyundrive_Share_Channel群组:@alyd_g投稿:@AliYunPanBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人