Genie:一种新的生成式交互环境模型,能通过无监督学习,用未标注的互联网视频数据训练而成。

:一种新的生成式交互环境模型,能通过无监督学习,用未标注的互联网视频数据训练而成。Genie具有11B参数,能将文本、合成图像、照片甚至手绘草图转换为可交互的虚拟世界。这一模型打破了传统世界模型需要特定领域数据和动作标签的局限,通过学习潜动作空间,实现了对生成环境的逐帧控制。研究表明,Genie不仅能够创造多样的互动体验,还能够训练未来的通用智能体,通过对未见过的视频进行模仿学习,预示着人工智能领域迈向开放式学习和创造无限数据的新时代。

相关推荐

封面图片

Google DeepMind 公布 Genie 模型,可生成可交互的虚拟环境

GoogleDeepMind公布Genie模型,可生成可交互的虚拟环境GoogleDeepMind今天介绍了Genie,一种根据互联网视频训练的基础世界模型,可以从合成图像、照片甚至草图生成无数种可玩(动作可控)的世界。Genie可以用它以前从未见过的图像来作为输入,使人们能够与生成的虚拟世界进行交互。它由一个时空视频标记器、一个自回归动力学模型和一个简单且可扩展的潜在行动模型组成。该模型可根据没有任何标注数据的公开互联网视频的大型数据集进行训练。该模型当前专注于2D平台游戏和机器人的视频,但其方法是通用的,并且可以扩展到任何类型的领域和更大的数据集。团队还通过使用Google的RT-1机器人的摄像头视频数据训练模型,表明Genie能够学习与现实世界一致的动作空间。这可能产生一个现实世界模拟器,以便训练未来的通用智能体。——,

封面图片

谷歌DeepMind推出Genie模型:110亿参数、可基于图片生成2D游戏

谷歌DeepMind推出Genie模型:110亿参数、可基于图片生成2D游戏另有一个动态模型,用于在给定潜在动作和过去帧token的情况下,预测视频的下一帧。这三个组件共同协作,使得Genie能够生成具有高度交互性和可控性的虚拟世界。Genie通过了网络上超过20万小时的2D游戏视频训练,目前只是一个研究预览版,这些游戏更像是2D平台游戏,而不是完全的VR游戏。此外,它能生成图像和其他资产,将你的草图变成一个完全实现的开放世界,然后根据玩家提供的操作预测下一个像素帧,Genie还可以应用于设计相关的创作领域,进一步拓宽了创作者的想象空间。...PC版:https://www.cnbeta.com.tw/articles/soft/1421189.htm手机版:https://m.cnbeta.com.tw/view/1421189.htm

封面图片

【国家互联网信息办公室发布生成式人工智能服务已备案信息】

【国家互联网信息办公室发布生成式人工智能服务已备案信息】促进生成式人工智能服务创新发展和规范应用,网信部门会同相关部门按照《生成式人工智能服务管理暂行办法》要求,有序开展生成式人工智能服务备案工作,现将已备案信息予以#公告。提供具有舆论属性或者社会动员能力的生成式人工智能服务的,可通过属地网信部门履行备案程序,属地网信部门应及时将已备案信息对外公开发布。已上线的生成式人工智能应用或功能,应在显著位置或产品详情页面公示所使用已备案生成式人工智能服务情况,注明模型名称及备案号。(网信中国微信公号)

封面图片

AI,正在疯狂污染中文互联网

AI,正在疯狂污染中文互联网不过这位网友并没有直接采纳答案,而是顺藤摸瓜点开了下方的“参考链接”。此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。于是他点开了这位叫“百变人生”的用户主页,猛然发觉,介是个AI啊!因为这位用户回答问题速度可以说是极快,差不多每1、2分钟就能搞定一个问题。甚至能在1分钟之内回答2个问题。在这位网友更为细心的观察之下,发现这些回答的内容都是没经过核实的那种……并且他认为,这就是导致Bing输出错误答案的原因:这个AI疯狂地污染中文互联网。“AI污染源”,不止这一个那么被网友发现的这位AI用户,现在怎么样了?从目前结果来看,他已经被被知乎“判处”为禁言状态。但尽管如此,也有其他网友直言不讳地表示:不止一个。若是点开知乎的“等你回答”这个栏目,随机找一个问题,往下拉一拉,确实是能碰到不少“机言机语”的回答。例如我们在“AI在生活中的应用场景有哪些?”的回答中便找到了一个:不仅是回答的语言“机言机语”,甚至回答直接打上了“包含AI辅助创作”的标签。然后如果我们把问题丢给ChatGPT,那么得到回答……嗯,挺换汤不换药的。事实上,诸如此类的“AI污染源”不止是在这一个平台上有。就连简单的科普配图这事上,AI也是屡屡犯错。网友们看完这事也是蚌埠住了:“好家伙,没有一个配图是河蚌”。甚至各类AI生成的假新闻也是屡见不鲜。例如前一段时间,便有一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。但事实上,这则新闻是江西男子陈某为吸粉引流,利用ChatGPT生成的。无独有偶,广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人,致9人死亡》假新闻。具体而言,他在全网搜索近几年的社会热点新闻,并使用AI软件对新闻时间、地点等进行修改编辑后,在某些平台赚取关注和流量进行非法牟利。警方均已对他们采取了刑事强制措施。但其实这种“AI污染源”的现象不仅仅是在国内存在,在国外亦是如此。程序员问答社区StackOverflow便是一个例子。早在去年年底ChatGPT刚火起来的时候,StackOverflow便突然宣布“临时禁用”。当时官方给出来的理由是这样的:(这样做)的目的是减缓使用ChatGPT创建的大量答案流入社区。因为从ChatGPT得到错误答案的概率太高了!StackOverflow进一步阐述了这种现象。他们认为以前用户回答的问题,都是会有专业知识背景的其他用户浏览,并给出正确与否,相当于是核实过。但自打ChatGPT出现之后,涌现了大量让人觉得“很对”的答案;而有专业知识背景的用户数量是有限,没法把这些生成的答案都看个遍。加之ChatGPT回答这些个专业性问题,它的错误率是实实在在摆在那里的;因此StackOverflow才选择了禁用。一言蔽之,AI污染了社区环境。而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块、话题:许多用户在这种栏目之下会提出各式各样的问题,ChatGPTbot也是有问必答。不过,还是老问题,答案的准确性如何,就不得而知了。但这种现象背后,其实还隐藏着更大的隐患。滥用AI,也毁了AIAI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。很难想象ChatGPT这些大模型如果用这种数据训练,结果会是啥样……而如此滥用AI,反过来也是一种自噬。最近,英国和加拿大的研究人员在arXiv上发表了一篇题目为《TheCurseofRecursion:TrainingonGeneratedDataMakesModelsForget》的论文。探讨了现在AI生成内容污染互联网的现状,然后公布了一项令人担忧的发现,使用模型生成的内容训练其他模型,会导致结果模型出现不可逆的缺陷。这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲,未来通过抓取互联网数据来训练模型会变得更加困难。论文作者,剑桥大学和爱丁堡大学安全工程教授RossAnderson毫不避讳的直言:正如我们用塑料垃圾布满了海洋,用二氧化碳填满了大气层,我们即将用废话填满互联网。对于虚假信息满天飞的情况,GoogleBrain的高级研究科学家达芙妮·伊波利托(DaphneIppolito)表示:想在未来找到高质量且未被AI训练的数据,将难上加难。假如满屏都是这种无营养的劣质信息,如此循环往复,那以后AI就没有数据训练,输出的结果还有啥意义呢。基于这种状况,大胆设想一下。一个成长于垃圾、虚假数据环境中的AI,在进化成人前,可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。就像1996年的科幻喜剧电影《丈夫一箩筐》,影片讲述了一个普通人克隆自己,然后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数下降,愚蠢程度增加。那个时候,我们可能将不得不面临一个荒谬困境:人类创造了具有惊人能力的AI,而它却塞满了无聊愚蠢的信息。如果AI被喂进的只是虚假的垃圾数据,我们又能期待它们创造出什么样的内容呢?假如时间到那个时候,我们大概都会怀念过去,向那些真正的人类智慧致敬吧。话虽如此,但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题,并推出相关规定加以限制。一些个AI公司也开始搞能鉴别AI生成内容的技术,以减少AI虚假、垃圾信息的爆炸。...PC版:https://www.cnbeta.com.tw/articles/soft/1365947.htm手机版:https://m.cnbeta.com.tw/view/1365947.htm

封面图片

云从科技:从容大模型支持通过文本和音频生成图像和视频

云从科技:从容大模型支持通过文本和音频生成图像和视频OpenAI的视频生成模型Sora引发关注,云从科技相关负责人表示,云从科技在视觉方面积累较为深厚,目前,从容大模型已实现利用diffusion、GAN等生成式技术围绕人物图像、人物视频数据进行建模,通过文本和音频实现对图像和视频内容进行生成、控制、编辑。应用上,云从科技与天津港、华为等共同开发港口大模型PortGPT,核心是AI智能体天天,通过AI生成交互画面,协同数据分析,提高港口运转效率及安全性。此外,还在文生图像、视频等跨模态领域积极布局,包括发布数字人能力平台,生成AI视频;与中国电信合作AI营销海报生成等。(科创板日报)

封面图片

4月11日消息,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见。提供者应当对生成式人工智能产品的

4月11日消息,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见。提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。其中提到,用于生成式人工智能产品的预训练、优化训练数据,应满足以下要求:符合《中华人民共和国网络安全法》等法律法规的要求;不含有侵犯知识产权的内容;数据包含个人信息的,应当征得个人信息主体同意或者符合法律、行政法规规定的其他情形;能够保证数据的真实性、准确性、客观性、多样性;国家网信部门关于生成式人工智能服务的其他监管要求。来源:钛媒体Apphttps://m.tmtpost.com/nictation/6483977.html频道:@TestFlightCN

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人