不用对话与文本描述 大阪大学开发大脑所想AI生成图像

不用对话与文本描述大阪大学开发大脑所想AI生成图像·来自大阪大学的两位教授高木优与西本伸志所率领的团队近期公布了新研究,研究课题就是“关于从脑部血流调查活动状态,进而从磁气共鸣画像法获得视觉情报读取能力的研究”,预定今年6月在加拿大举行的CVPR2023正式公布。·该项研究的基本原理是收集并分析实验者观察各种事物时大脑的活动细节,进而推演出当实验者想到此类物体时脑部状态用以匹配AI的图像输出。目前的成像精度虽然不高,不过随着研究的不断深入,近似于科幻作品中的想想就能呈现的桥段离我们越来越近了。...PC版:https://www.cnbeta.com.tw/articles/soft/1350097.htm手机版:https://m.cnbeta.com.tw/view/1350097.htm

相关推荐

封面图片

AI根据人类大脑活动重建视觉图像

AI根据人类大脑活动重建视觉图像这项研究利用了开源的StableDiffusion模型,由日本大阪大学的科学家完成。该AI模型能够有效地生成高质量图像,并且能够捕捉到图像中不同层次的特征,从低级的边缘和纹理到高级的语义和场景。他们使用功能性磁共振成像(fMRI)记录了人类大脑在观看不同类型的图片时产生的神经活动。然后设计了一个AI神经网络,学习大脑活动与StableDiffusion的潜在表示(图片的多维特征)之间的映射关系。通过这个网络,他们能够从大脑活动中重建出与原始图片非常相似的图像。投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

PixVerse:AI文本和图像生成视频

PixVerse:AI文本和图像生成视频PixVerse是一个利用AI人工智能技术将文本和图像创建成令人惊叹的视频的平台。这个网站提供了一个强大的视频创作工具,允许用户将他们的想法转化为引人注目的视觉效果。通过这个平台,用户可以轻松地制作出具有专业水准的视频内容。标签:#网站#视频生成#AI视频#AI工具链接:https://www.appmiu.com/20408.html

封面图片

研究发现 AI 生成的白人脸部图像更容易愚弄人

研究发现AI生成的白人脸部图像更容易愚弄人发表在《PsychologicalScience》期刊上的一项研究发现,AI生成的白人脸部图像更能愚弄人类自己。人类更可能认为AI生成的白人图像是真实人类的图像。这一结果并不适用于AI生成的有色人种图像。原因可能是用于生成AI脸部图像的算法主要是用白人图像训练的。研究小组警告,这可能意味着种族观念最终会与对“人类”的观念混淆,这也可能会延续社会偏见。来源,频道:@kejiqu群组:@kejiquchat

封面图片

新加坡团队开发AI新工具 可用文本直接生产3DVR图像

新加坡团队开发AI新工具可用文本直接生产3DVR图像如今各种AI图像生成软件正火,不过基本都是生成2D类图像,日前来自新加坡的一个科研团队宣布,正在开发文本直接生产3DVR图像的AI系统,如果项目完成,将对今后的绘图、电影、动漫乃至游戏等领域造成巨大的冲击和影响。PC版:https://www.cnbeta.com/articles/soft/1325785.htm手机版:https://m.cnbeta.com/view/1325785.htm

封面图片

NVIDIA 正在设法大幅提高生成 AI 图像和视频的速度

NVIDIA正在设法大幅提高生成AI图像和视频的速度Nvidia多伦多人工智能实验室的研究人员正在解决生成图像和视频的时间问题,本周在该公司的GTC2024会议上,他们概述了这项工作的一些成果,展示了旨在实现这一目标的进步更快(因此更经济)生成“噪音”明显更少的图像和更详细的3D图像,将时间从几周或几个月缩短为几天或几分钟。对于图像生成,研究人员着眼于加速扩散模型的工作,该模型用于解决生成高保真度高分辨率图像的棘手问题,并且是OpenAI的Dall-E3等文本到图像模型的基础谷歌的图像。从本质上讲,它们消除了“噪声”——图像原始场景内容中不存在的伪影,但这些伪影可能使图像看起来模糊、像素化、颗粒状或以其他方式表现不佳。——

封面图片

NVIDIA实现从图像中抽象出概念再生成新的图像 人类幼崽技能AI终于学会了

NVIDIA实现从图像中抽象出概念再生成新的图像人类幼崽技能AI终于学会了人类幼崽2岁就能做的事,AI竟然才学会?早在2017年,就有网友吐槽:2岁幼童只要见过一次犀牛的照片,就能在其他图片里认出不同姿势、视角和风格的卡通犀牛,但AI却做不到。直到现在,这一点终于被科学家攻克了!最新研究发现,只要给AI喂3-5张图片,AI就能抽象出图片里的物体或风格,再随机生成个性化的新图片。有网友评价:非常酷,这可能是我这几个月来看到的最好的项目。它是如何工作的?让我们先来看几个例子。当你上传3张不同角度的陶瓷猫照片,可能会得到以下4张新图像:两只在船上钓鱼的陶瓷猫、陶瓷猫书包、班克斯艺术风格的猫以及陶瓷猫主题的午餐盒。同样的例子还有艺术品:铠甲小人:碗:不只是提取图像中的物体,AI还能生成特定风格的新图像。例如下图,AI提取了输入图像的绘画风格,生成了一系列该风格的新画作。更神奇的是,它还能将两组输入图像相结合,提取一组图像中的物体,再提取另一组的图像风格,两者结合,生成一张崭新的图像。除此之外,有了这个功能,你还可以对一些经典图像“下手”,给它们添加一些新元素。那么,这么神奇的功能背后是什么原理呢?尽管近两年来,大规模文本-图像模型,如DALL·E、CLIP、GLIDE等,已经被证明有很强的自然语言推理能力。但有一点:如果用户提出一些特定的需求,比如生成一张包含我最喜欢的童年玩具的新照片,或者把孩子的涂鸦变成一件艺术品,这些大规模模型都很难做到。为了应对这一挑战,研究给出了一个固定的、预先训练好的文本-图像模型和一个描述概念的小图像集(用户输入的3-5张图像),目标是找到一个单一的词嵌入,从小集合中重建图像。由于这种嵌入是通过优化过程发现的,于是称之为“文本倒置(TextualInversion)”。具体来说,就是先抽象出用户输入图像中的物体或风格,并转换为“S∗”这一伪词(pseudo-word),这时,这个伪词就可以被当作任何其他词来处理,最后根据“S∗”组合成的自然语句,生成个性化的新图像,比如:“一张S∗在海滩上的照片”、”一幅挂在墙上的S∗的油画”、”以S2∗的风格画一幅S1∗”。值得注意的是,由于本次研究应用了一个小规模、经过策划的数据集,因此在生成图像时能有效地避免刻板印象。例如下图,当提示“医生”时,其他模型倾向于生成白种人和男性的图像,而本模型生成图像中则增加了女性和其他种族的人数。目前,该项目的代码和数据已开源,感兴趣的小伙伴可以关注一下。作者介绍该篇论文来自特拉维夫大学和英伟达的研究团队,作者分别是RinonGal、YuvalAlaluf、YuvalAtzmon、OrPatashnik、AmitH.Bermano、GalChechik、DanielCohen-Or。第一作者RinonGal,是特拉维夫大学的计算机科学博士生,师从DanielCohen-Or和AmitBermano,主要研究方向是在减少监督的条件下生成2D和3D模型,目前在英伟达工作。参考链接:[1]https://textual-inversion.github.io/[2]https://github.com/rinongal/textual_inversion[3]http...PC版:https://www.cnbeta.com/articles/soft/1304219.htm手机版:https://m.cnbeta.com/view/1304219.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人