麻省理工大学携手 Adobe 演示 DMD AI 技术:每秒可生成 20 幅图像

麻省理工大学携手Adobe演示DMDAI技术:每秒可生成20幅图像主流文生图模型固然已经能生成非常逼真的图片,但通常渲染时间非常缓慢。麻省理工大学携手Adobe公司近日研发了DMD方法,在尽量不影响图像质量的情况下,加快图像生成速度。DMD技术的全称是DistributionMatchingDistillation,将多步扩散模型简化为一步图像生成解决方案。团队表示:“我们的核心理念是训练两个扩散(diffusion)模型,不仅能预估目标真实分布(realdistribution)的得分函数,还能估计假分布(fakedistribution)的得分函数。”研究人员称,他们的模型可以在现代GPU硬件上每秒生成20幅图像。在上面的视频短片重点介绍了DMD与StableDiffusion1.5相比的图像生成能力。标清每幅图像StableDiffusion1.5需要1.4秒,而DMD只需几分之一秒就能生成类似的图像。来源,频道:@kejiqu群组:@kejiquchat

相关推荐

封面图片

麻省理工学院研究人员开发出对图像质量影响最小的超快速图像生成方法

麻省理工学院研究人员开发出对图像质量影响最小的超快速图像生成方法图像生成人工智能通常采用一种称为扩散的过程,通过几个采样步骤来完善视觉输出,以达到最终希望"逼真"的结果。研究人员表示,扩散模型可以生成高质量的图像,但需要数十次前向传递。Adobe研究中心和麻省理工学院的专家们正在引入一种名为"分布匹配蒸馏"(DMD)的技术。这一程序将多步扩散模型简化为一步图像生成解决方案。由此产生的模型可以生成与StableDiffusion1.5等"传统"扩散模型相当的图像,但速度要快上几个数量级。"我们的核心理念是训练两个扩散模型,不仅能估计目标真实分布的得分函数,还能估计假分布的得分函数。"研究人员称,他们的模型可以在现代GPU硬件上每秒生成20幅图像。上面的视频短片重点介绍了DMD与StableDiffusion1.5相比的图像生成能力。标清每幅图像需要1.4秒,而DMD只需几分之一秒就能生成类似的图像。虽然在质量和性能之间有所权衡,但最终结果仍在普通用户可接受的范围之内。该团队发表的关于新渲染方法的文章展示了使用DMD生成图像结果的更多示例。它比较了稳定扩散和DMD,同时提供了生成图像的重要文字提示。主题包括通过虚拟数码单反相机镜头取景的一只狗、多洛米蒂山脉、森林中一只神奇的鹿、一只鹦鹉宝宝的3D渲染、独角兽、胡须、汽车、猫,甚至更多的狗。分布匹配蒸馏法并不是第一种用于生成人工智能图像的单步方法。StabilityAI公司开发了一种被称为逆向扩散蒸馏(ADD)的技术,用于实时生成100万像素的图像。该公司通过ADD训练其SDXLTurbo模型,在单个NVIDIAA100AIGPU加速器上实现了仅207毫秒的图像生成速度。Stability的ADD采用了与麻省理工学院的DMD类似的方法。...PC版:https://www.cnbeta.com.tw/articles/soft/1425166.htm手机版:https://m.cnbeta.com.tw/view/1425166.htm

封面图片

麻省理工学院开发“面具”来保护图像免遭人工智能操纵

麻省理工学院开发“面具”来保护图像免遭人工智能操纵麻省理工学院的科学家们创造了一种本质上是防护罩的东西,能够防止这些模型操纵图像。这些遮罩对于人眼来说是不可见的,当与生成人工智能图像模型交互时,会导致输出出现扭曲。研究人员在一篇论文中写道:“通过在对手访问原始图像之前对其进行免疫,我们破坏了他们成功执行此类编辑的能力。”PhotoGuard可以在MIT许可下通过GitHub访问——这意味着它可以用于商业用途,但需要保留版权和许可声明。图片来源:麻省理工学院据了解,PhotoGuard的目的是改进Deepfake检测。其背后的团队认为,虽然水印方法确实有效,但它们并不能保护图像免遭“首先被操纵”。PhotoGuard旨在补充水印保护,以“破坏人工智能扩散模型的内部运作”。随着DALL-E和稳定扩散等人工智能图像模型的使用变得越来越普遍,滥用的情况似乎也越来越多,尤其是在社交媒体中。罗恩·德桑蒂斯的选举团队使用人工智能处理的前总统特朗普拥抱福奇博士的图像的案例显示了可能出现问题的早期迹象。检测人工智能生成的作品的需求正在不断增加——虽然对于那些受过训练的人来说,人工智能生成的图像很容易被发现,但一些研究团队正在努力让它变得更容易。以DALL-E和ChatGPT制造商OpenAI为例,该公司本周承诺继续研究确定一段音频或视频内容是否由人工智能生成的方法,尽管该承诺是在其因性能不佳而关闭其文本检测工具后做出的。...PC版:https://www.cnbeta.com.tw/articles/soft/1373793.htm手机版:https://m.cnbeta.com.tw/view/1373793.htm

封面图片

麻省理工学院AI图像生成系统让《DALL-E 2》等模型散发出创意

麻省理工学院AI图像生成系统让《DALL-E2》等模型散发出创意随着DALL-E的问世,互联网迎来了一个集体感觉良好的时刻。这个基于人工智能的图像生成器的灵感来自于艺术家萨尔瓦多-DALL-E和动画电影中可爱的机器人瓦力,它使用自然语言来生成你心中想要的任何神秘而美丽的图像。看到打出的输入信息,如"拿着冰激凌甜筒的微笑地鼠",机器的灵感瞬间涌现出来,这种生动的人工智能生成的图像显然得到了世界的共鸣。PC版:https://www.cnbeta.com/articles/soft/1320411.htm手机版:https://m.cnbeta.com/view/1320411.htm

封面图片

麻省理工深度思考法 | 电子书籍

名称:麻省理工深度思考法电子书籍描述:《麻省理工深度思考法:从模型及动力机制来思考现象》本书基于麻省理工斯隆商学院的“系统动力学”理论,提出了真正解决问题的深度思考法。链接:https://www.aliyundrive.com/s/gmvJkwSMBji大小:5.76MB标签:#麻省理工深度思考法#知识#电子书籍来自:雷锋版权:频道:@shareAliyun群组:@aliyundriveShare投稿:@aliyun_share_bot

封面图片

【Adobe发布名为“Firefly”的图像生成人工智能模型】

【Adobe发布名为“Firefly”的图像生成人工智能模型】2023年03月22日11点03分3月22日消息,Adobe公司发布名为“Firefly”的图像生成人工智能模型,目前主要专注于图像生成和文本效果,如文字生成矢量/笔刷/模板、根据自定义风格生成图像、指定纵横比扩展图像、据3D模型生成图像、为黑白图像上色、使用画笔修改图像并用文字描述的风格进行填充等。未来,Firefly将被实装在Adobe全家桶中。该模型的学习数据来源于Adobe旗下AdobeStock数据库、经授权的作品以及版权已过期的公共内容。据Adobe表示,用户的内容不会被用来训练Firefly。

封面图片

【波士顿联储和麻省理工学院发布OpenCBDC】

【波士顿联储和麻省理工学院发布OpenCBDC】波士顿联邦储备银行和麻省理工学院公布了汉密尔顿项目(ProjectHamilton)第一阶段的结果,汉密尔顿项目是一项专注于央行数字货币研究的合作研究工作。今天,波士顿联邦储备银行和麻省理工学院公布还在GitHub上发布了央行数字货币交易处理开源软件OpenCBDC,据悉该软件在技术上已经足够完善,可以支持在“美国这样大的国家运行通用央行数字货币”,在核心处理引擎方面,OpenCBDC处理速度超过每秒170万笔交易,“绝大多数交易”可以在两秒内完成结算。波士顿联邦储备银行和麻省理工学院表示,OpenCBDC技术具有灵活性,可以根据政策决定进行调整,在第二阶段,他们将继续研究其他技术设计,以进一步优化第一阶段技术的“强大的隐私、弹性和功能”,同时更好地阐明不同设计之间的权衡关系。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人