相关推荐

千万人围观“烧焦婴儿”图片伯克利教授辟谣：AI图片检测器无用

千万人围观“烧焦婴儿”图片伯克利教授辟谣：AI图片检测器无用其中，一张“烧焦婴儿”的照片，由于太过于残忍，让人难以置信。于是，有人把照片放到了AI图片检测器中，来检测这些照片是否为AI生成。果然，这张照片被AI检测器——Optic，认定为“AI生成”。而在4chan上，甚至还出现了“原图”，原本尸体的位置其实是一只狗狗。于是网友愤怒地去发布者推文下方留言，攻击他利用AI生成的照片来散播虚假的末日恐慌。这条认为照片是由AI生成的推文，2天不到的时间已经有2100万的阅读。但是很快网友们发现，他们把照片放到了同样的AI检测器上，检测结果几乎是随机的，既有AI，也有人类。有人发现，只要把同一张图片裁剪一下，或者背景色变成黑白，这个检测器就会认为图片是由人类拍摄的。甚至有时候检测器“抛硬币”的时候，硬币还会立起来...那到底这张图是不是由AI生成的呢？最后，AI检测器官方也针对这个事件发推，认为他们的没有办法确定图片是否由AI生成，希望大家理性讨论。AI图片检测器，到底有多不靠谱？UCBerkeley教授、世界顶尖的数字图像处理专家之一HanyFarid表示，这张图像没有任何迹象表明它是由AI生成的。“AI图像生成器最大的问题之一是高度结构化的形状和直线，”Farid说。“如果你看到桌腿和螺丝，一切看起来都很完美，那么图片就几乎不可能是由AI生成的。”比如这张著名的“海绵宝宝制造了9/1”的图片，窗外的双子塔线条都不直，飞机上的仪表盘都相互扭曲到一起了，这看起来就是“A里A气的”。“我们在那张照片中能够看到物体的结构很准确、阴影也很准确、没有伪影——这让我相信这张照片应该完全是真实的”法里德说。Farid还通过他自己的其他AI图像检测器识别了这幅图，另外四种AI图像检测工具也都认为图像不是AI生成的。Farid说，“AI检测器是一个工具，但它只是工具包的一部分。用户需要对整个图像进行进行一系列的测试，不可能只按一个按钮就得到答案。”而AI检测工具Optic确实也没有给出自己的检测技术的具体细节。Optic网站也声明，“AI检测器可能会产生不准确的结果”。AI图像检测技术Farid教授在去年曾经撰写过一篇论文，介绍了如何判断AI生图工具图像的一致性。通过判断图像上的一致性，可以帮助判断出图像是否由AI生成。论文链接：https://arxiv.org/abs/2206.14617?ref=404media.co教授首先概述三种相关的基于物理的分析方式，每种分析都利用了图像形成过程固有的相同的基础透视几何原理。消失点平行后退线汇聚于一个消失点。瓷砖之间的线图1(a)是平行的。成像时，这些线全部汇聚在一个消失点。如果场景中的平行线在深度上远离镜头，那么就会存在消失点，尽管它可能落在图像之外。如果场景中的平行线在深度上不后退，也就是说，如果它们完全平行于镜头传感器（在任何距离），则平行线将被成像为平行线，出于实际目的，可以考虑消失点处于无穷远。这种几何学源于透视投影的基础知识。在透视投影下，场景中的点(X,Y,Z)被成像到点(fX/Z,fY/Z)，其中f是镜头焦距。由于图像中点的位置与距离Z成反比，因此投影点会作为距离的函数进行压缩，从而导致图像中的线会聚；2.平行平面上的平行线会聚到同一个消失点远处的盒子在图1(b)与地板上的瓷砖对齐，使得盒子的边缘与瓷砖之间的线平行。因为平行平面上的平行线共享一个消失点，所以盒子侧面和瓷砖地板的消失点是相同的；3.平面上所有直线的消失点都位于消失线上。许多组平行线，每组平行线会聚到不同的消失点，如图1(c)所示。如果平行线组跨越场景中的同一平面，则它们的消失点将位于消失线上。消失线的方向由镜头相对于平行线所跨越的平面的旋转来确定阴影有点令人惊讶的是，消失点背后的相同几何形状也适用于投射阴影。上图显示的是连接盒子上的点及其在投射阴影上的对应点的三条光线。扩展图像边界后发现，这三条光线相交于一个点，该点对应的是照亮场景的光源的投影。无论光源在附近（台灯）还是在远处（太阳），这种与阴影、物体和光相关的几何约束都成立，并且无论阴影投射到的表面的位置和方向如何，该几何约束都成立。当然，该分析假设场景由单个主光源照明，从每个对象仅存在单个投射阴影可以明显看出这一点。在上面的示例中，照亮场景的光源位于镜头前面，因此光源的投影位于图像平面的上半部分。然而，如果光线位于镜头后面，则光源的投影将位于图像平面的下半部分。由于这种反转，对象约束的阴影也必须反转。因此，图像的投射阴影分析必须考虑三种可能性：(1)光线位于镜头前面，光源的投影位于图像平面的上半部分，约束锚定在投射阴影上并包围对象；(2)光线在镜头后面，光源的投影在图像平面的下半部分，约束锚定在物体上并包围投射的阴影；(3)光线位于镜头中心的正上方或正下方，光源的投影位于无穷远，约束将在无穷远相交。如果这些情况中的任何一种导致所有约束的共同交集，则投射阴影在物理上是合理的。反射下图2所示的场景是三个盒子反射在平面镜中。这个图的下半部分显示了真实盒子和虚拟盒子之间的几何关系。橙色线代表镜子，位于两组盒子之间的中点。黄线连接真实和虚拟盒子上的对应点。这些线彼此平行并垂直于镜子。现在考虑一下这些平行线叠加在场景上时如何出现。从镜子平面观察时平行的线不再平行。相反，由于透视投影，这些平行线会聚到一个点，就像世界中的平行线会聚到一个消失点一样。由于连接场景中对应点及其反射的线始终是平行的，因此这些线必须在图像中具有共同的交点才能在物理上合理。实例分析上图3显示了AI合成图像的三个代表性示例，并对地板和柜台顶部的几何透视一致性进行了分析。每张图像（在几个像素内）准确地捕捉了瓷砖地板的透视几何形状，作为一致的消失点（以蓝色呈现）的证据。然而，平行台面（以青色呈现）的消失点在几何上与台面的消失点不一致。相应的对齐图块。即使台面与瓷砖不平行，青色消失点也应位于由瓷砖地板消失点定义的消失线（以红色呈现）上。请注意，对于图3右上角的图像，瓷砖地板上的水平线几乎是平行的，因此相应的消失点位于无穷远，因此不会相交。虽然这些图像中消失点局部事一致的，但并不是全局一致的。在25张合成的厨房图像中，每张都发现了相同的模式。上图是用提示词生成的方块图片，在阴影处就明显地出现了不一致性。上图8所示是将几何分析应用于由AI生成的包含了看上去相当准确的反射的图像结果。尽管这些反射在视觉上是合理的，但在几何上并不一致。与前几节中的投射阴影和几何结构不同，DALL·E-2很难合成合理的反射，大概是因为此类反射在其训练图像数据集中不太常见。基于这些对于AI生成图片局限性的了解，通过对于图片一致性的检测，能非常有助于判断图片是否由AI合成。图像识别难，AI打败AIAI图像生成器，正不断进化。上半年，Midjourney爆火，能够生成足够逼真的图片，却愚弄了很多人。86岁教皇头顶白色小瓜帽、一身喇叭口的白色羽绒服，金属制的十字架项链外露，外加一本正经的表情。当时，这张照片一经发布，在社交媒体上骗过了所有人，被许多网友疯狂转发，甚至有人直呼教皇太潮了。在大家都信以为真时，突然有人点出这是AI生成的，许多人瞬间傻眼了。这仅是其中的一个栗子，还有马斯克新女友GM的首席执行官Barr...PC版：https://www.cnbeta.com.tw/articles/soft/1390023.htm手机版：https://m.cnbeta.com.tw/view/1390023.htm

一张真实照片在 AI 生成图片比赛中获奖

一张真实照片在AI生成图片比赛中获奖摄影师MilesAstray向享有盛誉的1839摄影奖的AI类别提交了一张照片。他的作品名为“FLAMINGONE”，最终获得了评委类别的铜奖和人民投票奖。唯一的问题是，这幅作品不是AI生成的，而是一张真正的火烈鸟的照片。由于该作品上传申报时并未披露其为真实摄影作品，并不符合该类别的要求，该组织现在已经撤销了该作品获得的两个奖项，并改为授予其“荣誉提名”。该组织和摄影作者都表示，该事件证明了艺术和现实世界在技术面前依然有独特的优势，该事件也将让更多人认识到这一点。——

ImagetoMusic：AI图片生成音乐工具根据图片生成音乐的AI工具，只需上传一张图片，系统便会通过文字描述来分析图片的内容

#AI#web#ITMImagetoMusic根据图片生成音乐的AI工具，只需上传一张图片，系统便会通过文字描述来分析图片的内容

两千万人围观了 AI 刘强东

两千万人围观了AI刘强东据界面新闻，豪掷10亿真金白银之后，京东再度出招，请来了创始人刘强东的分身坐镇直播间。6点18分时，京东家电家居、京东超市采销直播间的观看人次分别为299.2万、224.3万，2分钟后的观看量分别达339.6万、300.7万。同日下午7时，刘强东AI数字人下播，京东家电家居、京东超市采销直播间的观看量均逾千万，分别达1275万、1128万。

研究指出AI生成一张图片所消耗的电足够充满两次智能手机

研究指出AI生成一张图片所消耗的电足够充满两次智能手机我们在网上所做的一切，从生成图像到创建文本提示，都依赖于服务器上存储的信息，而这些机器堆叠在数据中心中，需要大量能源来运行和维护。在全球范围内，目前数据中心的用电量约占全球用电量的1%左右，但是随着我们开始更多地使用人工智能，这个数字可能会逐渐上升。新研究由人工智能开发商HuggingFace和卡内基梅隆大学的研究人员团队发起，他们使用一个自主研发的名为CodeCarbon的工具，比较了开源HuggingFaceHub上16个最流行模型的能量消耗和碳排放数据。他们发现，生成图像在能源消耗方面大到难以想象，甚至可能你每生成一张图片，支持它运行的服务器所消耗的电能就足以为普通智能手机充满两次电。根据他们的测试，由于模型、以及生成图像大小的不同，生成式AI每生成1000次图像会消耗消耗0.06-2.9kWh的电量，中位数接近1.35kWh。相比之下，为普通智能手机充电只需要0.012kWh的能量。这意味着只需要大约九张（中位数）人工智能生成的图像就可以消耗与一部充满电的手机一样多的能量。如果用户使用的效率最低的图像生成模型，那么它每生成一张图片所消耗的能量就足以充满一次普通智能手机，最糟糕的情况甚至是两次。他们将能量消耗换算成碳排放，每张图像都会产生0.1到0.5克的二氧化碳，异常值甚至会达到2克二氧化碳，而生成1000张图片产生的排放量相当于普通汽车行驶6.5公里的排放量。生成文本要节能许多，每生成1000次文本平均消耗0.042kWh，这意味着每次生成的碳排放量在0.002至0.015克之间，同样具体取决于所使用的模型。同样，他们也用普通汽车的里程数来让数据更加直观，每生成1000文本差不多相当于普通汽车行驶0.0009公里的碳排放量。另外，他们还发现通用人工智能模型往往比特定任务模型消耗的能量要多得多。比如，使用生成模型对电影评论的正面和负面进行分类所消耗的能量比使用专门为此任务创建的微调模型多出30倍。这是因为生成式人工智能模型试图同时做很多事情，例如生成、分类和总结文本，而不是只完成一项任务，例如分类。最后该团队在接受采访的时候表示，这些数据是为了让人们更加了解人工智能和环境之间的关系，并希望人们能够创造出更低能耗的模型。另外，他们也表示自己的这些数据远不是最终详细数据，但它为建立人工智能监管和最佳实践奠定了基础。虽然数据很惊人，但也不用过于吃惊，因为互联网的创新似乎永远和高能耗挂钩。在谷歌流行的时候，他们曾估算自己每次在线搜索平均消耗0.3瓦时的电量。在比特币出现的时候，人们则在讨论加密货币挖矿每年要消耗127太瓦时(TWh)的电。现在轮到人工智能了。或许大家可以像节约用水一样，克制自己使用生成式AI，这样是不错的节能减排行为，但那些人工智能应用可能并不希望你这么做，这也是矛盾的点。报道原文：https://www.zmescience.com/science/creating-an-image-with-ai-uses-as-much-energy-as-charging-your-smartphone/文献：https://arxiv.org/pdf/2311.16863.pdf...PC版：https://www.cnbeta.com.tw/articles/soft/1404529.htm手机版：https://m.cnbeta.com.tw/view/1404529.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人