网络迷踪初探：凭什么只用一张照片，就能知道你在哪里？[bySuperJerry]https://sspai.com/post/73193

PointerPointer鼠标指哪里返回一张照片手指指哪里#趣站https://www.abskoop.com/18995/

抖音跳舞不用真人出镜一张照片就能生成高质量视频

抖音跳舞不用真人出镜一张照片就能生成高质量视频真实的打开方式是这样的：这就是来自新加坡国立大学和字节跳动最新的一项研究，名叫MagicAnimate。它的作用简单来说可以总结为一个公式：一张图片+一组动作=毫无违和感的视频。然后啊，这项技术一经公布，可谓是在科技圈里掀起了不小的波澜，众多科技大佬和极客们纷纷下场耍了起来。就连HuggingFaceCTO都拿自己的头像体验了一把：顺便还风趣地开了句玩笑：这算是健身了吧？我这周可以不去健身房了。还有相当与时俱进的网友，拿着刚出炉的GTA6（侠盗猎车手6）预告片中的人物玩了一把：甚至就连表情包们也成了网友们pick的对象……MagicAnimate可以说是把科技圈的目光聚焦到了自己身上，因此也有网友调侃说：OpenAI可以休息一下了。火，着实是火。一张图即可生成一段舞那么如此火爆的MagicAnimate，该如何“食用”？话不多说，我们现在就来手把手地体验一次。目前项目团队已经在HuggingFace中开放了在线体验的页面：操作也是非常得简单，只需三步即可：上传一张静态人物照片上传想要生成的动作demo视频调整参数，点击“Animate”即可例如下面就是鄙人照片和一段近期席卷全球的《科目三》舞蹈片段：△视频源：抖音（ID：QC0217）也可以选择页面下方提供的模版进行体验：不过需要注意的是，由于MagicAnimate目前过于火爆，在生成的过程中可能会出现“宕机”的情况：即便成功“食用”，可能也得排大队……（没错！截至发稿，还是没有等到结果！）除此之外，MagicAnimate在GitHub中也给出了本地体验的方式，感兴趣的小伙伴可以试试哦~那么接下来的一个问题便是：怎么做到的？整体而言，MagicAnimate采用的是基于扩散模型（diffusion）的一个框架，目的就是增强时间一致性、保持参考图像的真实性，并提高动画保真度。为此，团队首先开发了一个视频扩散模型（TemporalConsistencyModeling）来编码时间信息。这个模型通过在扩散网络中加入时间注意力模块，来编码时间信息，从而确保动画中各帧之间的时间一致性。其次，为了保持帧间的外观一致性，团队引入了一种新的外观编码器（AppearanceEncoder）来保留参考图像的复杂细节。这个编码器与以往使用CLIP编码的方法不同，能够提取密集的视觉特征来引导动画，从而更好地保留身份、背景和服装等信息。在这两项创新技术的基础之上，团队进一步采用了一种简单的视频融合技术（VideoFusionTechnique）来促进长视频动画的平滑过渡。最终，在两个基准上的实验表明，MagicAnimate的结果要远优于以往的方法。尤其是在具有挑战性的TikTok舞蹈数据集上，MagicAnimate在视频保真度方面比最强基线高出38%以上！团队所给出的定性比较如下：以及与cross-ID的SOTA基线相比，结果如下：OneMoreThing不得不说，诸如MagicAnimate的项目最近着实是有点火爆。这不，在它“出道”前不久，阿里团队也发布了一个名叫AnimateAnyone的项目，同样是只要“一张图”和“想要的动作”：由此，也有网友发出了疑问：这似乎是MagicAnimate和AnimateAnyone之间的战争。谁更胜一筹？...PC版：https://www.cnbeta.com.tw/articles/soft/1402409.htm手机版：https://m.cnbeta.com.tw/view/1402409.htm

一张照片200块

阿里云通义千问 App 上线“通义舞王”：一张照片就能生成跳舞视频

阿里云旗下的通义千问App近日上线了一项免费的新功能“通义舞王”：用户在按照提示要求上传照片后，经过十几分钟的等待，即可自动生成舞蹈视频。据介绍，该功能背后的算法为阿里通义实验室自研的视频生成模型AnimateAnyone。用户使用人物全身照片生成的舞蹈视频号称能够保留原始形象的面部表情、身材比例、服装乃至背景等特征。当前该功能内置了12种舞蹈模板，包括当前较为热门的“科目三”，还有蒙古舞、划桨舞、鬼步舞等等。via匿名标签:#通义千问频道:@GodlyNews1投稿:@GodlyNewsBot

只要上传一张照片就能被“X光”，扒各种隐私，有点细思极恐

只要上传一张照片就能被“X光”，扒各种隐私，有点细思极恐PimEyes：一款面部识别搜索引擎和反向图像搜索工具PimEyes可以通过互联网搜索包含指定面部的图片，并使用面部识别搜索技术进行反向图像搜索。通过PimEyes，您可以找到面部并查看图片在互联网上的出现位置，帮助您保护隐私。这是一种很好的工具来审查版权侵权行为。您可以上传照片进行搜索，并成为订阅用户以查看发布您照片的网站来源。PimEyes还提供定价方案，让您访问搜索结果、设置警报以监控在线存在、以及永久删除外部网站上的照片。PimEyes使用最新的技术，如人工智能和机器学习，帮助您在互联网上找到自己的图片，并保护您免受骗子、身份盗窃者或非法使用您照片的人伤害。PimEyes是一个多功能工具，让您追踪互联网上的面部、维护图片权益并监控您的在线存在。通过PimEyes的面部识别搜索引擎，可以发现您的面部在互联网上的出现位置。https://pimeyes.com/en

最新AI看一眼照片就能定位你在哪里，精确到经纬度

最新AI看一眼照片就能定位你在哪里，精确到经纬度美国，加利福尼亚州，旧金山机场洗手间，93号登机口附近……坐标：37.6189°N，122.3744°W再如下面这张照片，AI根据湖的特征、树木和背景中的山脉，就匹配到了玛丽湖，同样是给出了精准的坐标：恐怖如斯，恐怖如斯。至于这个AI工具，则是最近由一位俄罗斯黑客所推出，名叫GeoSpy，号称是可以根据照片里的各种细节做分析来判断地理位置。包括光线、植物、建筑风格、天气，并将它们与大量街景/地理照片进行对比，据说也用到了地理空间视觉大语言模型的技术。而GeoSpy的功能，像极了此前一款基于Google地图的游戏GeoGuessr——游戏中会展示一张街景图，然后玩家要从地图上找到它的坐标位置；给出答案与正确坐标越近，分数越高。之前也有一位国外小哥凭借只需看0.1秒街景，就能在世界地图上快速锁定位置而在网络上蹿红。果不其然，斯坦福计算机系学生AndrewGao在尝试了GeoSpy之后，就开始喊话这位小哥了：你要失业喽~不过也有GeoGuessr的职业玩家坐不住了，站出来表示不服：申请一战！人类vsAI这位挑战者，名叫做Gavin（下文我们简称“G哥”），是一位正在参与GeoGuessr2024世界杯的职业选手。G哥把他跟AI在线对垒的情况上传到了网上。规则和GeoGuessr一致，还是看图猜位置。在第一轮对决中，G哥凭借抓到了马路道边上土耳其样式柱子的细节，判断这张图可能是在土耳其附近。结果显示，这张图里的位置确实是在土耳其附近，但距离精准的位置还差241km。接下来就轮到GeoSpy这个AI选手登场了。G哥处理的方式是将截图“投喂”给AI，在静候了片刻之后，GeoSpy就给出了结果。国家：土耳其经纬度：39.998923,32.607491然后G哥在地图中搜索这个经纬度，再跟GeoGuessr的“标准答案”做比较：第一轮的结果可以说是让G哥大受震惊，GeoSpy给出的位置比他的更近……来看下G哥当时的表情：在接下来的“火拼”中，G哥变得更加仔细，都凑近屏幕去捕捉细节了。G哥这次给出的答案是苏门答腊岛，但实际的结果却不是很理想，距离“标准答案”足足703km。到了GeoSpy这边，虽然大致位置都是在印度尼西亚，但这次给出的位置就没有那么准确了。不过比起G哥给出的答案，距离上却还是AI的答案更近些，这使得G哥开始有点无语子……在接下来的比试中，即便G哥把猜测距离压缩了86km，但GeoSpy给出的结果又是更接近于“标准答案”。G哥此时已经开始掩面了：在最后一轮battle中，G哥直接说出：人类必须反将AI一军。然后G哥把头埋得更深了，当他捕捉到图中路边有文字时，脸上露出了得意的笑容：这局稳了，AI它不识字的。G哥的结果是，距离标准答案134km。不过令G哥万万没想到的是，GeoSpy，它！识！字！这张照片是在波兰拍摄的，因为建筑物上写着“Abet”，这是一家波兰公司。然而G哥还是觉得这把有希望，因为他发现GeoSpy只能定位到城市。所以这把如果AI给出的坐标是“标准答案”旁边的城市“华沙”，那么G哥就赢了。结果还真是……G哥也是露出了久违的笑容，并骄傲地说：AI永远不会打败人类！（Emmmm……G哥，你非要这么算的话……也行。）G哥在下一轮的比拼中，将地图范围缩小到了自己的老家——芝加哥。这次在自己的地盘上，G哥的表现非常勇猛，有距离“标准答案”仅2m和4m的成绩。不过AI这边也是非常精准，起码在看图描述的过程中可以精确地说出周边的地址，这也让G哥着实捏了一把汗。但在地图上搜AI给出的坐标的时候，却比文字描述的地点远一些了，有的甚至还定位到了海上。……最后，G哥在与AI交锋了数次之后感慨道：这次体验非常有趣并且让人印象深刻。但我也害怕这样的技术在未来5年后会迭代到什么样的程度。也会频频翻车其实在刚才G哥体验的过程，我们就能发现GeoSpy也存在一定的bug。例如它更倾向于把地点定位到某个城市，以及给出的经纬度坐标会跟文字描述的地点有偏差。网友们在实际体验过后也有类似的感觉。以至于许多人开始怀疑这个GeoSpy到底是不是凭借所谓的“地理空间视觉大语言模型”技术。毕竟现在每张照片的背后就会有大量且丰富的信息：但无论如何，这件事情倒是给我们敲了一个警钟——技术的发展虽然日新月异，但我们也要时刻警惕数据安全的问题；平常一定要注意，不然一不小心就可能被开盒。...PC版：https://www.cnbeta.com.tw/articles/soft/1430569.htm手机版：https://m.cnbeta.com.tw/view/1430569.htm