AI 洞察:a16z推出最新商业报告,全球AIGC生态中消费端100强有哪些玩家?

AI洞察:a16z推出最新商业报告,全球AIGC生态中消费端100强有哪些玩家?六个月前,知名硅谷投资机构a16z对网络流量数据进行了一次深入调查和研究,以便区分信号与噪音,推出了当时非常有分量的榜单。[1]虽然有几家早期的「赢家」引起了广泛关注,但每月都有新的人工智能原生公司出现,市场空前活跃,也充斥着竞争。现在这份重量级榜单再次更新,其中一个令人惊讶之处:与之前2023年9月发布的报告相比,40%是新上榜的公司。Top50的AIGC网页服务和Top50的App分别是谁?(以月活为基准的排名)-如图1所示,网页侧前10名是ChatGPT、Gemini、Character.ai、Liner、Quillbot、Poe、Perplexity、JanitorAI、civitai、Claude;-如图2所示,移动端10名的是ChatGPT、Edge浏览器、photomath、Bing、Remini、Brainly、Nova、Chat&Ask、Facemoji、Epik;-如图3所示,有22家公司新晋榜单,称为新秀,Liner、Claude、JanitorAI、ideogram、Eighfy等,其中AI伴侣数量激增,在下文中深入展开。ChatGPT领先,百家争鸣-在六个月前,它已经是访问量最大的网站之一,当时排名No24;-现在它每月访问量20亿次,是第二名Gemini的5倍-移动端方面,它的月活是第二名Edge和第三名Photomath的2.5倍。-另外一个和六个月前的区别,之前榜单中是大批GPT驱动的创新,新秀开始呈现进一步去中心化的趋势。-图3,展示了新品类生产力共有7家,包括Linner、Eighify、Phind、MaxAI、BlackboxAI、Otter.ai和ChatPDF。(这个品类在去年9月份还不存在[1])两个涌现的新品类,九个Discord的重要AI服务-6个月前,LLM通用助手占据网络流量的主体,现在分析发现有两个新品类。-音乐和生产力(研究、编程和文档摘要等)-Sono是目前唯一上榜的音乐公司,通过文本生成原创歌曲和歌词。它是12月才推出的独立网站和Copilot扩展的。

相关推荐

封面图片

AI 洞察:除了 ChatGPT, 新世界还涌现了哪些重磅新玩家?

AI洞察:除了ChatGPT,新世界还涌现了哪些重磅新玩家?近期一份来自硅谷知名投资机构a16z的数据和报告,统计了Top50AIGC领域的新秀,能够从整个生态视角看到不少全新的视角。一些核心发现和行业洞察:-在Top10中,ChatGPT是目前的王者,代表整个名单流量的60%。Character.ai紧随其后,占ChatGPT流量的21%。剩下的前10名呢?Bard、Poe、Quillbot、Photoroom、Civitai、Midjourney、Hugginface以及Perlexity。-与主流社交和视频类产品相比,AI类新服务也仍然相当小。结合Web+移动流量,ChatGPT的规模与Reddit、LinkedIn和Twitch大致相同,仍远低于传统“巨头”。-反过来说,新进的Top50中80%都是近一年内出现的独立新产品,只有5%属于巨头投资。(图3是它们融资情况的数量分布)-另一个重要的信号:排行榜单中有大批GPT驱动的创新。专有模型、微调和基于API的几大创新模式目前平分秋色。-还有一个明显特征,它们大多数都是Web优先,移动流量相对较少。ChatGPT虽然在5月份推出App端,但是占整体的2%不到;Poe只有5%左右,Perplexity、Runway等都更低。当然也有例外,Character.ai移动端占比46%,而Photoroom达到了80%。(图4有详细的展示)-就大类别来看,「通用助理」型产品(ChatGPT、Bard、Poe)占流量的70%。另外两个类别正在发生变化:「伴侣型」现在占13%,「内容生成」占10%;内容编辑占3.7%和模型中心占2.3%共占位列前五。-从用户使用场景不难发现,移动端占比高的几位,具有更高的娱乐属性。根据SensorTower数据,CharacterAI平均每个用户每月访问38次,这一数字超过了Instagram、FB和TikTok。-新公司如何获取增长?几乎是口碑式的。Reddit、Discord、新闻通讯等都是「免费」获取流量的渠道。而且,名单上90%的已经有了某种收入,其中绝大多数选择了订阅。

封面图片

- 图4 展示了9个Discord 服务进入Top100的玩家:Midjourney为首,还有DomoAI、Pika、Suno等

-图4展示了9个Discord服务进入Top100的玩家:Midjourney为首,还有DomoAI、Pika、Suno等。AI伴侣正在成为主流-6个月前,只有两家AI伴侣公司入选,此次更新报告中网页端8家、移动端2家。-Character.ai在网页排名第3,移动榜单第16。-根据SensorTower的数据,Character.ai每个用户每月平均298个会话,Poly.ai则74个。-除了男女朋友,更广泛的伴侣涌现,包括友谊、娱乐、顾问和医疗等。早期研究表明,AI在诊断准确性和临床态度都胜过真人医生。[2](Hans表示感同身受)-在《Nature》杂志最新的一项研究中,Replika聊天机器人减少了3%的自杀倾向。移动vs.网页,场景应用大不同-网页端一般支持更复杂、多步骤的内容生成和编辑工作流,例如语音生成的ElevenLabs和AI绘画的Leonardo,还有PPT利器Gamma等,它们都在Top20之内。-移动端偏向于通用助理,大多模仿ChatGPT,甚至超过10家名称相似。(这是抓住AppStore的SEO优化空间,还有一些羊毛软件,以类似标题和标识来欺骗用户)-移动侧还有一些符合移动特性的AI应用。Facemoji第9,Bobble第31和Genie第37都是专用键盘,在AI帮助下发短信;而Photomath是手机扫描作业,而Elsa是语言学习。AI是一个全球风潮-硅谷可能是AI的中心,但全世界都在制造受欢迎的产品。-榜单上30%源自湾区,也只有1/3移动应用源自美国。-图6展示了开发者的地理分布:北美除美国外,还有加拿大的多伦多、蒙特利尔;亚洲的北京、香港、首尔、伊斯坦堡、新加坡和河内等;欧洲、中东和大洋洲都广泛分布。-一些移动开发者多次创下佳绩:位于伊斯坦布尔的工作室Codeway开发了FaceDance、Wonder和Chat&AskAI,都持续在顶级的应用程序榜单上。土耳其的HubX开发了Nova、DaVinci和PhotoApp增强器等。这份报告侧面证明了AIGC生态蓬勃发展,新一代AI产品将迎来进一步的腾飞。It’stimetobuild~注释和参考:[1]AI洞察:除了ChatGPT,新世界还涌现了哪些重磅玩家?2023.9https://m.okjike.com/originalPosts/65078e2a15391e4bc75bc7f6[2]Hans的GPTStore随机漫步:陪伴篇https://m.okjike.com/originalPosts/65efd14da922aa28d09c5df5[3]a16z官方报告网址:https://a16z.com/100-gen-ai-apps/

封面图片

a16z发布了他们最新调查的前100个生成式AI应用,这次会包括移动应用,里面有些数据分析很有意思

a16z发布了他们最新调查的前100个生成式AI应用,这次会包括移动应用,里面有些数据分析很有意思下面是一些报告中的要点:ChatGPT每月接近20亿次网络访问量,大约是榜单上第二名公司Bard(现在是Gemini)的五倍。在所谓的新来者中,排名最高的包括AI研究副驾驶Liner;Anthropic的通用助手Claude;以及三个未经审查的AI伴侣应用程序:JanitorAI、Spicychat和CrushOn。有五家人工智能公司真正实现了“跨界”,旗下的网络产品和移动应用都进入了前50名单:ChatGPT、CharacterAI、聊天机器人聚合平台Poe,以及图像编辑器Photoroom和Pixelcut。ChatGPT的规模大约是第二和三名选手微软Edge和Photomath的2.5倍截至2024年1月,有九个人工智能产品或社区在邀请流量排名前100的Discord服务器中,其中Midjourney位居榜首。该列表中的第二个显著新类别是生产力。AI原生平台可以提升人们与软件的互动,使他们能够委派琐碎的任务并减少在行政开销上花费的时间。生产力类别包括排名中的七家公司:Liner、Eightify、Phind、MaxAI、BlackboxAI、Otterai和ChatPDF。对于那些有移动应用的伴侣产品来说,用户参与度异常高。在这个类别中最成功的产品成为用户日常生活的核心部分,变得和给朋友发短信一样普遍(甚至更普遍!)。这玩意是真赚钱啊。根据SensorTower的数据,CharacterAI每个用户平均每月有298个会话,而PolyAI平均有74个会话。AI在移动应用和Web上的使用类别有很大的区别。一般来说,Web产品支持更复杂、多步骤的工作流程,涉及内容生成和编辑。这些产品包括AI语音工具包ElevenLabs、AI艺术生成器Leonardo和AI演示文稿生成器Gamma,它们在基于Web的AI产品中排名前20位。应用列表中有七个专用的头像产品;大多数人手机上保存的许多自拍照作为可随时使用的训练数据。此外,排名前三的应用——Facemoji(第9名)、Bobble(第31名)和Genie(第37名)——是专为移动设备设计的键盘应用,可以帮助用户发送带有AI辅助的文本。

封面图片

全球Top500超算公布:Frontier蝉联第一 中国超算不再参加测试

全球Top500超算公布:Frontier蝉联第一中国超算不再参加测试Frontier蝉联第一,Aurora排名第二在Top500超算榜单中,前十大性能最强超级计算机的排名基本上与六个月前在SC23会议期间公布的排名保持一致。唯一的新进前10的超级计算机是来自瑞士国家超级计算中心(CSCS)的Alpsmachine,排名第6名位。具体前十名单如下:1、Frontier以1.206EFlop/s的HPL性能继续蝉联第一。该超算位于美国田纳西州的橡树岭国家实验室(ORNL),由美国能源部(DOE)运营。其采用了HPECrayEX235a架构,2GHzAMDEPYC64CCPU和AMDInstinct250XGPU,共有8699904个CPU和GPU核心,并借助于Slingshot11网络进行数据传输。此外,Frontier还具有高达52.59GFlops/W的额定能效,2、Aurora以1.012Exaflop/s的HPL性能排名第二。相比去年首次上榜时(当时未全部安装完成)性能几乎翻了一倍。该超算安装在美国伊利诺伊州的阿贡国家实验室,也是由美国能源部运营。Aurora基于HPECrayEX网络,整合了21248个IntelXeonMax系列CPU、63744个IntelMax系列GPU、20.42PB内存,峰值性能号称可达2EFlop/s,远超Frontier。3、Eagle以561.2PFlop/s的HPL性能排名第三。该超算安装在微软Azure云平台上,并且它依然是Top500超算中最高排名的云计算系统。这款微软NDv5系统的强大性能,源于英特尔XeonPlatinum8480C处理器和英伟达(NVIDIA)H100GPU加速器的结合。4、Fugaku凭借其442PFlop/s的HPL性能排名第四。该超算安装在日本神户的理研计算科学研究中心(R-CCS),基于2.2GHzFujitsuA64FX48C处理器,TofuinterconnectD互联,共计拥有7630848个核心,继续保持了美国以外地区排名最高的超级计算机的地位。5、LUMI以379.7PFlop/s的HPL性能排名第五。该超算安装在芬兰CSCEuroHPC中心,是欧洲最强的超级计算机,其基于HPECrayEX235a系统,AMD第三代EPYC64C2GHz处理器,AMDInstinctMI250X加速器,Slingshot-11网络、6、Alps以270PFlop/s的HPL性能排名第六。该超算安装于瑞士国家超级计算中心(CSCS),基于HPECray254n系统构建的超算,3.1GHzNVIDIAGrace72C处理器,NVIDIAGH200超级芯片,Slingshot-11网络互联。7、Leonardo以241.2PFlop/s的HPL性能排名第七。该超算安装在意大利CINECA的EuroHPC,基于AtosBullSequanaXH2000系统,由英特尔XeonPlatinumCPU和NVIDIAA100加速器提供强大的计算能力,还采用了四轨NVIDIAHDR100Infiniband。8、MareNostrum5ACC以175.3PFlop/s的HPL性能排名第八。该超算安装在西班牙的EuroHPC/巴塞罗那超级计算中心,基于BullSequanaXH3000系统,采用了英特尔XeonPlatinum8460Y处理器、NVIDIAH100加速器以及InfinibandNDR200网络连接技术。9、Summit以148.6PFlop/s的HPL性能排名第九。该超算是IBM公司在美国橡树岭国家实验室建造的超级计算机,拥有4356个节点,每个节点配备了两个22核的3.07GHzIBMPOWER9CPU和六个NVIDIATeslaV100GPU,每个GPU上集成了80个流式处理器(SM)。10、Eos以121.4PFlop/s的HPL性能排名第十。该超算是英伟达内部使用的DGXSuperPOD,由XeonPlatinum8480C56C3.8GHz,NVIDIAH100加速器共同驱动,还采用了英伟达InfinibandNDR400G交换机。对于排名第二的Aurora超算实际测试性能仅1.012ExaFlop/s,远低于号称性能最高可达2EFlop/s的问题,阿贡国家实验室的副主任兼杰出研究员RickStevens表示,2exaFLOPS这一数值是基于Aurora核心处理器数量与处理器峰值性能相乘得出的理论峰值,但这并非负责维护和运营Aurora的阿贡系统经理所设定的实际性能目标或期望。Stevens解释说:“峰值性能是一个通过计算得出的理论数字,它基于时钟速率与单个计算元件运算次数的乘积。实际上,典型的系统只能达到这个峰值的一小部分,这取决于它们所执行的任务,通常在50%、60%或70%之间。Aurora上标称的2exaFlop/s峰值实际上是结合了GPU和CPU的FLOPS得出的。在基准测试中,通常不会这样做。如果查看Top500榜单中其他类似的系统,就会发现它们同样拥有非常大的理论峰值,但实际达到的峰值比例与Aurora类似。因此,这并不是一个根本性的问题。”Stevens表示,Aurora在基准测试中应该能够实现LINPACK性能的提升,因为在最近的基准测试执行时,Aurora的11%计算能力尚未被激活。他预测,当整个系统安装完成之后,将会产生更高的基准测试数据。然而,他拒绝透露阿贡国家实验室对于Aurora在完全运行状态下的具体性能目标数字。根据HPC-AI行业分析机构HyperionResearch公司的首席执行官EarlJoseph的预计,随着时间的推移和系统的进一步调优,Aurora最终将会超过1.5exaFlop/s。中国不再参加Top500的HPL基准测试在中国的国家级超算去年跌出Top500榜单前十之后,依然无缘于最新的前十榜单。在去年的榜单上,中国的神威·太湖之光和天河二号A也进入了前十五,分别排名第11和第14位。Top500组织在最新发布的报告中指出,中国已决定不再参加Top500的HPL基准测试。在最新的Top500名单中,美国依然是拥有超级计算机数量最多的国家。美国在其之前的基础上新增了7台超级计算机,使得其总数达到了168台。而中国则从104台减少到了80台。Top500组织表示,“事实上,中国在这份新名单上并未报告任何新加入的超级计算机。”从大的区域变化来看,北美地区依然保持领先地位,从上一份榜单的160台系统增加到171台。而亚洲地区则出现了下滑,从169台系统减少到148台。与此同时,欧洲地区实现了显著的增长,从143台增加到160台,位列北美地区之后,成为了全球第二大超级计算机分布区域。英特尔拿下63%的处理器份额Top500组织表示,此次前500强的超算当中,采用英特尔CPU的占比依然是高达63.00%,虽然低于六个月前的67.80%。相比之下,前500强超算当中,有156个系统(31.20%)使用的AMD处理器,高于六个月前的28.00%。另外,还有194个超算系统使用了加速器/协处理器技术,高于六个月前的185个。其中有83个使用了NVIDIAAmpereGPU,48个使用NVIDIAVoltaGPU。从总算力来看,所有Top500超算的的总综合性能从6个月前的7.01ExaFlop/s(EFlop/s)提高到现在的8.21ExaFlop/s。Top100的性能门槛达到了9.44PFlop/s。从核心数量来看,TOP500超算的平均并发级别达到了每个系统229426个内核,高于六个月前的212027个。Green500超算今年的超级计算机Green500榜单也有了显著的变化,前三名的绿色超级计算机均为新上榜者。排名第一的是JEDI–JUPITERExascaleDevelopmentInstrument,这台超级计算机由德国的EuroHPC/FZJ开发。在TOP500超级计算机排名中,JEDI位列第190位,展现出了不俗的性能实力。其能效评级高达72.73GFlop/W,HPL得分为4.5PFlop/s。JEDI是一款配备NVIDIAGraceHopperSuperchip72C的BullSequanaXH3000架构的超级计算,总共有19584个核心处理器。英国布里斯托尔大学的Isambard-AI以68.83GFlop/W能效评级和7.42PFLop/s的HPL得分位居第二。Isambard-AI在TOP500中排名第129位,拥有34,272个核心处理器。排名第三的是来自波兰Cyfronet的Heliossystem。该机器的能效得分为66.95GFlop/WHPL得分为19.14PFlop/s。Top500组织在讨论能源效率时,还特别提到了Top500榜单第一的Frontier系统。Frontier系统取得了1.206EFlop/s的HPL成绩,这一成绩证明了其优秀的计算能力。同时,Frontier在能源效率方面也表现出色,获得了56.97GFlop/W的分数。这使得Frontier在Green500榜单中排名第11位。...PC版:https://www.cnbeta.com.tw/articles/soft/1431648.htm手机版:https://m.cnbeta.com.tw/view/1431648.htm

封面图片

研究揭示了企业如何运用生成式人工智能的有趣现实

研究揭示了企业如何运用生成式人工智能的有趣现实该报告题为《一个新起点:企业中的生成式人工智能》,基于对1000名美国IT决策者的调查,这些决策者参与了公司的GenAI工作,涉及10个行业垂直领域和两种企业规模。正如标题所暗示的那样,研究结果也证实,GenAI正在激发人们对软件应用程序功能、员工工作流程、企业战略制定和调整等方面的全新期望。报告还揭示了许多令人惊讶的事实,说明企业目前是如何部署这项技术的。此外,报告还发现了在对GenAI的了解和部署的先进性方面存在的一些差距,尤其是在不同行业之间。调查结果显示,在参与调查的美国公司中,出人意料地有88%的公司已经在使用生成式人工智能工具,但只有7%的公司制定了有关该技术的正式政策。耐人寻味的是,在目前尚未使用该技术的公司中,约有10%的公司制定了明确禁止使用该技术的政策。正在使用GenAI的更大群体对其带来的机遇充满热情,主要优势如图1所示。超过一半的受访者(56%)认为使用该技术的主要好处是提高了效率,另有49%的受访者认为该技术有可能带来新的业务模式和收入来源。即使是那些正在部署GenAI的受访者也对此表示担忧,55%的受访者强调了潜在的安全问题和企业数据保护问题。同样多的人提到了基础模型可能产生的输出数据的不准确性,几乎同样多的人(53%)表达了对版权侵权的担忧。不出所料,未使用GenAI的企业也有类似的担忧,70%的企业认为版权问题是一个问题,64%的企业认为知识产权泄露是他们不愿意使用的原因。此外,这部分人中有52%的人表示,他们的组织缺乏利用GenAI所需的技能组合--这一数据点凸显了许多企业在这一先进新技术方面所面临的巨大教育差距。有趣的是,即使在这部分持怀疑态度的人中,也只有7%的人表示他们对部署该技术毫无兴趣,剩下93%的人则表示愿意在未来的某个时间点考虑部署该技术。调查对象之间最显著的差异点之一是他们正在实施的启用GenAI的应用类型,特别是在不同的行业垂直领域。在最高级别上,生产力和内容生成相关的应用程序(如文字处理器)最常用。不过,在某些行业,软件编码或客户关系管理(CRM)工具等应用程序是首选。当受访者被要求对类似的(尽管不完全相同)GenAI驱动的产品类别进行价值排序时,公司所看重的与他们目前正在使用的往往存在差异。这表明,许多公司对他们希望运行的GenAI相关应用类型有想法,但尚未找到满足其特定需求的解决方案。这是研究中的众多数据点之一,它强调了一个事实,即我们仍处于GenAI应用的早期阶段,供应商有大量机会创建新的或增强型解决方案来满足客户需求。行业间差异最显著的例子之一是公司建立自己的GenAI模型的潜力。关于公司希望利用自身数据定制GenAI模型的讨论非常多,研究也证实了这一点。有些人甚至推测,企业对创建定制模型的兴趣很高。然而,研究结果表明,大多数企业目前对这种更高级的应用没有兴趣,只有一个明显的例外。如图2所示,只有以技术为重点的ICT(信息、通信和技术)行业对这一领域表示出浓厚的兴趣。在所有其他行业中,只有个位数百分比的公司表示非常有可能或有一定可能建立自己的定制GenAI模型。然而,在信息和通信技术行业,这一比例大幅上升至69%。这些结果突出表明,只有技术先进的公司才了解定制GenAI模型可能提供的意义和机会。这些结果还揭示了在更复杂的GenAI部署方面存在巨大的教育差距,需要加以解决。事实上,GenAI已经成为主流,这为参与这一新兴市场的供应商提供了大量令人兴奋的机会。然而,正如研究中的这些和其他发现所表明的那样,要确保GenAI成为各种类型企业始终有用和强大的产品,还需要大量的教育、有针对性的产品和更多的服务。您可以在此免费下载《企业中的生成式人工智能》研究摘要要点:https://technalysisresearch.com/downloads/TECHnalysis%20Research%20Generative%20AI%20in%20Enterprise%20Survey%20Highlights.pdf...PC版:https://www.cnbeta.com.tw/articles/soft/1373771.htm手机版:https://m.cnbeta.com.tw/view/1373771.htm

封面图片

千万人围观“烧焦婴儿”图片 伯克利教授辟谣:AI图片检测器无用

千万人围观“烧焦婴儿”图片伯克利教授辟谣:AI图片检测器无用其中,一张“烧焦婴儿”的照片,由于太过于残忍,让人难以置信。于是,有人把照片放到了AI图片检测器中,来检测这些照片是否为AI生成。果然,这张照片被AI检测器——Optic,认定为“AI生成”。而在4chan上,甚至还出现了“原图”,原本尸体的位置其实是一只狗狗。于是网友愤怒地去发布者推文下方留言,攻击他利用AI生成的照片来散播虚假的末日恐慌。这条认为照片是由AI生成的推文,2天不到的时间已经有2100万的阅读。但是很快网友们发现,他们把照片放到了同样的AI检测器上,检测结果几乎是随机的,既有AI,也有人类。有人发现,只要把同一张图片裁剪一下,或者背景色变成黑白,这个检测器就会认为图片是由人类拍摄的。甚至有时候检测器“抛硬币”的时候,硬币还会立起来...那到底这张图是不是由AI生成的呢?最后,AI检测器官方也针对这个事件发推,认为他们的没有办法确定图片是否由AI生成,希望大家理性讨论。AI图片检测器,到底有多不靠谱?UCBerkeley教授、世界顶尖的数字图像处理专家之一HanyFarid表示,这张图像没有任何迹象表明它是由AI生成的。“AI图像生成器最大的问题之一是高度结构化的形状和直线,”Farid说。“如果你看到桌腿和螺丝,一切看起来都很完美,那么图片就几乎不可能是由AI生成的。”比如这张著名的“海绵宝宝制造了9/1”的图片,窗外的双子塔线条都不直,飞机上的仪表盘都相互扭曲到一起了,这看起来就是“A里A气的”。“我们在那张照片中能够看到物体的结构很准确、阴影也很准确、没有伪影——这让我相信这张照片应该完全是真实的”法里德说。Farid还通过他自己的其他AI图像检测器识别了这幅图,另外四种AI图像检测工具也都认为图像不是AI生成的。Farid说,“AI检测器是一个工具,但它只是工具包的一部分。用户需要对整个图像进行进行一系列的测试,不可能只按一个按钮就得到答案。”而AI检测工具Optic确实也没有给出自己的检测技术的具体细节。Optic网站也声明,“AI检测器可能会产生不准确的结果”。AI图像检测技术Farid教授在去年曾经撰写过一篇论文,介绍了如何判断AI生图工具图像的一致性。通过判断图像上的一致性,可以帮助判断出图像是否由AI生成。论文链接:https://arxiv.org/abs/2206.14617?ref=404media.co教授首先概述三种相关的基于物理的分析方式,每种分析都利用了图像形成过程固有的相同的基础透视几何原理。消失点平行后退线汇聚于一个消失点。瓷砖之间的线图1(a)是平行的。成像时,这些线全部汇聚在一个消失点。如果场景中的平行线在深度上远离镜头,那么就会存在消失点,尽管它可能落在图像之外。如果场景中的平行线在深度上不后退,也就是说,如果它们完全平行于镜头传感器(在任何距离),则平行线将被成像为平行线,出于实际目的,可以考虑消失点处于无穷远。这种几何学源于透视投影的基础知识。在透视投影下,场景中的点(X,Y,Z)被成像到点(fX/Z,fY/Z),其中f是镜头焦距。由于图像中点的位置与距离Z成反比,因此投影点会作为距离的函数进行压缩,从而导致图像中的线会聚;2.平行平面上的平行线会聚到同一个消失点远处的盒子在图1(b)与地板上的瓷砖对齐,使得盒子的边缘与瓷砖之间的线平行。因为平行平面上的平行线共享一个消失点,所以盒子侧面和瓷砖地板的消失点是相同的;3.平面上所有直线的消失点都位于消失线上。许多组平行线,每组平行线会聚到不同的消失点,如图1(c)所示。如果平行线组跨越场景中的同一平面,则它们的消失点将位于消失线上。消失线的方向由镜头相对于平行线所跨越的平面的旋转来确定阴影有点令人惊讶的是,消失点背后的相同几何形状也适用于投射阴影。上图显示的是连接盒子上的点及其在投射阴影上的对应点的三条光线。扩展图像边界后发现,这三条光线相交于一个点,该点对应的是照亮场景的光源的投影。无论光源在附近(台灯)还是在远处(太阳),这种与阴影、物体和光相关的几何约束都成立,并且无论阴影投射到的表面的位置和方向如何,该几何约束都成立。当然,该分析假设场景由单个主光源照明,从每个对象仅存在单个投射阴影可以明显看出这一点。在上面的示例中,照亮场景的光源位于镜头前面,因此光源的投影位于图像平面的上半部分。然而,如果光线位于镜头后面,则光源的投影将位于图像平面的下半部分。由于这种反转,对象约束的阴影也必须反转。因此,图像的投射阴影分析必须考虑三种可能性:(1)光线位于镜头前面,光源的投影位于图像平面的上半部分,约束锚定在投射阴影上并包围对象;(2)光线在镜头后面,光源的投影在图像平面的下半部分,约束锚定在物体上并包围投射的阴影;(3)光线位于镜头中心的正上方或正下方,光源的投影位于无穷远,约束将在无穷远相交。如果这些情况中的任何一种导致所有约束的共同交集,则投射阴影在物理上是合理的。反射下图2所示的场景是三个盒子反射在平面镜中。这个图的下半部分显示了真实盒子和虚拟盒子之间的几何关系。橙色线代表镜子,位于两组盒子之间的中点。黄线连接真实和虚拟盒子上的对应点。这些线彼此平行并垂直于镜子。现在考虑一下这些平行线叠加在场景上时如何出现。从镜子平面观察时平行的线不再平行。相反,由于透视投影,这些平行线会聚到一个点,就像世界中的平行线会聚到一个消失点一样。由于连接场景中对应点及其反射的线始终是平行的,因此这些线必须在图像中具有共同的交点才能在物理上合理。实例分析上图3显示了AI合成图像的三个代表性示例,并对地板和柜台顶部的几何透视一致性进行了分析。每张图像(在几个像素内)准确地捕捉了瓷砖地板的透视几何形状,作为一致的消失点(以蓝色呈现)的证据。然而,平行台面(以青色呈现)的消失点在几何上与台面的消失点不一致。相应的对齐图块。即使台面与瓷砖不平行,青色消失点也应位于由瓷砖地板消失点定义的消失线(以红色呈现)上。请注意,对于图3右上角的图像,瓷砖地板上的水平线几乎是平行的,因此相应的消失点位于无穷远,因此不会相交。虽然这些图像中消失点局部事一致的,但并不是全局一致的。在25张合成的厨房图像中,每张都发现了相同的模式。上图是用提示词生成的方块图片,在阴影处就明显地出现了不一致性。上图8所示是将几何分析应用于由AI生成的包含了看上去相当准确的反射的图像结果。尽管这些反射在视觉上是合理的,但在几何上并不一致。与前几节中的投射阴影和几何结构不同,DALL·E-2很难合成合理的反射,大概是因为此类反射在其训练图像数据集中不太常见。基于这些对于AI生成图片局限性的了解,通过对于图片一致性的检测,能非常有助于判断图片是否由AI合成。图像识别难,AI打败AIAI图像生成器,正不断进化。上半年,Midjourney爆火,能够生成足够逼真的图片,却愚弄了很多人。86岁教皇头顶白色小瓜帽、一身喇叭口的白色羽绒服,金属制的十字架项链外露,外加一本正经的表情。当时,这张照片一经发布,在社交媒体上骗过了所有人,被许多网友疯狂转发,甚至有人直呼教皇太潮了。在大家都信以为真时,突然有人点出这是AI生成的,许多人瞬间傻眼了。这仅是其中的一个栗子,还有马斯克新女友GM的首席执行官Barr...PC版:https://www.cnbeta.com.tw/articles/soft/1390023.htm手机版:https://m.cnbeta.com.tw/view/1390023.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人