一种新的计算方法重新构想人工智能:

一种新的计算方法重新构想人工智能: Multimodal C4:一个开放的、10亿规模的、与文本交错的图像语料库: Inpaint Anything:分割任何东西满足图像修复需求: 了解大型语言模型: 经济学案例,为什么AI不能抢走你的工作: 对齐你的潜变量:利用潜变量扩散模型的高分辨率视频合成: 深度探讨大语言模型生态链:芯片,基建,工具,开源,应用: 设计背后:认识副驾驶: ChatGPT的惊人潜力的内幕-Greg TED演讲: 自主代理完全入门指南-构建你的AutoGPT: 感谢各位的关注,有任何问题和想法欢迎随时与我交流。

相关推荐

封面图片

人工智能对人工智能生成的内容进行训练将导致人工智能崩溃

人工智能对人工智能生成的内容进行训练将导致人工智能崩溃 用于训练大型语言模型的数据最初来自人类来源,如书籍、文章、照片等,这些都是在没有人工智能的帮助下创建的。但随着越来越多的人使用人工智能来制作和发布内容,一个明显的问题出现了:当人工智能生成的内容在互联网上扩散时,人工智能模型开始对其进行训练。研究人员发现,“在训练中使用模型生成的内容会导致所产生的模型出现不可逆转的缺陷。”他们研究了文本到文本和图像到图像的人工智能生成模型的概率分布,得出结论:“从其他模型产生的数据中学习会导致模型崩溃 这是一个退化的过程,并且随着时间的推移,模型会忘记真正的基础数据分布。”他们观察到模型崩溃发生得如此之快:模型可以迅速忘记它们最初学习的大部分原始数据。这导致它们随着时间的推移,表现越来越差,错误越来越多。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

是Google研究的一种新的移动端文本生成图像的方法,专为移动设备设计,是一种高效的潜在扩散模型,能够在半秒内生成高质量的512

是Google研究的一种新的移动端文本生成图像的方法,专为移动设备设计,是一种高效的潜在扩散模型,能够在半秒内生成高质量的512x512图像。 MobileDiffusion的设计遵循潜扩散模型,包括三个组件:文本编码器、扩散UNet和图像解码器。 MobileDiffusion通过优化模型架构,包括Diffusion UNet和图像解码器,展现了在计算效率上的出色表现,该技术有望在移动设备上推动快速图像生成体验,拓展了生成模型在提高用户体验和应对隐私问题方面的潜在应用。

封面图片

【国家发改委:支持开展通用人工智能大模型和垂直领域人工智能大模型训练】

【国家发改委:支持开展通用人工智能大模型和垂直领域人工智能大模型训练】 12 月 15 日,国家发改委就《“数据要素 ×”三年行动计划(2024-2026 年)(征求意见稿)》向社会公开征求意见。意见稿提出,以科学数据支持大模型开发,深入挖掘包含科技文献在内的各类科学数据,通过细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。探索科研新范式,面向新范式需求迫切的重点科研领域,充分依托各类数据库与知识库,推进跨机构、跨学科、跨领域协同创新,发现新规律,创造新知识,加速科学研究范式变革。 快讯/广告 联系 @xingkong888885

封面图片

Meta发布了Segment Anything,一个新的人工智能抠图模型,可以在任何图像/视频中把某个物体图像单独抠出来,只需点

Meta发布了Segment Anything,一个新的人工智能抠图模型,可以在任何图像/视频中把某个物体图像单独抠出来,只需点几下就可以完成。物件分类很准,但对于镂空的地方的处理不如photoshop |||

封面图片

苹果公司开发了一种新的生成式人工智能工具 用于制作图像与动画

苹果公司开发了一种新的生成式人工智能工具 用于制作图像与动画 现在又有一篇研究论文发表了,这次是苹果公司的三位研究人员对一款"使用大型语言模型增强动画设计能力"的应用程序进行了研究和测试。这款名为 Keyframer 的人工智能应用程序可以让用户描述动画,然后为网站生成 CSS 动画代码。Keyframer 尚未公开发布,其测试似乎也相当有限。三位研究人员 Tiffany Tseng、Ruijia Cheng 和 Jeffrey Nichols 写道,他们的研究主要基于 13 位参与者。这些参与者首先用简单的英语描述了他们想要的图像。到目前为止,Adobe Firefly AI 也是这样工作的。然而,在 Firefly 和类似的现有应用程序中,一旦生成图像,用户只能使用应用程序的手动控制来调整或增强图像。苹果 Keyframer 的设计目的是让用户通过继续描述他们需要什么或想要删除什么来反复修改设计。具体来说,该论文将之前在生成式人工智能图像方面的尝试描述为"一次性提示界面"。相比之下,Keyframer 的设计让用户可以在同一幅图像上持续提示多次。研究论文中的细节,显示在用户描述后自动生成的代码一位新手在使用 Keyframer 之后说:"这真是太神奇了,因为我根本不可能手动制作这样的动画......如果没有这个工具,我甚至不知道该从何下手。"一位专业动画师对研究人员说:"我有些担心这些工具会取代工作,因为潜力实在太大了。但我认为,作为一名动画师,了解这些工具并使用它们,只是我们工具箱中的另一种工具而已。""这只会提高我们的技能,"他或她继续说。"这真是令人兴奋的事情"。虽然研究论文 - 31 页、16000 字的文件已经发表,但 Keyframer 本身尚未发布,只是一款内部测试应用。不过,它的存在证实了苹果公司一直在广泛测试生成式人工智能的说法。据传,苹果公司将在 2024 年WWDC大会上公布 iOS 和Siri 等产品在人工智能方面的重大改进。 ... PC版: 手机版:

封面图片

谷歌的 1000 种语言的人工智能模型迈出关键一步

谷歌的 1000 种语言的人工智能模型迈出关键一步 去年 11 月,谷歌宣布其计划创建一个支持世界上 1000 种最常用语言的语言模型,同时还披露了其通用语音模型(USM)。周一,谷歌披露了 USM 的更多信息,称其是创建该语言模型迈出的 “关键性的第一步”。谷歌将 USM 描述为 “一个最先进的语音模型系列”,它有 20 亿个参数,经过了 1200 万小时的语音和超过 300 种语言的 280 亿个句子的训练。USM 已经被 YouTube 用来生成封闭式字幕,支持超过 100 种语言,并将作为基础来建立一个更加广泛的系统。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人