彭博社 的一篇文章《》称:

彭博社 的一篇文章《》称: 一名德国高中老师 Christoph Schuhmann 创立了一个名为“Large-scale AI Open Network”(LAION)的免费AI训练数据集。该数据集已经包含了超过50亿张图片,并被广泛应用于训练文本到图像生成器,如Google的Imagen和Stable Diffusion。Schuhmann和他的志愿者团队从各大网站如Pinterest、Shopify和亚马逊网络服务等爬取了大量图像,并与之关联描述性文本,最终形成了目前最大的免费图像和标题数据集。此举引发了一系列道德和法律问题,例如是否可以利用公共可用的材料来构建数据库,以及这些创作者是否应该得到报酬。虽然Stability AI和Midjourney等公司因版权侵犯而面临诉讼,但Schuhmann并不担心这些问题,他只想将数据开放出来。 摘要来自 ChatGPT

相关推荐

封面图片

Google Cloud宣布,其最新的图像生成技术Imagen 2 on Vertex AI已经正式上线,为Vertex AI客

Google Cloud宣布,其最新的图像生成技术Imagen 2 on Vertex AI已经正式上线,为Vertex AI客户提供服务。这一技术是Google Cloud图像生成能力的重大升级,采用了先进的文本到图像技术,为开发者提供了全面的定制化工具、完全托管的基础设施以及内置的隐私和安全功能。 Imagen 2 on Vertex AI基于Google DeepMind技术的研发成果,实现了显著提升的图像质量,并提供了一系列功能,使开发者能够根据其特定用例创建图像,包括: -从自然语言提示生成高质量、逼真、高分辨率、美观的图像 -支持多语言的文本渲染,以创建带有准确文本叠加的图像 -生成公司或产品标识并将其叠加在图像中的Logo -实现视觉问答,从图像生成描述性标题,并对图像细节的问题提供信息性文本回答 此外,Imagen 2 on Vertex AI的适用性扩展得更广,包括以下新功能: -高质量图像:Imagen 2通过改进的图像+文本理解和多种创新训练和建模技术,可以实现准确、高质量、逼真的输出 -文本渲染支持:Imagen 2能够解决文本到图像技术常常存在的问题,确保输出图像中正确呈现所需的词语或短语,帮助组织在品牌和信息传递方面实现更深层次控制 -Logo生成:Imagen 2可以为企业、品牌和产品生成各种创意和逼真的Logo,包括徽标、字母标志和抽象标志,并具备将这些Logo叠加到产品、服装、名片和其他表面的能力 -图片描述和问答:Imagen 2的增强图像理解能力使客户能够创建描述性的长篇文字说明,并获得关于图像细节问题的详细答案 -多语言提示:除了英语,Imagen 2还支持六种其他语言(中文、印地语、日语、韩语、葡萄牙语、西班牙语)的预览版本,并计划在2024年初发布更多语言的支持。此功能包括在提示和输出之间进行翻译的能力,例如,用西班牙语提示但指定输出应为葡萄牙语 -安全性:Imagen 2包含内置的安全预防措施,确保生成的图像符合Google的负责任人工智能原则。如,Imagen 2与我们的实验性数字水印服务集成,由Google DeepMind的SynthID提供支持,允许授权访问的客户生成隐形水印并验证Imagen生成的图像。Imagen 2还包含全面的安全过滤器,帮助防止生成潜在有害内容 标签: #Google #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

据彭博社报道,Adobe 正在使用 Midjourney 的图片,训练其文生图模型 Firefly。

据彭博社报道,Adobe 正在使用 Midjourney 的图片,训练其文生图模型 Firefly。 消息人士透露,关于使用 Midjourney 的 AI 生成图片来训练 Firefly 模型在 Adobe 内部一直存在非常大的分歧。即使在 Firefly 开发的早期阶段,一些员工也不同意 Adobe 将 AI 生成的图像纳入到Firefly 训练数据中。 在用于训练 Firefly 的 Adobe Stock 数据库中,有 5700 万条数据被标记为 AI 生成的,这约占数据库中图像总数的 14%。而此前 Adobe 发言人指出,用于训练 Firefly 的图像中只有 5% 来自其他平台创建的 AI 图像。 标签: #Adobe #AI 频道: @GodlyNews1 投稿: @Godlynewsbot

封面图片

在果壳发了一篇如何训练 AI 服装/模特的文章。

在果壳发了一篇如何训练 AI 服装/模特的文章。 教程链接: 训练思路基本可以 apply 到任何单体概念的训练上,希望有更多朋友能一起出来交流训练思路和经验,我们此刻正在时代的最前沿,往前挖的任何方向都可能埋有宝藏。 btw: 写的时候真的捶胸顿足写不下去,东西实在太多了 谢谢 Biu 帮我修改,我的中文真的不太行哈哈哈哈哈 #AI工作流 #AI的神奇用法

封面图片

最近一直在思考设计师在 AI 时代的定位和职能问题,昨天看到一篇文章,《模型设计师的崛起》有点意思。

最近一直在思考设计师在 AI 时代的定位和职能问题,昨天看到一篇文章,《模型设计师的崛起》有点意思。 他提出了模型设计师这一职位,指出设计师不应仅仅关注AI模型的界面设计,而应深入了解模型的核心构造。 不过这个内容主要还是跟 LLM 相关,设计师在图像和视频模型的优化和训练上其实可以做更多事情,重要性也比 LLM 要更强,我找时间写一下这部分内容。 模型设计师的职责包括与工程团队紧密合作,应对AI模型构建中固有的诸如幻觉、隐私和偏见等问题。 还给出了一些模型设计师需要做的例子,比如通过体验优化引导和简化用户书写提示词的难度等。 翻译及原文:

封面图片

看到一个新闻,一篇文章。

看到一个新闻,一篇文章。 新闻说某地一些采集核酸样品的工作人员因为防护措施没做好而感染。这个其实提醒我们,反复的大规模核酸检测不可避免地带来人员聚集情况,本身存在扩散感染的风险,这个几个月前我在公众号上就写过一篇文章。现在工作人员在密集的采样环境下感染,自然也要考虑同样在这个环境下的被检测的人的风险这些工作人员是因为在这个环境里与感染者近距离接触感染的,同样在这里的老百姓一样也有被感染的风险。 这是一个非常鲜活的教训,告诉我们核酸不是测得越多、越频繁就越好。 另外看到的故事是有人因为想吃鸡火丝,不小心走到医院边上一个密接人员经过的地方,被隔离了两周。我很好奇鸡火丝是什么,但这个可以先放在一边,从长计议。毕竟无论是什么山珍海味,隔离两周的代价未免太高,吃不起。 我想提出来的是,为什么需要去隔离这样的纯纯粹粹的路人甲。什么样的人需要隔离,是依据实际暴露程度与感染风险来的。这个人经过的地方,当时没有感染者在。注意在这个地方呆过的人是密切接触者,不是感染者,而且这个人已经被带走了。这种情况下,误入这个区域的人算什么?连次密接都算不上。按现在的防控方案,根本就不需要隔离。 这种就是典型的,毫无意义的折腾。 从这篇文章的描述来看,这样被拉去隔离的人各种情况都有,甚至包括高危孕妇、刚做完手术伤口尚未痊愈的人,以及有痛风这种基础疾病的人。这些人莫名其妙拉去隔离,出事的风险是多大? 我们甚至可以回看不到一个月前贵州转运疫情相关人员发生重大车祸的事情。里面的人按照防控方案,根本不需要去别的地方集中隔离。但就是莫名其妙要到整个省最边远的地方隔离管理。这不是没事增加风险吗? 反复大规模做核酸最后在核酸监测点发生传播,以及将没有隔离必要的人强制集中隔离,这些都不是降低疫情风险,只是在增加防疫成本,甚至在增加次生灾害以及疫情本身扩散的风险。

封面图片

一个强大的图像标记基础模型:

一个强大的图像标记基础模型: RAM 采用一种新的图像标记范例,可高精度地识别任何常见类别,并利用大规模图像文本对进行训练,而不是手动注释。 RAM 的开发包括四个关键步骤: 1. 通过自动文本语义解析大规模获取无注释图像标签; 2. 使用统一标题和标记任务,训练初步模型进行自动注释,分别由原始文本和解析标签监督; 3. 利用数据引擎生成额外注释并清除不正确的注释; 4. 利用处理后的数据对模型进行再训练,并使用更小但质量更高的数据集进行微调。 经过众多基准测试评估,RAM 的标记能力颇为优秀,效果明显优于 CLIP 和 BLIP。值得注意的是,RAM 甚至超越了完全监督的方式,甚至可媲美 Google API。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人