Stability AI推出适用于普通电脑的文本生成图像模型SD3 Medium

Stability AI推出适用于普通电脑的文本生成图像模型SD3 Medium Stable Diffusion 系列文本生成图形模型开发商 Stability AI 今天宣布基于 SD3 推出了新版本 SD3 Medium 版,该版本尺寸体积非常小只有 2B 参数,因此适合在消费级笔记本电脑、台式机和企业级 GPU 上运行。和之前的 SD 系列模型一样,SD3 Medium 版也是免费提供的,属于开放但非开源的模型,如果需要商业性使用则应当购买授权。Stable Diffusion 3 Medium 版具有以下特点:参数规模仅为 20 亿照片级真实感:克服手部和面部常见的瑕疵,无需复杂的工作流程即可生成高质量图像遵守复杂的提示词:可以理解涉及空间关系、构图元素、动作和风格的复杂提示词内容排版:在 Diffusion Transformer 架构的帮助下,大幅度改进生成文本内容时的伪影和拼写错误问题高效利用资源:占用的显存非常小,非常适合在消费级 PC 和笔记本电脑上运行并且不会降低性能微调:能够从小数据集中吸收细微的细节,因此也适合进行定制哪些消费级显卡 / 企业级显卡支持 SD3 Medium 版:Stability AI 与英伟达和 AMD 合作,在部分消费级和企业级显卡上优化 SD3 Medium 的推理,其中还为英伟达推出了特别版本。支持的英伟达显卡主要是 NVIDIA RTX 系列,Stability AI 利用 RTX 显卡和 TensorRT 来提升性能,其中 TensorRT 优化版本提供更好的性能,用户可以下载英伟达专版的 SD3 Medium。AMD 方面支持 AMD 最新的 APU、消费级 GPU 和米兰 300X 系列企业级 GPU,经过 AMD 优化后也可以使用 SD3 Medium,不过性能方面可能要比英伟达专版的要低些。从哪里获取 SD3 Medium 版:其中英伟达专版的 TensorRT 版 SD3 Medium 可以在这里下载: AMD 的通用版本可以在这里下载: ... PC版: 手机版:

相关推荐

封面图片

:Stability AI最新推出的高级文本到图像AI模型,适合在消费级PC、笔记本及企业级GPU上运行,有望成为文本到图像模型

:Stability AI最新推出的高级文本到图像AI模型,适合在消费级PC、笔记本及企业级GPU上运行,有望成为文本到图像模型的新标准 - Stability AI公开发布了Stable Diffusion 3 Medium图像生成模型,这是目前该公司最先进的开源文本到图像模型。 - Stable Diffusion 3 Medium是一个20亿参数量的模型,相比之前的模型有显著改进:整体图像质量和逼真度大幅提升,能够生成高质量的照片逼真图像;理解长难句子描述的能力增强;文字质量也有很大提升,减少拼写、字间距等错误。 - 该模型大小适中,非常适合在普通消费级PC和笔记本电脑上运行,也能在企业级GPU上充分发挥性能。它有望成为文本到图像模型的新标准。 - Stable Diffusion 3 Medium在Stability非商业研究社区许可证下对外开源。对于商业用途,鼓励使用新的Creator许可证。大规模商业使用还需联系Stability取得企业许可证。 - 用户可以通过Stability的API、Stable Assistant和Stable Artisan等渠道试用Stable Diffusion 3 Medium。 - Stability AI表示会根据用户反馈持续改进该模型,扩展其功能,提升性能。目标是为艺术创作和业余用户都设定一个新的标准。 - Stability AI坚持开放和负责任的AI实践,在模型的训练、测试、部署等各个阶段采取合理措施防止模型被恶意滥用。

封面图片

适用于Linux系统的NVIDIA驱动程序默认情况下将安装开源内核版本

适用于Linux系统的NVIDIA驱动程序默认情况下将安装开源内核版本 这个开源内核模块采用双开源许可证,内核源代码也在 GitHub 上提供,两种内核模块使用相同的底层源代码,但互斥也就是不能同时安装,不过无论是安装哪种内核模块,驱动程序的用户空间组件都是相同的、并且以相同的方式运行。现在的变化是什么:5 月 11 日英伟达宣布从 560.x 系列驱动程序开始,默认情况下不再安装专有的英伟达驱动程序,而是安装具有开放内核的驱动程序。如果用户通过.run 文件开始安装,英伟达将预先检测系统使用的显卡型号,如果显卡支持的话,那么默认情况下就安装开放内核版。相反,如果显卡不支持则安装英伟达闭源的驱动程序。受支持的主要是基于 NVIDIA Turing 及以上架构的显卡,图灵架构的产品包括 GTX 16XX/20XX、MX450/550、RTX 3000~8000 等。简单来说就是 2018 年及之后英伟达推出的显卡都支持使用开放内核模块的驱动程序,从 560.x 驱动程序也默认安装开放内核。后续的变化:英伟达还透露现阶段如果用户需要,仍然可以通过命令行来指定内核,也就是继续安装英伟达闭源的内核模块,不过在未来某些显卡将只支持安装开放内核模块。这种说法是否意味着随着时间的推移英伟达会逐渐放弃闭源内核的驱动程序呢?这是有可能的,毕竟对英伟达来说如果开源 / 闭源驱动模块都能实现完全相同的功能和性能,那也没必要再继续维护两套驱动程序。 ... PC版: 手机版:

封面图片

Stable Diffusion 是人工智能公司 Stability AI 背后的文本到图像模型,于 2022 年 8 月发布。

Stable Diffusion 是人工智能公司 Stability AI 背后的文本到图像模型,于 2022 年 8 月发布。Stability AI 首席执行官 Emad Mostaque 表示,Stable Diffusion 在所有渠道拥有超过 1000 万用户。如果我们推断一下《Midjourney》的数据和趋势,就会发现,通过官方的 Stable Diffusion 渠道,用户每天会生成 200 万张图片,而在发布一年多的时间里,这个数字已经达到了 6.9 亿张图像。 如果加上其他流行模型(例如 Runway,我们单独统计)和 Stability AI 的官方渠道,使用 Stable Diffusion 创建的图像数量将增加到 125.9 亿张,占所有使用文本转文字创建的 AI 图像的 80%。 Adobe Firefly Adobe Adobe 推出了 Firefly,于 2023 年 3 月发布。上线 6 周内,用户创建了超过 1 亿资产。随着 Firefly 于 2023 年 5 月集成到 Adobe Photoshop,考虑到全球使用 Photoshop 的人数,图像数量呈指数级增长。 Adobe 在最新的新闻稿中分享了其 AI 图像统计数据:推出仅 3 个月,使用 Adobe Firefly 创建的图像数量就已达到 10 亿张。 使用 Stable Diffusion、Adobe Firefly、Midjourney 和 DALLE-2 总共生成了超过 150 亿张人工智能创建的图像。这比 Shutterstock 的整个照片、矢量图和插图库还要多,而且是 Instagram 上传的图片数量的三分之一。

封面图片

Stability AI正式发布了DeepFloyd IF图像生成模型,这是一个有文本编码器和三个级联的diffusion模块组

Stability AI正式发布了DeepFloyd IF图像生成模型,这是一个有文本编码器和三个级联的diffusion模块组合的模型。 这个模型的效率要比原有的satble diffusion效率要高很多。 我尝试了一下,看起来效果也比SD2.0强一些。 划重点,这个模型是认字的生成出来的英文非常工整。 文章链接: 可以在这里体验模型: Github: 模型网站:

封面图片

英伟达推出RTX 500/1000 Ada AI显卡 适用于笔记本电脑和工作站

英伟达推出RTX 500/1000 Ada AI显卡 适用于笔记本电脑和工作站 这些显卡基于 Ada Lovelace 架构,共有这些型号:RTX 500、RTX 1000、RTX 2000、RTX 3000、RTX 3500、RTX 4000 和 RTX 5000。AI 处理能力:这些新显卡的亮点之一包括全部配备了神经网络计算单元,内置适用于 AI 处理的张量核心,其中 NPU 主要负责处理轻型 AI 任务,而 GPU 芯片将为要求更高的 AI 工作流提供额外的 AI 性能。消费级和入门工作站:本次推出的新显卡中,RTX 500 和 RTX 1000 是面向消费者设备和入门工作站的,其中 RTX 500 的 TOPS 为 154、RTX 1000 则为 193。英伟达称与纯粹使用 CPU 相比,RTX 500 可以为稳定扩散等模型提供 14 倍的生成式 AI 性能,利用 AI 进行照片编辑的速度提高 3 倍,3D 渲染性能提高 10 倍。如果用户希望利用 AI 实现高级渲染、数据科学和深度学习,则可以考虑 RTX 2000~5000 系列,这些显卡提供更强大的性能。英伟达总结的 RTX 500/1000 亮点:第三代 RT 核心:光追性能达到上一代的 2 倍,可以实现高保真、逼真的渲染第四代 Tensor Core:吞吐量是上一代的 2 倍,加速深度学习训练、推理和基于 AI 的创意工作负载Ada 通用 CUDA 内核:与上一代相比,FP32 吞吐量提高 30%,显著提高了图形和计算工作负载的性能专用 GPU 显存:RTX 500 配备 4GB 显存,RTX 1000 配备 6GB 显存,让用户可以运行要求更严格的 3D 和基于 AI 的应用程序DLSS 3:通过生成额外的高质量帧提高性能AV1 编码器:支持 AV1 编码器搭载 RTX 500 和 RTX 1000 的笔记本电脑 GPU 将在今年春季上市,到时候戴尔、惠普、联想和 MSI 等会推出搭载这些显卡的新设备。 ... PC版: 手机版:

封面图片

Stability AI 发布用于生成声音和歌曲的开放式AI模型

Stability AI 发布用于生成声音和歌曲的开放式AI模型 该模型使用来自免费音乐库 FreeSound 和免费音乐档案馆的约 486,000 个样本进行训练。Stability AI 公司称,该模型可用于为视频、电影和电视节目创建鼓点、乐器旋律、环境噪音和"制作元素",也可用于"编辑"现有歌曲或将一首歌的风格(如流畅爵士乐)应用到另一首歌中。Stability AI公司在其公司博客上发表的一篇文章中写道:"此次开源发布的一个主要好处是,用户可以根据自己的自定义音频数据对模型进行微调。例如,鼓手可以在自己的鼓声录音样本上进行微调,生成新的节拍。"不过,Stable Audio Open 也有其局限性。它不能生成完整的歌曲、旋律或人声,至少不能生成好的歌曲、旋律或人声。Stability AI 表示,它并没有为此进行优化,并建议希望获得这些功能的用户选择该公司的高级 Stable Audio 服务。Stable Audio Open 也不能用于商业用途,其服务条款禁止这样做。此外,它在不同音乐风格和文化或英语以外的语言描述中的表现也不尽相同,Stability AI 将这些偏差归咎于训练数据。"数据源可能缺乏多样性,所有文化在数据集中都不具有同等代表性,"Stability AI 公司在对模型的描述中写道。"模型生成的样本将反映训练数据的偏差"。稳定人工智能公司(Stability AI)长期以来一直在努力扭转业务颓势,最近,该公司负责生成音频的副总裁埃德-牛顿-雷克斯(Ed Newton-Rex)因不同意该公司关于在受版权保护的作品上训练生成人工智能模型构成"合理使用"的立场而辞职,从而引发争议。Stable Audio Open 似乎试图扭转这种说法,同时不着痕迹地宣传 Stability AI 的付费产品。随着包括 Stability 音乐生成器在内的音乐生成器越来越受欢迎,版权以及一些生成器创建者可能滥用版权的方式正成为人们关注的焦点。5 月,代表比利-乔尔(Billy Joel)、Doja Cat 和 Lil Nas X 等艺术家的索尼音乐公司致函700 家人工智能公司,警告不要"未经授权使用"其内容来训练音频生成器。今年 3 月,美国田纳西州签署了第一部旨在遏制人工智能在音乐领域滥用的法律。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人