微软开源的一个文本编码器Glyph-ByT5-v2。
微软开源的一个文本编码器Glyph-ByT5-v2。 支持使用十多种语言生成图片。 还搭配了一个使用这个文本编码器的 SDXL 模型,可以直接生成中文海报和内容。 从演示来看排版都挺好的。 1) 创建了一个高质量的多语言字形文本和图形设计数据集,包含超过100万个字形文本对和1000万个图形设计图像文本对,覆盖另外九种语言; 2) 构建了一个多语言视觉段落基准数据集,包括1000个提示,每种语言100个,用于评估多语言视觉拼写准确性; 3) 采用最新的步进感知偏好学习方法,提高了视觉美学质量。 模型下载:
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人