利用Meta的ImageBind训练出来的多模态模型。只使用了文本-图像数据进行微调就获得了很好的多模态效果。https://vxtwitter.com/yixuan

Meta'sSegmentAnythingModelontheCPUhttps://vxtwitter.com/ggerganov/status/1699092329607450880

：用于训练、微调和生成模型推理的框架，包括文本到图像生成、可控图像合成、图像编辑等多种功能

RunwaysGen2文字生成视频效果演示https://vxtwitter.com/nlw/status/1649222856960618498?s=20

由DALL-E人工智能驱动的微软Bing获得了图像生成功能

由DALL-E人工智能驱动的微软Bing获得了图像生成功能微软表示，BingImageCreator将为Bing和具有相同AI能力的MicrosoftEdge预览版带来AI驱动的视觉故事和更新的知识卡片。BingImageCreator被整合到Bing聊天体验中，以创意模式开始启动。输入图片的描述，添加地点或活动等背景，并提供一种艺术风格，将使图片创造者能够生成一个独特的图片。微软表示，它正在与OpenAI合作，以遏制对图像创建器的潜在滥用，它已经实施了保障措施和额外的保护措施，以限制有害或不安全图像的生成。使用Bing图像创建器需要访问Bing预览版或新的MicrosoftEdge体验。并非所有的Bing预览版用户都能立即使用图像创建器，因为微软说它将以分阶段的方式部署。它将在桌面和Bing移动应用中提供给那些已经获得访问权的用户。...PC版：https://www.cnbeta.com.tw/articles/soft/1350535.htm手机版：https://m.cnbeta.com.tw/view/1350535.htm

MetaAI 开源 ImageBind，可让模型跨 6 种不同的模态（图像、文本、音频、深度、热能和 IMU 数据）进行联动

MetaAI开源ImageBind，可让模型跨6种不同的模态（图像、文本、音频、深度、热能和IMU数据）进行联动借助ImageBind，则可以做到直接通过声音来直接生成图像。这使得AI能够更加深入了解人类情感，理解他们的喜怒哀乐，进而为人类提供更好的服务。当你举起手机，录制一个海边日落的视频时，AI便能自动根据视频内容来生成文案和字幕，并匹配上合适的背景音乐。至AI还有可能通过一首歌，直接为歌手生成一段视频MV。此举将为AIGC技术带来更为广泛的应用场景，一大波更为有趣、实用的AI项目也即将来袭。#AI来源，https://github.com/facebookresearch/ImageBind来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

利用Meta的ImageBind训练出来的多模态模型。只使用了文本-图像数据进行微调就获得了很好的多模态效果。https://vxtwitter.com/yixuan_su/status/1661064018868551691

相关推荐

Meta'sSegmentAnythingModelontheCPUhttps://vxtwitter.com/ggerganov/status/1699092329607450880

：用于训练、微调和生成模型推理的框架，包括文本到图像生成、可控图像合成、图像编辑等多种功能

RunwaysGen2文字生成视频效果演示https://vxtwitter.com/nlw/status/1649222856960618498?s=20

由DALL-E人工智能驱动的微软Bing获得了图像生成功能

MetaAI 开源 ImageBind，可让模型跨 6 种不同的模态（图像、文本、音频、深度、热能和 IMU 数据）进行联动

在@Photoshop（测试版）应用程序中引入生成式填充-一种通过简单的文本提示创建非凡图像的全新神奇方式，由#AdobeFirefly提供支持。https://vxtwitter.com/Adobe/status/1660964405893541888