MetaAI 开源 ImageBind,可让模型跨 6 种不同的模态(图像、文本、音频、深度、热能和 IMU 数据)进行联动
MetaAI开源ImageBind,可让模型跨6种不同的模态(图像、文本、音频、深度、热能和IMU数据)进行联动借助ImageBind,则可以做到直接通过声音来直接生成图像。这使得AI能够更加深入了解人类情感,理解他们的喜怒哀乐,进而为人类提供更好的服务。当你举起手机,录制一个海边日落的视频时,AI便能自动根据视频内容来生成文案和字幕,并匹配上合适的背景音乐。至AI还有可能通过一首歌,直接为歌手生成一段视频MV。此举将为AIGC技术带来更为广泛的应用场景,一大波更为有趣、实用的AI项目也即将来袭。#AI来源,https://github.com/facebookresearch/ImageBind来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot