利用 Meta 的 ImageBind 训练出来的多模态模型。
利用 Meta 的 ImageBind 训练出来的多模态模型。
只使用了 文本-图像 数据进行微调就获得了很好的多模态效果。
Yixuan Su: We are super excited to share PandaGPT, the first foundation model capable of instruction-following data across six modalities, without the need of explicit supervision. [1/n]
Project Page:
Demo:
Code: