视觉、语音、文本的高效自监督学习 |导语:人工智能最近的许多突破都是由自我监督学习推动的,它使机器能够在不依赖标记数据的情况下进
视觉、语音、文本的高效自监督学习 |导语:人工智能最近的许多突破都是由自我监督学习推动的,它使机器能够在不依赖标记数据的情况下进行学习。但是当前的算法有几个明显的局限性,通常包括专门用于单一模态(例如图像或文本)并且需要大量的计算能力。这与人类学习形成鲜明对比:人们似乎比当前的 AI 学习效率更高,并且还以类似的方式从不同类型的信息中学习,而不是依赖于文本、语音和其他模式的单独学习机制。 今年早些时候,当我们发布 data2vec 时,Meta AI 解决了其中一个限制, data2vec 是第一个以相同方式学习三种不同模式(语音、视觉和文本)的高性能自监督算法。Data2vec 使得将文本理解等方面的研究进展应用于图像分割或语音翻译任务变得更加容易。 今天,我们将分享 data2vec 2.0,这是一种新算法,它的效率大大提高,并且性能优于其前身的强大性能。它实现了与最流行的现有计算机视觉自监督算法相同的精度,但速度提高了 16 倍。
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人