华科大发布AI大模型猴子:部分超越GPT-4
华科大发布AI大模型猴子:部分超越GPT-4官方介绍称,在18个数据集上的实验中,华科大Monkey模型表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的LLAVA、Google的PALM-E、阿里的Mplug-owl等。此外,Monkey在文本密集的问答任务中显示出显著的优势,甚至在某些样本上超越了业界公认的领先者GPT-4V。Monkey的一个显著特点是其出色的“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。另一亮点是能够处理分辨率高达1344x896像素的图像,这是目前其他多模态大模型所能处理的最大尺寸的6倍。据悉,目前业内能处理的图片最大分辨率为448×448像素。值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。...PC版:https://www.cnbeta.com.tw/articles/soft/1403903.htm手机版:https://m.cnbeta.com.tw/view/1403903.htm
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人