用于评估大型语言模型(LLM)Agent在多步多模态任务中的工具使能力的基准数据集,包含超过4000个多步多模态任务,这些任务涉

None

相关推荐

封面图片

多模态语言模型基准测试生成器,为用户需求定制基准测试,评估大型多模态语言模型(MLM)的感知能力#生成器

封面图片

:一个用于评估大型多模态模型的平台

封面图片

:基于大型语言模型(LLM)和帧卷积技术的视频问答助手,旨在提供多模态数据融合和无限数据生成的能力

封面图片

一个关于多模态大语言模型资料收集的项目,包括数据集、多模态指令调整、多模态上下文学习、多模态思维链、LLM辅助视觉推理、基础模型等

封面图片

:LLM(大型语言模型)可信度研究,包括对LLM可信度不同维度的原则制定、建立了六个维度的基准评估,涵盖了真实性、安全性、公平性

封面图片

:支持使用多个agent来开发LLM应用的框架,这些agent可以相互对话以解决复杂任务#框架

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人