上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。从结果来看，大模型的语文

上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发

上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分，此次高考测试结果显示，阿里通义千问2-72B排名第一，为303分，OpenAI的GPT-4o排名第二，得分296分，上海人工智能实验室的书生・浦语2.0排名第三，三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。从结果来看，大模型的语文、英语考试水平普遍不错，但数学都不及格，最高分也只有75分。（第一财经）

上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术人工智能实验室司南大模型评测产品负责人葛佳烨表示，大语言模型评

上海人工智能实验室发布自动驾驶视频生成模型 GenAD

上海人工智能实验室发布自动驾驶视频生成模型GenAD上海人工智能实验室3月20日发文宣布，近日，该实验室联合香港科技大学、德国图宾根大学、香港大学推出大规模自动驾驶视频生成模型GenAD，通过预测和模拟真实世界场景，为自动驾驶技术的研究和应用提供支撑。视频生成模型GenAD进一步拓宽了自动驾驶技术的研究路径。结合此前推出的端到端自动驾驶模型UniAD、“语言+自动驾驶”全栈数据集DriveLM，上海人工智能实验室从多个技术维度对自动驾驶技术进行探索，从而多方位提升其智能性。同时，联合团队构建了包含1747小时驾驶视频的数据集OpenDV-YouTube，现已开源。

上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。从结果来看，大模型的语文

相关推荐

上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发

上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术人工智能实验室司南大模型评测产品负责人葛佳烨表示，大语言模型评

上海人工智能实验室发布自动驾驶视频生成模型 GenAD

上海人工智能实验室联合多家机构发布种业大语言模型“丰登”4月28日，人工智能实验室联合崖州湾国家实验室和中国农业大学发布首个

上海人工智能实验室发布多模态语料

崖州湾国家实验室精准设计与智造团队与中国农业大学、上海人工智能实验室28日共同发布首个种业大语言模型“丰登”。该模型集成了人工智