用于评估和理解大型语言模型的统一评估框架,提供了用户友好的API,方便研究人员进行模型性能评估、提示工程和对抗提示攻击评估等。#

None

相关推荐

封面图片

开源的基础模型能力评测框架,提供了一套轻量级、易于使用的评测体系,支持主流大模型的性能评估。

开源的基础模型能力评测框架,提供了一套轻量级、易于使用的评测体系,支持主流大模型的性能评估。其主要特点如下:轻量易用的评估框架:无缝设计,界面直观,依赖性极小,部署轻松,可扩展性极佳,适应多样化评估场景。评估方式灵活多样:支持统一提示模板,评估指标丰富,可个性化定制,满足特定需求。高效、快速的推理部署:支持torch、vLLM等多种模型部署策略,实现多实例部署,实现快速评估流程。公开透明的开源排行榜:维护开放、可追溯、可复制的评估排行榜,由社区更新驱动,以确保透明度和可信度。官方权威评测数据:采用广泛认可的官方评测集,确保评测的公平性和标准化,确保结果具有可比性和可重复性。全面而广泛的模型支持:为广泛的模型提供支持,包括来自Huggingface开源存储库的模型和个人训练的模型,确保全面的覆盖范围。#框架

封面图片

:用于实现大语言模型的综合库,提供统一的训练流程和全面的模型评估

封面图片

:大型语言模型评估套件,提供动态数据和实时更新的基准测试,旨在高效、准确地评估语言模型的性能,同时降低成本和时间消耗

封面图片

机器学习统一框架,支持JAX、TensorFlow、PyTorch和Numpy等框架,快速构建模型,并在后台使用你喜欢的框架#机器学习#框架

封面图片

是一个框架,用于更轻松地设计、管理、共享和使用提示和提示方法#框架

封面图片

基于MLX的强化学习框架,利用AppleM系列芯片的统一内存功能来增强强化学习算法的性能和效率。#框架

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人