是一个开放获取的数据集合,旨在填补自然语言处理中的语言差距,包括一个由人工策划的涵盖65种语言的指令遵循数据集,以及一个跨越11

None

相关推荐

封面图片

:一个513M参数的多语种语言模型,能理解和遵循101种语言的指令。Aya数据集是迄今为止最全面的多语种指令微调数据集,包含11

封面图片

ℹGoogle发表「全能」AI游戏助理SIMA:能跨越不同适应3D环境理解自然语言指令,协助完成任务#Google的AI

封面图片

:赋予大型预训练语言模型遵循复杂指令的能力遵循指令的能力对大部分开源大语言模型来说是一个独特的挑战。该项目提出的解决方案是使用LLM本身来生成指令数据。研究人员开发的Evol-Instruct方法随机选择不同类型的进化操作来将简单指令升级为更复杂的指令,或者创建全新的指令。然后使用进化的指令数据来微调LLM,从而创建WizardLM。

封面图片

:一个可以将人类自然语言转换为SQL语言的开源工具,反之亦然,用起来很方便。通过AI赋能,让它可以很轻松的完成自然语言与SQL语言的切换,进一步提升数据处理效率。

封面图片

科研论文问答数据集,包括5049个问题,超过1585篇自然语言处理论文#科研#数据集

封面图片

:一个Python库,用于创建和处理自然语言处理(NLP)数据集,以便训练大型语言模型(LLM)。该库包含一些可扩展的模块,允许

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人