MAmmoTH:专门为解决通用数学问题而定制的开源大语言模型。
MAmmoTH:专门为解决通用数学问题而定制的开源大语言模型。MAmmoTH模型结合了CoT和PoT两种思维方式,使其能够更全面地解决各种数学问题(从基础算术到高等数学)。在九个数学推理数据集上显著超越了现有的开源模型,平均准确率提高了13%到29%。MAmmoTH在一个精心策划的指导调优数据集MathInstruct上进行训练,MathInstruct从13个带有中间理由的数学数据集中编译而来,其中六个是由作者新策划的。MAmmoTH基于LLaMa2和CodeLlama训练的数学领域的开源LLM,有7B、13B、34B、70B四个版本。MAmmoTH的工作原理是通过混合指导调优方法,结合两种不同的思维方式,训练模型来解决各种数学问题。这种方法确保了模型在各种数学领域都有很好的表现,并且在实际应用中也取得了显著的性能提升。