Meta发布LLAMA 3.1 405B开源AI模型,纸面数据超越GPT4o,但不如Claude3.5sonnet
Meta发布LLAMA3.1405B开源AI模型,纸面数据超越GPT4o,但不如Claude3.5sonnet支持多语言和工具调用,性能媲美GPT-4-模型能够识别图像和视频,并支持通过语音进行交互,但这些功能仍在开发中,尚未准备好发布。-训练数据高达15.6Ttokens,使用了超过16,000个H100GPU-405B模型能在单个服务器节点上运行-405B模型训练好后,继续用405B模型提升了8B和70B的质量,所以可以预见Llama3.1中8B和70B会有更好表现-大多数的监督微调(SFT)示例都是使用合成数据生成的关注频道@ZaiHuaPd投稿爆料@ZaiHuabot
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人