GPT-4 有 1.8 万亿参数
GPT-4有1.8万亿参数OpenAI今年初公布的新一代大模型GPT-4的技术细节泄露,它有1.8万亿个参数,利用了16个混合专家模型(mixtureofexperts),每个有1110亿个参数,每次前向传递路由经过两个专家模型。它有550亿个共享注意力参数,使用了包含13万亿tokens的数据集训练,tokens不是唯一的,根据迭代次数计算为更多的tokens。GPT-4预训练阶段的上下文长度为8k,32k版本是对8k微调的结果。如果是在云端进行训练,以每A100小时1美元计算,那么一次的训练成本就高达6300万美元。不过今天的训练成本能降至2150万美元。来源,来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人