DeepSeek-V2 这个模型确实很强,尝试了一下我日常的任务都能胜任。
DeepSeek-V2这个模型确实很强,尝试了一下我日常的任务都能胜任。主要是太便宜了,开放平台送的十块钱总共有500万Token。冲个五十块钱估计够我用好几年。模型为MOE架构总参数236B激活参数21B,开源版本上下文128K,API上下文32K。在8卡H800机器上,输出吞吐量超过每秒5万Token。模型权重下载:https://huggingface.co/deepseek-ai
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人