None
:开源的视觉-语言(VL)模型,旨在实现真实世界的视觉语言理解。 它具有广泛的多模态理解能力,能够处理逻辑图表、网页、公式识别、科学文献、自然图像和复杂场景中的具体智能等。 DeepSeek-VL提供了多个模型版本,包括不同规模和功能的模型,以满足不同的研究和商业应用需求。
是一个对比学习工具包,使研究人员和工程师能够有效地训练和评估对比模型。 特征: 建立在Flash Attention之上,可实现快速高效的训练 支持在多个 GPU 上进行训练 GradCache支持在受限内存环境中进行大批量训练 Huggingface 支持轻松加载常见模型(Pythia/GPTNeoX、BERT 等) 掩码语言建模 (MLM) 预训练
🔍 发送关键词来寻找群组、频道或视频。