Intel® Extension for Transformers 是一种创新工具包,可在英特尔平台上加速基于 Transfor
Intel® Extension for Transformers 是一种创新工具包,可在英特尔平台上加速基于 Transformer 的模型,尤其适用于第 4 代英特尔至强可扩展处理器 Sapphire Rapids(代号为 Sapphire Rapids)。 该工具包提供以下主要功能和示例: 通过扩展Hugging Face transformersAPI 和利用英特尔® Neural Compressor,在基于 Transformer 的模型上进行模型压缩的无缝用户体验 高级软件优化和独特的压缩感知运行时(与 NeurIPS 2022 的论文Fast Distilbert on CPUs and QuaLA-MiniLM: a Quantized Length Adaptive MiniLM和 NeurIPS 2021 的论文Prune Once for All: Sparse Pre-Trained Language Models 一起发布) 优化的基于 Transformer 的模型包,例如Stable Diffusion、GPT-J-6B、GPT-NEOX、BLOOM-176B、T5、Flan-T5和端到端工作流程,例如基于 SetFit 的文本分类和文档级情感分析( DLSA) NeuralChat ,一个定制的聊天机器人,通过对领域知识的参数高效微调PEFT在 Intel CPU 上训练 | #工具
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人