Transformer后继有模！MSRA提出全新大模型基础架构：推理速度8倍提升，内存占用减少70%#抽屉IT

Chrome引入省内存/省电模式：减少内存占用

Chrome引入省内存/省电模式：减少内存占用桌面端Chrome浏览器在性能设置页面中，新增了“memorysaver”（省内存）和“batterysaver”（省电）两种模式。目前，Google将该功能称为“highefficiency”（高效）模式。该功能旨在通过打盹非活动标签页，只有在你激活之后才加载页面内容，这样来节省笔记本电脑电池和改善内存使用。PC版：https://www.cnbeta.com/articles/soft/1316577.htm手机版：https://m.cnbeta.com/view/1316577.htm

OpenDiT 一个专门用来加速类似Sora的DiT架构模型推理和训练的项目，GPU 加速高达 80%，内存减少 50%。#ai

OpenDiT一个专门用来加速类似Sora的DiT架构模型推理和训练的项目，GPU加速高达80%，内存减少50%。主要特点有：GPU加速高达80%，内存减少50%，内核优化包括FlashAttention、FusedAdaLN、FusedLayernorm内核。FastSeq：一种新颖的序列并行方法，专为激活大小较大但参数大小较小的类似DiT的工作负载而设计。使用方便，通过一些生产线更改即可获得巨大的性能提升，用户不需要了解分布式训练的实现。支持文本到图像和文本到视频生成的完整流程。项目地址：

Transformer后继有模！MSRA提出全新大模型基础架构：推理速度8倍提升，内存占用减少70%#抽屉IT

相关推荐

Chrome引入省内存/省电模式：减少内存占用

OpenDiT 一个专门用来加速类似Sora的DiT架构模型推理和训练的项目，GPU 加速高达 80%，内存减少 50%。#ai

用KV缓存加速GPT模型的推理过程，用KV(Key-Value)缓存来提高Transformer模型推理的速度

：深度学习领域中键值缓存技术的研究论文集合，专注于Transformer模型解码效率和内存优化，促进模型性能提升和资源优化

SnapVideo一种基于transformer的视频生成模型架构，其训练速度比U-Net快3.31倍（推理速度约快4.5倍）。

面向计算机视觉的Transformer：架构、技巧与提升#计算机视觉