并线性层量化功能;该框架能正在连结视频质量的前提下,TurboDiffusion 为实现极致的推理速度,将端到端扩散生成的推理速度提拔 100 至 200 倍。大学 TSAIL 尝试室结合生数科技推出开源视频生成加快框架 TurboDiffusion,
这些手艺方案的深度融合,采用了 SageAttention 和 SLA(稀少线性留意力机制)来加快留意力计较,让模子正在连结生成结果分歧性的根本上,团队引入了 rCM(时间步蒸馏)手艺,IT之家 12 月 25 日动静,则保举利用非量化版本以获得最佳结果。无效削减了扩散模子的采样步数。![]()
针对 RTX 5090、RTX 4090 等显存无限的消费级显卡,团队供给了量化版(Quantized)权沉,而对于具有 80GB 以上显存的 H100 等工业级显卡,显著降低了模子处置高分辩率视频时的算力开销。
*请认真填写需求信息,我们会在24小时内与您取得联系。