Diffusion Turbo 3:把四步出图压到了一步
新调度器配上蒸馏,单步出图已经肉眼可用。跑了一组对比,记几个真正有用的点。
昨晚把 Diffusion Turbo 3 的权重拉下来跑了一整夜。结论先放这儿:单步出图,第一次让我觉得”可以直接用”,而不是”勉强能看”。
快在哪
核心是把对抗蒸馏和新的调度器绑在一起。以前 4 步能稳的画面,现在 1 步就能出个八九成,再补一步做细节,整体比上一代快了将近三倍。
- 1 步:构图、配色、光影基本到位
- 2 步:手、文字、边缘这些老大难开始收敛
- 4 步以后:边际收益肉眼几乎看不出来了
几个坑
- CFG 要往下压。沿用旧参数会糊成一团,我这边 1.5 左右最稳。
- LoRA 兼容性一般,旧的风格 LoRA 直接挂上去会偏色,得重训或降权重。
- 显存占用比宣传的高,24G 跑批量到 4 张就比较吃紧了。
真正的提速不是把步数砍短,而是让每一步都不浪费。
短期内我会把它接进现有工作流的”草图”环节——快速出二十张挑构图,再丢给慢模型精修。这条流水线我整理好了会单开一篇。