魔搭开源Diffusion Templates框架和11个现成模板,支持亮度、风格、修图、超分辨率等即插即用控制,大幅降低可控生成门槛。


魔搭开源Diffusion Templates框架和11个现成模板,支持亮度、风格、修图、超分辨率等即插即用控制,大幅降低可控生成门槛。
扩散模型生态繁荣的背后,一个头疼的问题一直存在:模型生态太"碎"了。好不容易跑通一个新模型,想加个控制功能,代码结构完全不兼容;想叠加多个控制条件,插件之间在底层打架。Diffusion Templates 就是来统一这个乱局的。
它是一个专为扩散模型设计的插件框架,让 ControlNet、LoRA、IP-Adapter 这些工具能像搭积木一样自由组合,而且互不冲突。
Diffusion Templates 是一套完善的扩散模型插件框架。每一个插件被称为 Template(模板),它可以引导基础模型生成特定的画面内容。框架的核心设计是 Template Cache -- 模型能力的媒介格式(如 KV-Cache),Template 通过它将控制信息传递给基础模型。
目前代码已在 DiffSynth-Studio 项目下完全开源,同时开源了 11 个基于 FLUX.2-klein-base-4B 训练的 Template 模型。
项目地址:https://github.com/modelscope/DiffSynth-Studio
框架包含四个模块:
以下模板基于 FLUX.2-klein-base-4B 训练,与该模型的 LoRA 和微调版本兼容:
| 模板 | 功能 | 模型链接 |
|---|---|---|
| 亮度调节 | 精准控制画面光照强度 | Template-KleinBase4B-Brightness |
| 结构控制 | 类 ControlNet,控制空间结构和透视关系 | Template-KleinBase4B-ControlNet |
| 超分辨率 | 低分辨率图升级为高清大图 | Template-KleinBase4B-Upscaler |
| 锐利激发 | 提升画面锐利度和清晰度 | Template-KleinBase4B-Sharpness |
| 图像编辑 | 基于自然语言指令精准修改图像 | Template-KleinBase4B-Edit |
| 美学对齐 | 调整美学参数,让生成结果更符合人类审美 | Template-KleinBase4B-Aesthetic |
| 局部重绘 | 仅在遮罩区域内重新生成内容 | Template-KleinBase4B-Inpaint |
| 年龄控制 | 生成人像时灵活控制人物年龄 | Template-KleinBase4B-Age |
| 色调调节 | 自由调整画面色调与色彩氛围 | Template-KleinBase4B-SoftRGB |
| 内容参考 | 参考输入图像的风格和构图生成新画面 | Template-KleinBase4B-ContentRef |
| 魔性熊猫 | 生成各种魔性十足的熊猫头表情包 | Template-KleinBase4B-PandaMeme |
Template 最大的优势是可以像搭积木一样自由叠加。比如对同一张猫的照片:

再比如一张模糊的猫,叠加超分辨率和锐利激发两个 Template:
两个以不同目标训练的模型协同渲染,显著提升画面质量。

OpenAI和Anthropic正面对决:Codex企业用户免费2个月含一键迁移工具,Claude Code周额度提升50%。开发者成了最大赢家。

OpenAI Codex进入ChatGPT手机App,支持iOS和Android全量用户,开发者可随时随地审批命令、跨设备控制多台电脑。

GitHub 20k星的开源项目OpenCLI,将100+网站、微信、飞书等私域数据转为命令行操作,本地浏览器执行零Token消耗。