toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,107个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

Diffusion Templates:像搭积木一样控制图像生成

2026/05/17
·toolin小编

魔搭开源Diffusion Templates框架和11个现成模板,支持亮度、风格、修图、超分辨率等即插即用控制,大幅降低可控生成门槛。

Diffusion Templates:像搭积木一样控制图像生成
Diffusion Templates:像搭积木一样控制图像生成
2026/05/17

Diffusion Templates:像搭积木一样控制图像生成

魔搭开源Diffusion Templates框架和11个现成模板,支持亮度、风格、修图、超分辨率等即插即用控制,大幅降低可控生成门槛。

Diffusion Templates 是什么框架结构11 个开源模板一览模板叠加效果展示相关资源适用人群
AI产品

扩散模型生态繁荣的背后,一个头疼的问题一直存在:模型生态太"碎"了。好不容易跑通一个新模型,想加个控制功能,代码结构完全不兼容;想叠加多个控制条件,插件之间在底层打架。Diffusion Templates 就是来统一这个乱局的。

它是一个专为扩散模型设计的插件框架,让 ControlNet、LoRA、IP-Adapter 这些工具能像搭积木一样自由组合,而且互不冲突。

Diffusion Templates 是什么

Diffusion Templates 是一套完善的扩散模型插件框架。每一个插件被称为 Template(模板),它可以引导基础模型生成特定的画面内容。框架的核心设计是 Template Cache -- 模型能力的媒介格式(如 KV-Cache),Template 通过它将控制信息传递给基础模型。

目前代码已在 DiffSynth-Studio 项目下完全开源,同时开源了 11 个基于 FLUX.2-klein-base-4B 训练的 Template 模型。

项目地址:https://github.com/modelscope/DiffSynth-Studio

框架结构

框架包含四个模块:

  • Template Input:模型的输入,字段由每个 Template 自身决定,给开发者最大自由度
  • Template Model:模板模型,可从魔搭模型库或本地路径加载
  • Template Cache:模型输出,也是基础模型 Pipeline 的输入参数子集
  • Template Pipeline:调度多个 Template 模型的模块,负责加载和整合输出

11 个开源模板一览

以下模板基于 FLUX.2-klein-base-4B 训练,与该模型的 LoRA 和微调版本兼容:

模板功能模型链接
亮度调节精准控制画面光照强度Template-KleinBase4B-Brightness
结构控制类 ControlNet,控制空间结构和透视关系Template-KleinBase4B-ControlNet
超分辨率低分辨率图升级为高清大图Template-KleinBase4B-Upscaler
锐利激发提升画面锐利度和清晰度Template-KleinBase4B-Sharpness
图像编辑基于自然语言指令精准修改图像Template-KleinBase4B-Edit
美学对齐调整美学参数,让生成结果更符合人类审美Template-KleinBase4B-Aesthetic
局部重绘仅在遮罩区域内重新生成内容Template-KleinBase4B-Inpaint
年龄控制生成人像时灵活控制人物年龄Template-KleinBase4B-Age
色调调节自由调整画面色调与色彩氛围Template-KleinBase4B-SoftRGB
内容参考参考输入图像的风格和构图生成新画面Template-KleinBase4B-ContentRef
魔性熊猫生成各种魔性十足的熊猫头表情包Template-KleinBase4B-PandaMeme

模板叠加效果展示

Template 最大的优势是可以像搭积木一样自由叠加。比如对同一张猫的照片:

  • Template 1(图像编辑):把画面风格改为二次元动漫
  • Template 2(局部重绘):保持周围环境不变
  • Template 3(亮度调节):适当调高亮度

模板叠加效果

再比如一张模糊的猫,叠加超分辨率和锐利激发两个 Template:

两个以不同目标训练的模型协同渲染,显著提升画面质量。

相关资源

  • 项目主页:https://modelscope.github.io/diffusion-templates-web/
  • 开源代码:https://github.com/modelscope/DiffSynth-Studio
  • 技术报告:https://arxiv.org/abs/2604.24351
  • 模型集(11 个模型):https://modelscope.cn/collections/DiffSynth-Studio/KleinBase4B-Templates
  • 数据集(17 个数据集):https://modelscope.cn/collections/DiffSynth-Studio/ImagePulseV2

适用人群

  • AI 图像创作者:不用再为插件冲突发愁,自由组合控制条件
  • 模型开发者:框架降低了可控生成模型的训练门槛,可以快速开发新的 Template
  • 产品团队:标准化的插件机制让模型集成变得简单可靠
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
Diffusion Templates 是什么框架结构11 个开源模板一览模板叠加效果展示相关资源适用人群

相关文章

Codex免费两个月 vs Claude Code额度翻倍,AI编程工具怎么选
AI产品

Codex免费两个月 vs Claude Code额度翻倍,AI编程工具怎么选

OpenAI和Anthropic正面对决:Codex企业用户免费2个月含一键迁移工具,Claude Code周额度提升50%。开发者成了最大赢家。

avatar for toolin小编
toolin小编
3天前
Codex进手机:随时随地指挥AI写代码
AI产品

Codex进手机:随时随地指挥AI写代码

OpenAI Codex进入ChatGPT手机App,支持iOS和Android全量用户,开发者可随时随地审批命令、跨设备控制多台电脑。

avatar for toolin小编
toolin小编
1天前
OpenCLI:把全网变成命令行的开源神器
AI产品

OpenCLI:把全网变成命令行的开源神器

GitHub 20k星的开源项目OpenCLI,将100+网站、微信、飞书等私域数据转为命令行操作,本地浏览器执行零Token消耗。

avatar for toolin小编
toolin小编
1天前