VeraRetouch：0.6B参数AI修图模型，手机端侧部署新方案 | Toolin AI

提交AI工具提交

VeraRetouch 是 vivo BlueImage Lab 联合浙江大学、之江实验室发布的一个轻量级 AI 修图框架。它用 0.6B 参数的视觉语言模型（VLM）作为"修图大脑"，配合全可微分的 Retouch Renderer 作为"修图执行器"，能在手机端侧完成专业级的色调与色彩优化。总参数仅约 0.63B，远小于 Flux.1 Kontext 等主流方案。

核心问题：为什么需要一个新的修图框架

现有 AI 修图方案存在几个关键痛点：

专业修图工具操作复杂，一键滤镜又风格生硬
推理式修图引入的大模型太重，不适合移动端部署
外部修图软件不可微分，模型参数无法通过端到端训练直接优化

VeraRetouch 的关键创新在于：不再把专业修图工具当作外部黑盒，而是用一个全可微分的 Retouch Renderer 替代传统调色与调光操作。

VeraRetouch框架示意

VeraRetouch将0.6B VLM作为"修图大脑"，Retouch Renderer作为"修图执行器"。

三种修图模式

VeraRetouch 定义了三类修图任务，覆盖从"一键优化"到"精准控制"的完整需求：

Auto-Retouch（自动修图）

用户只需输入一张照片，模型自动分析画面中的光影和色彩问题并生成修图方案。目标不是套滤镜，而是在保留原图内容的基础上提升整体观感。

Style-Retouch（风格修图）

用户可以用自然语言描述想要的风格，比如"温暖秋日感"、"冷调日系透明感"、"暗调情绪胶片风"。模型结合图像内容和文本意图，推理出具体调色方向。

Param-Retouch（参数修图）

模型根据明确的参数指令进行修图，例如对比度、曝光、色温、饱和度等。强调调整结果的可控性和可复现性。

技术架构

修图空间三维拆解

研究团队将修图空间拆解为三个相对独立的控制维度：

Lighting：曝光、阴影、高光等光照相关调整
Global Color：色温、色调、整体颜色倾向等全局色彩调整
Specific Color：针对红色、橙色、蓝色等特定颜色通道的精细调整

这种拆解与专业修图流程高度一致，让模型输出更可解释、更稳定。

端到端可微分

模型最后一层 hidden state 被送入 MLP Retouch Adaptor，对齐到 Retouch Renderer 可理解的连续控制 latent。整个修图过程在模型内部完成，支持端到端像素级训练。

DAPO-AE 后训练策略

通过格式奖励、图像相似性奖励和审美奖励，引导模型在保持指令一致性的同时生成更自然的修图结果。

数据集：AetherRetouch-1M+

为解决专业修图数据稀缺的问题，研究团队构建了百万级多任务专业修图数据集：

自动修图：采用"反向退化"思路，从高质量照片出发，反向生成"未修图"版本
风格修图：整理 5030 个在线风格预设，覆盖 11 个大类和 193 个细分子类
参数修图：围绕三类操作随机采样参数组合生成训练数据

实测表现

质量指标

任务	指标	VeraRetouch	vs. Flux.1 Kontext
Auto-Retouch (FiveK-Bench)	PSNR	26.85 dB	+1.08 dB
Param-Retouch	PSNR	30.18 dB	明显超过
Style-Retouch (Aether-Bench)	PSNR/SSIM/LPIPS	多项最优	领先

速度对比

平台	VeraRetouch	Flux.1 Kontext	JarvisArt
H20 GPU (512p)	6.90s	16.78s	14.31s
MacBook Air M4	约 7.46s	-	-
iPhone 16 Pro	约 13.56s	-	-

VeraRetouch修图效果对比

在FiveK-Bench上VeraRetouch-DAPO-AE达到26.85 dB PSNR，多项指标领先。

VeraRetouch风格修图效果

风格修图任务中，VeraRetouch在多项指标上取得最优表现。

用户研究

38 名参与者盲评结果显示，VeraRetouch 在视觉美感、指令一致性和纹理保持方面均获得最高评分。DAPO-AE 后训练带来 61.62% 的偏好率。

实用信息

论文链接：https://arxiv.org/pdf/2604.27375
项目主页：https://apollo-yi.github.io/VeraRetouch/
代码链接：https://github.com/OpenVeraTeam/VeraRetouch
总参数：约 0.63B
适用平台：移动端侧部署（iPhone、MacBook 等）

适用场景

手机厂商：集成端侧 AI 修图能力
摄影 App 开发者：轻量级修图 SDK
个人开发者：本地部署 AI 修图工具，无需云端调用