toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,291个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

VeraRetouch:0.6B参数AI修图模型,手机端侧部署新方案

2026/06/14
·toolin小编

vivo联合浙大发布VeraRetouch轻量修图框架,基于0.6B视觉语言模型,支持自动修图、风格修图和参数修图,iPhone端13秒完成处理

VeraRetouch:0.6B参数AI修图模型,手机端侧部署新方案
VeraRetouch:0.6B参数AI修图模型,手机端侧部署新方案
2026/06/14

VeraRetouch:0.6B参数AI修图模型,手机端侧部署新方案

vivo联合浙大发布VeraRetouch轻量修图框架,基于0.6B视觉语言模型,支持自动修图、风格修图和参数修图,iPhone端13秒完成处理

核心问题:为什么需要一个新的修图框架三种修图模式Auto-Retouch(自动修图)Style-Retouch(风格修图)Param-Retouch(参数修图)技术架构修图空间三维拆解端到端可微分DAPO-AE 后训练策略数据集:AetherRetouch-1M+实测表现质量指标速度对比用户研究实用信息适用场景
AI产品

VeraRetouch 是 vivo BlueImage Lab 联合浙江大学、之江实验室发布的一个轻量级 AI 修图框架。它用 0.6B 参数的视觉语言模型(VLM)作为"修图大脑",配合全可微分的 Retouch Renderer 作为"修图执行器",能在手机端侧完成专业级的色调与色彩优化。总参数仅约 0.63B,远小于 Flux.1 Kontext 等主流方案。

核心问题:为什么需要一个新的修图框架

现有 AI 修图方案存在几个关键痛点:

  • 专业修图工具操作复杂,一键滤镜又风格生硬
  • 推理式修图引入的大模型太重,不适合移动端部署
  • 外部修图软件不可微分,模型参数无法通过端到端训练直接优化

VeraRetouch 的关键创新在于:不再把专业修图工具当作外部黑盒,而是用一个全可微分的 Retouch Renderer 替代传统调色与调光操作。

VeraRetouch框架示意

VeraRetouch将0.6B VLM作为"修图大脑",Retouch Renderer作为"修图执行器"。

三种修图模式

VeraRetouch 定义了三类修图任务,覆盖从"一键优化"到"精准控制"的完整需求:

Auto-Retouch(自动修图)

用户只需输入一张照片,模型自动分析画面中的光影和色彩问题并生成修图方案。目标不是套滤镜,而是在保留原图内容的基础上提升整体观感。

Style-Retouch(风格修图)

用户可以用自然语言描述想要的风格,比如"温暖秋日感"、"冷调日系透明感"、"暗调情绪胶片风"。模型结合图像内容和文本意图,推理出具体调色方向。

Param-Retouch(参数修图)

模型根据明确的参数指令进行修图,例如对比度、曝光、色温、饱和度等。强调调整结果的可控性和可复现性。

技术架构

修图空间三维拆解

研究团队将修图空间拆解为三个相对独立的控制维度:

  • Lighting:曝光、阴影、高光等光照相关调整
  • Global Color:色温、色调、整体颜色倾向等全局色彩调整
  • Specific Color:针对红色、橙色、蓝色等特定颜色通道的精细调整

这种拆解与专业修图流程高度一致,让模型输出更可解释、更稳定。

端到端可微分

模型最后一层 hidden state 被送入 MLP Retouch Adaptor,对齐到 Retouch Renderer 可理解的连续控制 latent。整个修图过程在模型内部完成,支持端到端像素级训练。

DAPO-AE 后训练策略

通过格式奖励、图像相似性奖励和审美奖励,引导模型在保持指令一致性的同时生成更自然的修图结果。

数据集:AetherRetouch-1M+

为解决专业修图数据稀缺的问题,研究团队构建了百万级多任务专业修图数据集:

  • 自动修图:采用"反向退化"思路,从高质量照片出发,反向生成"未修图"版本
  • 风格修图:整理 5030 个在线风格预设,覆盖 11 个大类和 193 个细分子类
  • 参数修图:围绕三类操作随机采样参数组合生成训练数据

实测表现

质量指标

任务指标VeraRetouchvs. Flux.1 Kontext
Auto-Retouch (FiveK-Bench)PSNR26.85 dB+1.08 dB
Param-RetouchPSNR30.18 dB明显超过
Style-Retouch (Aether-Bench)PSNR/SSIM/LPIPS多项最优领先

速度对比

平台VeraRetouchFlux.1 KontextJarvisArt
H20 GPU (512p)6.90s16.78s14.31s
MacBook Air M4约 7.46s--
iPhone 16 Pro约 13.56s--

VeraRetouch修图效果对比

在FiveK-Bench上VeraRetouch-DAPO-AE达到26.85 dB PSNR,多项指标领先。

VeraRetouch风格修图效果

风格修图任务中,VeraRetouch在多项指标上取得最优表现。

用户研究

38 名参与者盲评结果显示,VeraRetouch 在视觉美感、指令一致性和纹理保持方面均获得最高评分。DAPO-AE 后训练带来 61.62% 的偏好率。

实用信息

  • 论文链接:https://arxiv.org/pdf/2604.27375
  • 项目主页:https://apollo-yi.github.io/VeraRetouch/
  • 代码链接:https://github.com/OpenVeraTeam/VeraRetouch
  • 总参数:约 0.63B
  • 适用平台:移动端侧部署(iPhone、MacBook 等)

适用场景

  • 手机厂商:集成端侧 AI 修图能力
  • 摄影 App 开发者:轻量级修图 SDK
  • 个人开发者:本地部署 AI 修图工具,无需云端调用
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
核心问题:为什么需要一个新的修图框架三种修图模式Auto-Retouch(自动修图)Style-Retouch(风格修图)Param-Retouch(参数修图)技术架构修图空间三维拆解端到端可微分DAPO-AE 后训练策略数据集:AetherRetouch-1M+实测表现质量指标速度对比用户研究实用信息适用场景

相关文章

Codex /goal 自主任务调度完全指南
AI教程

Codex /goal 自主任务调度完全指南

用一句意图让 Codex 自主拆解任务、派生子智能体、18小时完成14个功能开发,附配置教程与避坑指南

avatar for toolin小编
toolin小编
1天前
AgentDoG 1.5:开源的 AI Agent 安全诊断与护栏框架
AI产品

AgentDoG 1.5:开源的 AI Agent 安全诊断与护栏框架

上海AI实验室开源的轻量级 Agent 安全工具,用三维诊断分析执行轨迹风险,支持在线护栏部署

avatar for toolin小编
toolin小编
1天前
一行代码复活Fable 5:系统提示词注入实操与原理解析
AI教程

一行代码复活Fable 5:系统提示词注入实操与原理解析

通过泄露的Fable 5系统级Prompt和--system-prompt-file参数,在Opus 4.8上注入Fable 5的'人格底稿',实现相近的输出效果

avatar for toolin小编
toolin小编
3天前