北大团队开源 GenShield,将 AI 生成图像检测与伪影修复统一到一个自回归框架,检测准确率达 98.8%


北大团队开源 GenShield,将 AI 生成图像检测与伪影修复统一到一个自回归框架,检测准确率达 98.8%
随着 AI 生图越来越逼真,"这张图到底是真的还是 AI 生成的"成了一个越来越难回答的问题。更进一步的挑战是:如果 AI 生成的图像有不自然的伪影,能不能不只是标记出来,而是直接修复?北京大学等机构的研究团队提出了 GenShield——一个将检测与修复统一到同一闭环中的开源框架。
GenShield 是一个基于自回归架构的统一框架,把 AI 生成图像的检测和伪影修复放到同一个模型中完成。它不是简单地判断"真假",而是能指出问题在哪里、为什么有问题,并进一步把图像修复到更自然的状态。

GenShield 框架的核心:检测与修复不是两个孤立任务,而是相互促进的。
模型不只输出 real/fake 判断,还会生成图像内容描述和伪影分析依据。你可以理解为:它不仅告诉你"这张图是 AI 生成的",还会解释"因为手指结构不自然、光影方向不一致"。
根据诊断信息,模型对图像中的异常区域进行针对性修复,同时尽量保持主体语义和整体结构不变。
模型像人类"先检查、再修改、再复查"一样,进行多轮诊断与修复。当图像已经足够自然时,模型会自动输出"未发现明显伪影"并停止。

模型进行多轮"诊断-修复"循环,直到图像自然为止。
团队构建了配套数据集 GenShield-Set,包含两个部分:
在 AI 生成图像检测任务上:
在伪影修复任务上:
训练过程分为两个阶段:
第一阶段:模型同时学习可解释检测和指令引导的修复,建立稳定的真实图像生成先验。
第二阶段:检测继续参与训练,修复升级为多轮自修复。给定一张可能有问题的图像,模型先生成诊断文本,再根据诊断进行修复,循环执行直到图像足够自然。
这种设计让检测和修复形成正反馈:检测帮助发现异常区域,修复反过来增强模型对伪影的敏感度。

Seko 无限画布 + Seedance 2.0 实操指南,720P 成本直降 50%、1080P 直降 80%,小白也能 10 分钟做出多剧集 AI 视频大片。

Claude Cowork 限时翻倍所有付费用户使用额度,月费20美元享236美元算力,附7个实战工作场景操作指南。

Codex 新增 OSS 模式,支持 Ollama、LM Studio 等本地模型服务,实现离线运行与成本控制