SenseNova U1：开源的多模态图文创作模型

GPT Image 2 的文字渲染和排版能力确实强，但 API 按量计费价格不低，国内团队接入也有门槛。商汤最新发布的 SenseNova U1 系列给出了一个开源免费的替代方案，不仅能做信息图，还支持在同一个模型内连续生成图文内容。

SenseNova U1 生成的信息图示例

SenseNova U1 是什么

SenseNova U1 是商汤发布的采用全新 NEO-Unify 架构的多模态模型。它不是把"理解模型"和"生成模型"拼在一起，而是把图文理解、图文推理和图文生成放进同一套架构里统一处理。

传统多模态方案的痛点在于：语言模型负责理解和推理，视觉编码器负责把图片转成模型能读懂的表示，图像生成部分再把结果转回像素。理解和生成之间需要不断做模态转换，角色一致性很难保证。U1 去掉了传统的视觉编码器（VE）和图像生成中的 VAE，让模型直接从原始像素和文字里学习。

两个核心能力

连续图文创作输出

这是最能体现 U1 原生统一架构特征的能力。不是"先写一段话，再配一张图"，而是在一个模型内部完成文字和图像的连续生成。这在行业内是首创。

传统图文生成流程是：文本模型先完成文案，再把某些段落交给图像模型生成插图，两个模型之间的衔接往往导致风格不一致。U1 的做法是在一次推理中交替输出文字和图像，保持整体风格统一。

U1 连续图文生成示例

高密度信息图生成

信息图不是简单生成一张好看的图，它要求模型同时处理文字结构、视觉层级、版式布局、图标关系和信息密度。以前 AI 画图最容易翻车的地方恰好就是文字渲染和排版。U1 在这方面做了针对性优化。

开源版本说明

这次开源的是 SenseNova U1 Lite 系列，包含两个版本：

版本	参数	定位
U1 Lite 8B-MoT	8B	轻量级，适合接入工作流
U1 Lite A3B-MoT	A3B	更大容量，更强能力

跑分上，U1 Lite 系列均达到同量级开源模型的 SOTA 水平。定位上，它不是要和最大规模的闭源模型硬拼参数，而是做一个"够强、够轻、能开源、能接进工作流"的多模态模型。

图像理解和生成基准测试结果

如何体验

在线体验（免费）：通过办公小浣熊的【一图读懂】功能可以直接体验 SenseNova U1 的信息图生成能力
本地部署：从开源仓库下载 U1 Lite 模型权重，自行部署到本地环境

提示：信息图生成时建议在 Prompt 中明确指定整体风格、主色调、模块数量和每个模块的具体内容，输出效果会更好。例如："生成一张深蓝色科技感海报，分四个模块，模块一为三国联合主办（含北美地图），模块二为赛程安排表..."

SenseNova U1 生成的信息图示例

版本	参数	定位
U1 Lite 8B-MoT	8B	轻量级，适合接入工作流
U1 Lite A3B-MoT	A3B	更大容量，更强能力

图像理解和生成基准测试结果

如何体验

在线体验（免费）：通过办公小浣熊的【一图读懂】功能可以直接体验 SenseNova U1 的信息图生成能力
本地部署：从开源仓库下载 U1 Lite 模型权重，自行部署到本地环境

提示：信息图生成时建议在 Prompt 中明确指定整体风格、主色调、模块数量和每个模块的具体内容，输出效果会更好。例如："生成一张深蓝色科技感海报，分四个模块，模块一为三国联合主办（含北美地图），模块二为赛程安排表..."

全部

AI教程

AI产品

AI资源

SenseNova U1：开源的多模态图文创作模型

SenseNova U1：开源的多模态图文创作模型

SenseNova U1 是什么

两个核心能力

连续图文创作输出

高密度信息图生成

开源版本说明

如何体验

作者

分类

相关文章

Codex 全攻略：从入门到国内可用的三种方案

用 Image2 + Seedance 2.0 制作 AI 长视频：品牌广告实操

SenseNova U1：开源信息图生成模型，8B 参数单卡可跑

SenseNova U1：开源的多模态图文创作模型

SenseNova U1：开源的多模态图文创作模型

SenseNova U1 是什么

两个核心能力

连续图文创作输出

高密度信息图生成

开源版本说明

如何体验

作者

分类

相关文章

Codex 全攻略：从入门到国内可用的三种方案

用 Image2 + Seedance 2.0 制作 AI 长视频：品牌广告实操

SenseNova U1：开源信息图生成模型，8B 参数单卡可跑