
UniCalli统一扩散框架完美实现列级排版、连笔生成,首次统一书法生成和古籍识别任务,已开源数据集与Demo
香港科技大学团队推出的 UniCalli,是全球首个能同时搞定「书法生成」和「古籍识别」的 AI 框架。不仅能写出王羲之、颜真卿的字,还能自动排版、加连笔,甚至能反向识别古籍文字。

以前的 AI 书法工具有两个极端:
UniCalli 的出现,算是降维打击。它能:
传统方法是线性生成,一个字一个字往下写。UniCalli 用的是「全局谋篇」——就像真正的书法家,落笔前先看整体布局。
非对称加噪(Asymmetric Noising) 通过不同的加噪策略,让模型自动切换「生成模式」和「识别模式」。
边界框图(BoxMap) 给每个字符加上位置和大小信息,逼着模型学会排版规则。
重复旋转位置编码(DuplicateRoPE) 让文本、图像、布局三种信息在同一个坐标系里对话,不会乱套。
防止模型在稀有书法家数据上「过拟合」——比如学米芾学到字形都崩了。

李白《将进酒》草书版 模型能根据上下文自动判断,生成极其得体、连贯的牵丝连笔。
多书法家风格切换 从文征明的行书到宋徽宗的瘦金体,从王羲之的草书到颜真卿的楷书,随意切换。
甚至能逆向生成甲骨文 给它一段现代汉语,它能直接生成结构神似的甲骨文,泛化能力惊人。

在书法协会专家、大学书法社团的盲测中,UniCalli 在风格还原度、字形准确性和自然度上,全面超越了 ChatGPT-4o、Doubao 等主流大模型。
在线试玩 Demo https://huggingface.co/spaces/TSXu/UniCalli_Dev
开源数据集 https://huggingface.co/datasets/TSXu/UniCalli_dataset
项目主页 https://envision-research.github.io/UniCalli/
适合谁?
不适合谁?
相比竞品的独特优势
明显的缺点或限制
定价与门槛 ✅ 完全开源,免费使用 ✅ 在线 Demo 可直接体验,无需本地部署 ✅ 如需本地运行,建议配置 GPU(模型蒸馏后十秒可生成数张作品)

Clawdbot 是一个开源的本地 AI 助手,运行在 Mac mini 或 VPS 上,拥有长期记忆,能主动执行任务,不仅是聊天机器人,更是能干活的私人管家。

SceneMaker 是一个突破性的开源框架,能从单张图像生成完整的、带 Mesh 的 3D 场景,完美解决物体遮挡和空间位姿问题。

深度解析 Claude Code 的 10 个隐藏命令,从代码审查到自动化测试,帮助开发者充分发挥 AI 编程助手的潜力