
北航团队开源 InCoder-32B,用 250 万条仿真验证数据专攻工业代码,在 Verilog、CUDA、嵌入式等领域超越 Claude Sonnet,Apache 2.0 协议免费商用。
通用代码大模型写 Verilog 会报端口错误,写 CUDA kernel 会超出 GPU 硬件上限——不是模型能力不够,是训练数据里根本没有足够的工业代码。北航联合多家单位发布的 InCoder-32B 是目前第一个专门针对工业代码场景训练的开源大模型,覆盖芯片设计、GPU 内核优化、嵌入式系统、编译器优化、3D 建模五个领域,模型权重和数据集已在 HuggingFace 以 Apache 2.0 协议开源。
InCoder-32B 是一个 320 亿参数的 Decoder-only Transformer 模型,定位是「工业代码领域的专用基座」。与此前只聚焦单一子领域的模型(如只做 Verilog 的 RTLCoder、只做 CUDA 的 Kevin)不同,它用一个模型统一覆盖五个工业代码方向,同时保持通用代码任务的竞争力。
核心数据:250 万条经真实仿真环境执行验证的工业代码 SFT 样本,全部在真实 GPU、EDA 工具链、嵌入式仿真器上跑通后才被纳入训练集。

工业代码方向的关键数据:
通用代码方向依然有竞争力:
工业代码不能像 Python 函数那样用单元测试快速验证——Verilog 需要 RTL 仿真,CUDA 需要在真实 GPU 上跑,嵌入式固件需要在仿真器上引导执行。InCoder 团队为此重建了四套生产级仿真环境,250 万条训练样本全部经过完整的编译、仿真、测试流程才被收录。
训练样本分三类:
「失败-反馈-修复」轨迹的纳入,让模型学会了从编译错误和运行时日志中自主诊断问题,这正是工程师的真实工作方式。

| 资源 | 链接 |
|---|---|
| HuggingFace 模型权重 | Multilingual-Multimodal-NLP/IndustrialCoder |
| GitHub 代码仓库 | CSJianYang/Industrial-Coder |
| 论文 | arxiv.org/abs/2603.16790 |
全量权重和量化版本均已开放,协议为 Apache 2.0,可商业使用。

即梦推出 CLI 工具,支持在小龙虾、Claude Code 等智能体中通过自然语言直接调用 Seedance 2.0 生成视频和图片,无需 API 配置

通义千问 Qwen3.5-Omni 正式发布,支持文本、图片、音视频原生输入。实测具备超强的视觉代码理解能力,可实时解读论文并生成对应代码。

React 核心团队成员开源 Pretext,仅几 KB 的纯 TypeScript 库,前端 UI 渲染速度比传统工具快约 500 倍,已获 2.8 万 Star