toolin.ai logo
toolin.ai
首页
所有AI工具
AI技能包
AI资讯
精选推文
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具802个
技能包11个
产品功能
  • 所有AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策
InCoder-32B:首个工业代码开源大模型,覆盖芯片/CUDA/嵌入式
2026/03/28

InCoder-32B:首个工业代码开源大模型,覆盖芯片/CUDA/嵌入式

北航团队开源 InCoder-32B,用 250 万条仿真验证数据专攻工业代码,在 Verilog、CUDA、嵌入式等领域超越 Claude Sonnet,Apache 2.0 协议免费商用。

通用代码大模型写 Verilog 会报端口错误,写 CUDA kernel 会超出 GPU 硬件上限——不是模型能力不够,是训练数据里根本没有足够的工业代码。北航联合多家单位发布的 InCoder-32B 是目前第一个专门针对工业代码场景训练的开源大模型,覆盖芯片设计、GPU 内核优化、嵌入式系统、编译器优化、3D 建模五个领域,模型权重和数据集已在 HuggingFace 以 Apache 2.0 协议开源。

InCoder-32B 是什么

InCoder-32B 是一个 320 亿参数的 Decoder-only Transformer 模型,定位是「工业代码领域的专用基座」。与此前只聚焦单一子领域的模型(如只做 Verilog 的 RTLCoder、只做 CUDA 的 Kevin)不同,它用一个模型统一覆盖五个工业代码方向,同时保持通用代码任务的竞争力。

核心数据:250 万条经真实仿真环境执行验证的工业代码 SFT 样本,全部在真实 GPU、EDA 工具链、嵌入式仿真器上跑通后才被纳入训练集。

核心能力

InCoder-32B 覆盖五大工业代码领域的整体框架

  • 芯片 RTL 设计(Verilog/SystemVerilog):用 Icarus Verilog + Verilator + Yosys 完整验证,判定标准和真实硅片流片一致
  • GPU 内核优化(CUDA/Triton):直接在 NVIDIA A100 上运行验证,性能数据可直接迁移到生产环境
  • 嵌入式固件(C/ARM):以 STM32F407 为目标平台,在 Renode 仿真器上验证寄存器配置和中断行为
  • 编译器优化(x86-64 汇编):固定 CPU 频率、绑定核心亲和性条件下测量,复刻标准编译器基准流程
  • 参数化 3D 建模(CadQuery):基于 OpenCascade 验证几何保真度,与 FreeCAD、KiCad 使用相同内核

基准测试表现

工业代码方向的关键数据:

  • CAD-Coder(3D 建模)IoU:53.5%,超过 Claude Sonnet-4.6 的 32.4%
  • KernelBench(GPU 内核):全部三个级别取得开源模型最佳成绩
  • Triton 算子生成函数调用成功率:当前最优通用模型仅 28.80%,InCoder-32B 显著提升

通用代码方向依然有竞争力:

  • HumanEval:94.5%
  • MBPP:91.8%
  • SWE-bench Verified:74.8%(同规模开源模型领先水平)

训练数据的核心差异

工业代码不能像 Python 函数那样用单元测试快速验证——Verilog 需要 RTL 仿真,CUDA 需要在真实 GPU 上跑,嵌入式固件需要在仿真器上引导执行。InCoder 团队为此重建了四套生产级仿真环境,250 万条训练样本全部经过完整的编译、仿真、测试流程才被收录。

训练样本分三类:

  • 直接解答:需求到实现的直接路径
  • 缺陷修复:失败代码 + 环境报错 + 修复后代码的完整轨迹
  • 性能优化:功能正确的代码经进一步效率或架构优化

「失败-反馈-修复」轨迹的纳入,让模型学会了从编译错误和运行时日志中自主诊断问题,这正是工程师的真实工作方式。

三阶段训练流程:预训练、中期训练、工业代码专精化微调

适合谁用

  • 芯片/FPGA 工程师:需要 AI 辅助生成或审查 Verilog/SystemVerilog 代码
  • GPU 计算研究者:编写 CUDA/Triton 自定义算子,对硬件约束有强依赖
  • 嵌入式开发者:STM32 等 ARM 平台固件开发,寄存器配置和中断逻辑要求精确
  • AI 基础设施团队:需要在私有化环境部署工业代码助手,Apache 2.0 允许商业使用

获取方式

资源链接
HuggingFace 模型权重Multilingual-Multimodal-NLP/IndustrialCoder
GitHub 代码仓库CSJianYang/Industrial-Coder
论文arxiv.org/abs/2603.16790

全量权重和量化版本均已开放,协议为 Apache 2.0,可商业使用。

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
InCoder-32B 是什么核心能力基准测试表现训练数据的核心差异适合谁用获取方式

相关文章

即梦 CLI 上线:在智能体里直接调用 Seedance 2.0 生成视频
AI产品

即梦 CLI 上线:在智能体里直接调用 Seedance 2.0 生成视频

即梦推出 CLI 工具,支持在小龙虾、Claude Code 等智能体中通过自然语言直接调用 Seedance 2.0 生成视频和图片,无需 API 配置

avatar for toolin小编
toolin小编
3天前
Qwen3.5-Omni 实测:全模态原生感知,摄像头下的 AI 编程大师
AI产品

Qwen3.5-Omni 实测:全模态原生感知,摄像头下的 AI 编程大师

通义千问 Qwen3.5-Omni 正式发布,支持文本、图片、音视频原生输入。实测具备超强的视觉代码理解能力,可实时解读论文并生成对应代码。

avatar for toolin小编
toolin小编
4天前
Pretext:前端渲染速度提升 500 倍的开源库
AI产品

Pretext:前端渲染速度提升 500 倍的开源库

React 核心团队成员开源 Pretext,仅几 KB 的纯 TypeScript 库,前端 UI 渲染速度比传统工具快约 500 倍,已获 2.8 万 Star

avatar for toolin小编
toolin小编
3天前