近日,由中国光华科技基金会青年开源专项基金公益支持,沐曦股份联合AI Infra 开源社区、TileAI 社区、GitLink平台、启悟学习社区、联合DataWhale等多家头部AI开源相关平台和社区,共同推出的TileLang Puzzle 开源训练营,已圆满完成线上教学阶段。作为业界第一个系统性讲授 TileLang 算子开发与优化的实战型开源课程,本次训练营成功吸引了全国 551 名开发者参与,在国产 AI 底层人才培养领域取得了阶段性成果。
本次训练营成功验证了“技术开源+人才培育”的生态发展模式。而在本次训练营中,沐曦股份不仅是算力资源提供方,更是课程设计、技术指导、生态赋能的全链路参与者,全程助力训练营实现从技术培训到生态赋能的闭环。
首期成绩单:551名学员,国产GPU算力实践超3万个小时
本次 TileLang Puzzle 训练营历时 3 周,累计提供 10 小时线上系统课程,学员累计消耗沐曦 GPU 算力时长超 30,450 小时。课程覆盖从 GPGPU 基础理论到端到端推理优化的完整知识体系,通过 8 节精品课程构建了系统化的学习路径。

学员构成:高学历、年轻化的技术人才群体
本次训练营吸引了来自全国 50 余所高校及企业的开发者参与:
身份构成:在校学生占 62.41%,在职人员占 27.82%
学历层次:硕士占 48.87%,本科占 43.61%,博士占 3.38%
覆盖范围:包括北京大学、清华大学、中科院等顶尖高校及多家 AI 企业技术人员
学员反馈:高满意度印证课程价值
通过对回收的有效问卷进行统计分析,学员对本次训练营给予了高度评价:
课程质量评分:8.6/10 分
课程组织评分:4.4/5 分
对工作学习帮助:4.2/5 分
NPS推荐意愿评分:9.0/10 分
学员普遍认为,训练营的渐进式 Puzzle 设计、实战导向的学习模式以及沐曦股份专家团队的及时答疑是本次课程最突出的亮点。同时,学员也提出了增加基础前置知识补充、完善实践教程文档、拉长学习周期等建设性意见,为后续课程迭代提供了明确方向。
四大核心亮点:打造国产算子开发人才培养标杆
1.业界首个系统性 TileLang 课程
填补人才培养空白
TileLang 作为由TileAI社区主导开发的开源 AI 算子编程语言,已在 DeepSeek v3.2 至 v4 版本中得到规模化应用,其核心算子性能已逼近硬件极限。然而,作为一项前沿技术,TileLang 此前缺乏系统化的教学实践。
本次 TileLang Puzzle 训练营首次构建了从零基础到实战应用的完整教学体系,涵盖:
GPGPU 核心技术与并行计算基础
国产 GPU(沐曦 C系列)架构解析与优化案例详解
TileLang 语法与编译器原理
5 大核心算子(从 Copy 到 GEMM)的渐进式开发
算子性能调优工具链实战
端到端推理优化项目开发
这一课程体系的建立,不仅填补了国内在TileLang技术领域的人才培养空白,也为国产AI底层技术的普及推广奠定了坚实基础。加之沐曦股份通用GPU芯片的有力支撑,实现了从软件生态到硬件底层的全栈国产化替代,有力推动了关键技术的自主可控进程。
2.实战型课程设计
真正做到“学完就能用”
与传统理论课程不同,本次训练营坚持“实战导向”的设计理念:
渐进式 Puzzles 设计:从 Copy 到 GEMM,5 大核心算子分 3 阶段进阶,每一步只引入最少必要概念
双轨并行学习:TileLang 自动化优化 + CUDA/MACA 手写底层,既知其然也知其所以然
可验证的学习成果:学员最终交付性能超越 PyTorch Baseline 的可运行算子,完成完整的框架算子注册项目
国产硬件适配:特别强化沐曦国产 GPU 适配能力培养,要求学员完成至少 2 个算子的 MACA 手写版本
这种设计确保了学员不仅掌握理论知识,更能具备实际开发能力,真正实现“学完就能用”。
3.线上 + 线下结合
构建完整学习闭环
本次训练营采用“线上系统学习 + 线下实操验证”的混合模式:
线上阶段(已完成):8 节系统课程,涵盖理论基础到实战开发,学员通过 GitLink 开源平台完成任务打卡与代码提交
线下阶段(已启动):学员将在实操环境中完成完整的推理优化项目,验证学习成果,实现知识的融会贯通
这种模式既保证了知识传递的系统性,又通过线下实操确保了学习效果的落地。
4.沐曦“揭榜挂帅”赛题配套
学习参赛无缝衔接
作为2026 年度中国青年科技创新“揭榜挂帅”擂台赛的配套支持课程,本次训练营内容与沐曦股份发布的“揭榜挂帅”赛题高度契合:
沐曦股份发布赛题“基于国产软件栈的大模型推理前沿算子优化”的核心开发语言即为 TileLang
训练营中重点练习的 MLA、Fused MoE、NSA 等算子,正是赛题需要优化的核心内容
学员通过训练营掌握的 TileLang 开发与国产硬件适配能力,可直接应用于赛事
这一设计实现了“学习 - 实践 - 参赛 - 就业”的无缝衔接,为青年人才提供了展示能力的舞台。

生态联动:多方协同构建国产算力人才培养体系
本次训练营的成功举办,是国产开源生态协同创新的典范。沐曦股份与CCF 开源技术发展委员会AI Infra工作组、GitLink开源平台、TileAI 社区、AI Infra 社区、启悟学习社区、DataWhale 开源学习社区、InfiniTensor开源社区、CSDN、Gitee等多位老师、平台和机构通力协作,构建了产学研用深度融合的人才培养生态。
对于沐曦股份、TileAI 社区等技术提供方而言,本次训练营验证了“技术开源 + 人才培育”的生态发展模式,通过系统化课程降低技术门槛,扩大了国产技术的使用者群体,为沐曦 GPU 生态和TileLang的持续发展注入了新鲜血液。
对于启悟学习社区、AI Infra 开源社区、GitLink开源平台等平台方而言,本次训练营丰富了平台的优质课程内容,探索了面向 AI 底层技术的普惠教育路径,为后续更多同类课程的开展积累了经验,证明了通过开源社区力量推动底层技术人才培养的可行性。
对于高校而言,本次训练营提供了与产业前沿接轨的实战课程内容,弥补了传统教学中 AI 底层技术内容的不足,为计算机相关专业的人才培养提供了有益补充。
对于学生而言,本次训练营提供了:
接触产业界前沿技术的机会
亲手开发高性能算子的实战经验
参与开源社区贡献的通道
沐曦股份实习的绿色通道
国家级科创赛事的备战支持
这些都将成为学生求职、科研、竞赛道路上的重要助力。

对于更广泛的 AI Infra 社区而言,本次训练营证明了 GPU 底层开发并非“高不可攀”—— 通过合理的课程设计和工具支持,具备 Python 基础的开发者也能掌握算子开发技能。这将推动 AI 底层技术从“大厂专属”走向“开发者普惠”,为整个行业的人才储备奠定基础。
持续迭代:打造国产算子开发人才培养的标杆品牌
本次 TileLang Puzzle 训练营的成功,是国产 AI 底层人才培养的一个良好开端。基于学员反馈和运营经验,沐曦股份未来将从以下几个方面持续迭代优化:
1.完善课程体系
增加基础前置知识模块,为零基础学员提供更友好的入门路径
2.优化学习节奏
适当拉长学习周期,降低任务密度,给学员更充足的消化时间
3.丰富教学形式
增加线下工作坊、集中答疑等环节,提升学习互动性
4.强化实践支持
完善实践教程文档,确保任务与课程内容更匹配
5.拓展生态合作
与更多高校、企业、社区建立合作,扩大训练营覆盖面
沐曦股份与开源合作伙伴的目标,是将 TileLang Puzzle 训练营打造成为国内 GPU 算子开发领域的标杆品牌,每年培养 5000+ 国产 GPU 软件人才,拉动 TileLang 社区贡献者增长,最终推动 TileLang 成为国产 GPU 算子开发的事实标准。

本次训练营的成功举办,是沐曦股份开源生态建设战略的重要实践。人工智能的下半场,拼的是底层算力。国产 AI 生态的建设,既需要顶尖的技术突破,也需要庞大的人才基座。TileLang Puzzle 开源训练营的成功举办,标志着沐曦股份国产GPU 在 AI 底层基础设施领域的创新,已初步形成“技术研发 - 产业应用 - 人才培育”的完整闭环。
感谢中国光华科技基金会青年开源专项基金的公益支持,感谢所有合作社区、高校、企业的鼎力相助,感谢每一位学员的热情参与。沐曦股份也诚邀更多合作伙伴加入,携手并进,共同为国产算力生态的繁荣贡献力量,让更多开发者站在国产 GPU 的肩膀上,写出世界级的高性能算子!
后续预告
TileLang Puzzle 训练营线下实操阶段已经启动,线上课程回放已在AI Infra开源社区视频号上线。开源项目内容与代码可以在GitLink开源平台ODTC AI Infra-Intro-ops训练营项目中持续获得和参与。课程的学员社群也将持续运营,为大家的持续学习提供技术答疑!