天数智芯完成小米 MiMo-V2.5-Pro 模型 Day-0 适配 全栈GPU高效支撑智能体场景

来源:天数智芯 #天数智芯# #小米#
3808

近日,小米正式发布MiMo-V2.5-Pro 系列模型,天数智芯第一时间完成对MiMo-V2.5-Pro的 Day-0 适配,成为首批实现该模型稳定推理部署的通用GPU厂商,为开发者与企业用户提供开箱即用的大模型运行方案。

MiMo-V2.5-Pro作为小米旗舰基座模型,可支撑1T的超大参数量,以及1M超长上下文的模型推理。

MiMo-V2.5-Pro围绕 Agent 场景深度打磨,在工具调用、代码生成、Skills 执行等关键能力全面优化,综合表现对标行业顶尖水平,可支撑复杂任务编排、多轮交互与长上下文理解,在企业服务、智能交互、内容生产等场景具备广泛落地价值。

MiMo-V2.5和MiMo-V2.5-Pro 主要benchmark一览

此次适配中,天数智芯依托自研通用GPU 架构与成熟软件栈,完成深度算子优化、显存调度调优与推理加速,实现MiMo-V2.5-Pro在天数智芯通用 GPU 平台上稳定运行。针对模型大参数量、长上下文特性,天数智芯通过显存高效利用、多卡并行加速与访存瓶颈优化,在标准配置下可流畅支撑高强度推理负载,满足商业化部署要求。

硬件层面,天数智芯通用GPU 产品可高效支撑大模型推理与多并发请求,在端边云协同场景下同样具备灵活扩展能力。软件层面,天数智芯全栈软件栈兼容 PyTorch、vLLM、SGLang 等主流 AI 框架,降低模型迁移成本,缩短上线周期,为开发者提供友好易用的部署环境。

依托持续完善的AI 生态建设,天数智芯已完成多款行业主流基座大模型的适配与性能优化,覆盖通用对话、代码、多模态、智能体等多元场景,形成“模型-芯片-软件-部署”一体化落地能力。此次与小米MiMo-V2.5-Pro的 Day-0 适配,进一步完善公司大模型算力资源支持矩阵,强化在 Agent 时代的算力资源供给能力。

未来,天数智芯将持续深化与小米及更多生态伙伴的技术协同,围绕模型性能优化、场景化落地、开发者生态建设持续投入,以高效、可靠、易用的GPU 算力资源,助力大模型更快走进产业实际应用,推动 AI 技术普惠与生态开放繁荣。

开发者可访问以下链接体验:

MiMo 开放平台platform.xiaomimimo.com

责编: 爱集微
来源:天数智芯 #天数智芯# #小米#
THE END
关闭
加载

PDF 加载中...