近日,当虹科技在接受机构调研时表示,DeepSeek-R1推出,汽车成为重要智能体载体,R1本地部署要求大幅降低,低成本高性能AI Agent与座舱结合,显著提升人车智能交互体验的同时,能打造差异化竞争优势,未来有望成为智能座舱的发展新趋势,加快公司在智能网联汽车业务方向的大模型的落地。
由于DeepSeek-R1和Janus Pro的模型尺寸不一致,使用的算力和调优训练数据也是不一样。对于DeepSeek-R1,当虹科技主要使用了强化学习的方法对蒸馏模型DeepSeek-R170B/32B/14B的版本进行训练,算力层面使用了一定体量的GPU,数据层面使用了五百万条左右的训练数据。对于DeepSeekJanus-Pro,模型大小是7B,比较小,公司进行了全量调优,使用了较少的GPU,训练数据条数为九万左右,后续当虹科技基于公司不同行业客户的端侧模型训练,还会根据行业场景的具体数据进行调整。目前,DeepSeek融合进了当虹科技的大模型基座里面,在公司的三大业务方向都可应用。
当虹科技同时称,公司会在AI大模型方向上持续投入研发,跟进最前沿技术,也会一直围绕基于AI、大模型技术对三大业务方向产品做创新升级。DeepSeek是目前一个很好的工具且是开源的,利用好这样的工具公司在研发、调优、优化等方面持续训练,会把当虹的大模型训练的越来越好。
评论
文明上网理性发言,请遵守新闻评论服务协议
登录参与评论
0/1000