微软等美系云端服务供应商(CSP)对AI需求杂音四起,中国AI大语言模型市场则从AI新创DeepSeek的R1横空出世以来,更加百花齐放,阿里、腾讯等科技大厂持续加快模型推进脚步,抢占市场话语权。
华尔街唱空AI前景,中国大语言模型竞争升温,中国云端服务龙头厂、阿里巴巴旗下阿里云,26日推出通义千问(Qwen)系列最新AI模型Qwen2.5-Omni-7B,号称为「端对端多模态模型」,能在智能手机手机或笔电等终端设备运行。
阿里云指出,即使Qwen2.5-Omni-7B使用70亿个参数,较月初发布的通义千问QwQ-32B参数量少78%,但依然可以提供「没有妥协」的性能和多模态处理能力,有利开发灵活和具成本效益的AI代理。
腾讯21日也推出深度思考模型「混元T1」正式版,一次可处理大量数据,号称推理能力与DeepSeek的R1模型不相上下,且输出价格仅为DeepSeek-R1标准时段的四分之一,试图与DeepSeek隔空较劲。
DeepSeek也于24日释出DeepSeek V3-0324模型更新,号称较上个版本大幅改进,推理、网路开发及搜寻能力都更强,还具备更强大的中文写作能力和搜寻能力。
评论
文明上网理性发言,请遵守新闻评论服务协议
登录参与评论
0/1000