智源研究院：国内头部模型已达国际一流，但能力发展不均衡

作者：张轶群 2024-05-18

来源：爱集微 #智源# #大模型# #人工智能# #智源研究#

3.3w

5月18日，在北京智源研究院（智源研究院）大模型评测发布会上，智源评测体系公布140余个国内外开/闭源语言及多模态大模型能力评测结果。

评测结果显示，在中文语境下，国内头部语言模型的综合表现已接近国际一流水平，但存在能力发展不均衡情况；在多模态理解图文问答任务上，开闭源模型平分秋色，国产模型表现突出；在中文语境下的文生图能力上，国产多模态模型与国际一流水平差距较小。

据评测结果，在中文语境下，字节跳动豆包Skylark2、OpenAI GPT-4位居第一、第二，国产大模型更懂中国用户。在语言模型客观评测中，OpenAI GPT-4、百川智能Baichuan3位列第一、第二。百度文心一言4.0、智谱华章GLM-4和月之暗面Kimi均进入语言模型主客观评测前五。

多模态理解模型客观评测结果显示，图文问答方面，阿里巴巴通义Qwen-vl-max与上海人工智能实验室InternVL-Chat-V1.5先后领先于OpenAI GPT-4，LLaVA-Next-Yi-34B和上海人工智能实验室Intern-XComposer2-VL-7B紧随其后。

责编：陈炳欣

来源：爱集微 #智源# #大模型# #人工智能# #智源研究#

THE END

*此内容为集微网原创，著作权归集微网所有，爱集微，爱原创

张轶群

微信：zyqjordan23

邮箱：zhangyq@ijiwei.com

集微网记者，关注IC产业，深度报道、企业报道

1996文章总数

536.6w总浏览量