新华社测评AI大模型谁更强_国产AI大模型谁家强

来源： aicg搜索日期：2025-01-03 17:47:51

aicg搜索 → 首页 → AI教程资讯 → 新华社测评AI大模型谁更强_国产AI大模型谁家强

最近一年，人工智能技术迎来了大变革，伴随着ChatGPT的异军突起，科技企业们纷纷加大投入，AIGC大模型的发展日新月异、推陈出新。

为直观感受国内科技大厂所推出的大模型产品的现状、优势及特点。8月12日，新华社研究院对外发布《人工智能大模型体验报告2.0》，通过抓取7月31日~8月4日最新的网络数据组成复合型问答测试卷，以人机互动问答等形式，对国内主流大模型进行使用体验的横向测评。

本次测评在今年6月发布的《人工智能大模型体验报告1.0》基础上，在题目设定、对标Benchmark参照（人类）、人工打分权重、专家测评团队四大方面进行了全面升级：

在题目设置方面，测评题目由6月的300道扩展至8月的500道，并完善了题目分类；在对标Benchmark方面，本次测评将以接受过高等教育的人类作为对照组；在人工打分项目上，本次测评根据对产业、生活的实际价值，引入了人工打分的权重指数；在测评团队方面，邀请了北大文化与传播研究所的专家学者参与。

报告首先提出，大模型概念红利正在逐渐消失，大模型产品的估值将被重新衡量，回归实际应用。事实上，最近两个月AI概念一直在降温，ChatGPT官网的月活访问也在不断下行。报告认为，主流大模型架构的开发进程已过半，在竞争的下半场，如何将AI真正走进千家万户成为关注焦点。

为了更好地还原国内大模型的真实表现，本次测评的对象将围绕以下这些国内企业的大模型产品开展：360智脑、百度文心一言、澜舟科技Mchat、讯飞星火、昆仑万维天工、阿里通义千问、商汤商量、智谱科技ChatGLM（排名不分先后）。

读完这篇文章后，您心情如何？

0 喜欢
0 顶
0 无聊
0 围观
0 囧
0 难过

相关资讯

推荐阅读

网友评论

热门评论

最新评论

相关推送

: 1通义千问查看 2知料觅得查看 3Stable Diffusion查看 4猫箱查看 5PromptAppGPT查看 6文心一言查看 7天工智码 — SkyCode查看 8讯飞星火认知大模型查看

浏览排行

AI使用攻略: 更多+

1AI扩图玩法别太离谱！安利五款市面上主流的AI扩图软件，教学来了～ 2SDXL跟LCM怎么在comfyUI中搭建工作流,_ 3SD3超详细使用教程+效果测评丨附热门模型下载地址 4二次元界欢呼，动漫风格神级工具更新丨AI绘图Niji V6全面上手评测 5万万没想到，兵马俑都开始跳「科目三」：阿里云通义千问APP打造“全民舞王”视频创作工具，实测效果大赞 6AI视频项目测评_Animate Anyone怎么使用_Animate Anyone项目开源代码 7ChatGPTs保姆教程_ChatGPT使用教程_怎么自己生成GPT 8小白必备lora炼丹技巧_lora模型怎么训练

CG艺术长廊 | AI技术前沿 | 创新应用案例 | 行业深度解析 | 搜索技巧指南 | 社区互动论坛 | AI教程资讯 | 网站地图

Copyright 2009-2016 //www.aisoh.cc/ 版权所有

返回顶部