国家数据局:我国日均Token消耗量突破30万亿,一年半时间增长300多倍

来源: aicg搜索 日期:2025-08-16 07:05:42
aicg搜索首页AI教程资讯 → 国家数据局:我国日均Token消耗量突破30万亿,一年半时间增长300多倍

8月14日消息,据中国新闻网今天报道,***新闻办公室今天举行了“高质量完成‘十四五’规划”系列主题新闻发布会,其中国家数据局局长刘烈宏作出了相关报告、解读。

刘烈宏介绍道,2024年初中国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已突破30万亿,1年半的时间增长了300多倍,反映了我国人工智能应用规模快速增长。

刘烈宏还指出,中国一直在持续推进高质量数据集建设工作,截至今年6月底,中国已建设高质量数据集超过3.5万个,总体量超400PB(409600TB)。

同时,AI模型训练也推动了数据交易需求,今年6月底前中国各地高质量数据集累计交易额近40亿元人民币,数据交易机构挂牌的高质量数据集总规模达246PB(251904TB)。北京数交所的高质量数据集占交易总量的比例从去年的10%跃升到目前的近80%。

中文数据也在国内大模型的训练性能提升方面发挥重要作用,目前中国多数模型训练使用的中文数据占比已超过60%,有的模型已达80%。

注:Token(常被称为词元)是计算机科学与自然语言处理领域中的一个基础且重要的概念,通常指文本数据经过分词或标记化处理后的最小单位,其中单位可以是单词、标点符号、数字或其他任何有意义的符号。

读完这篇文章后,您心情如何?

  • 0 喜欢喜欢
  • 0 顶
  • 0 无聊无聊
  • 0 围观围观
  • 0 囧
  • 0 难过难过
相关资讯
推荐阅读
网友评论

热门评论

最新评论

发表评论

昵称:
表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲
字数: 0/500 (您的评论需要经过审核才能显示)
相关推送
1Sloyd.ai查看 2星穹智绘查看 3豆包 — 字节跳动查看 4免费ChatGPT中文版—ChatGai查看 5讯飞智文 — 科大讯飞查看 6Clipchamp查看 7tabnine---自动补全代码查看 8有言查看
AI使用攻略
更多+

CG艺术长廊 | AI技术前沿 | 创新应用案例 | 行业深度解析 | 搜索技巧指南 | 社区互动论坛 | AI教程资讯 | 网站地图

Copyright 2009-2016 //www.aisoh.cc/ 版权所有