2026-04-15

中国信通院正式启动Token服务能力评估,MaaS评估体系全面升级

分享:

词元(Token)作为人工智能大模型处理信息的最小单元,已演进为智能经济时代的重要计量单位。根据中国信息通信研究院(简称“中国信通”)调研和测算,2025年我国公有云大模型对客侧Token调用量达到约2000万亿,相较2024年增长超过16倍。大模型服务性能也在持续提升,根据中国信通院持续开展的“公有云大模型Token服务性能监测”结果显示,2025年底平均调用成功率达到99.9%,首Token时延(TTFT)由年初的0.8秒左右降至年底0.6秒左右,每秒输出Token数(TPS)从年初30个左右提升至年底50个左右。然而模型即服务(MaaS)平台作为Token规模化生产、流通和应用的关键载体,为Token的高效供给提供核心支撑。因此,以MaaS平台为底座承载能力,以Token服务为触点对外输出,将驱动Token服务体系闭环。


在此背景下,中国信通院现将“MaaS评估体系”全面升级为“Token服务评估体系”,形成覆盖Token服务、MaaS平台和产品、管理和运营的3大维度的评估体系。新体系在原基础上,一是重点新增Token服务能力评估,涵盖Token服务质量、Token服务性能、Token服务可观测性等维度,以及为提升Token服务能力所需的智能模型路由、智能原生CLI等工具能力评估;二是扩充模型运营管理能力评估能力,增加面向企业的智能体管理运营、模型运营、模型管理等成熟度能力评估;三是完善MaaS平台和应用能力评估,增加多模态MaaS能力,以及医疗等行业应用能力的评估。


中国信通院Token服务评估体系图(2026年)


1. Token服务能力评估:包括对Token服务质量、服务性能、服务可观测性、服务SLA符合性、服务效能、服务计量能力等维度的评估,目标是面向平台厂商供给的Token服务,验证其服务的各项能力水平,提升Token服务质效。


2. MaaS平台能力评估:包括大模型开发平台、大模型服务平台、模型管理平台、大模型应用开发平台、多模态及行业MaaS平台以及智能路由和CLI等维度的平台能力评估,目标是面向提供MaaS平台的厂商,验证各平台的产品能力水平,助力产品迭代和优化。


3. 运营管理能力评估:围绕企业生产过程中模型开发、交付、监控、运营、管理等全生命周期,从组织机制、流程规范、技术工具、数据治理、安全可信等维度开展成熟度评估,目标是面向应用方企业,衡量企业内部落地应用能力的成熟度,助力企业构建可度量、可优化、可持续的AI运营体系。


中国信通院联合产业各界持续围绕大模型服务开展研究,以中国人工智能产业发展联盟(AIIA)模型服务(MaaS)工作组为载体,2023年以来陆续发布了《MaaS框架与应用研究报告(2024年)》《大模型平台落地实践研究报告(2025年)》、“MaaS标准体系”等多项成果,2024年以来通过构建“方升”公有云大模型Token服务性能监测平台,持续开展公有云大模型Token服务性能监测工作,并每季度发布“公有云大模型服务性能结果”,同时陆续开展MaaS能力评估,现共计完成和进行中的评估达到近30项目。

评估结果一览图


中国信通院2026年“Token服务评估”现正式启动,首轮评估结果将于2026年6月在相关会议上发布,如需了解评估细节,请咨询联系人。


联系方式:

中国信通院

人工智能研究所

程老师

15600298825(微信同号)

尹老师

18561320877(微信同号)



来源:中国信息通信研究院