点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

随着大模型加速进入制造、医疗、教育、科研、政务等领域,Token作为模型处理信息的基本计量单位,正从纯粹的技术概念走入企业成本核算和平台定价体系。一种以模型能力为核心、以Token调用为表征,联结算力、数据、能源与应用场景的智能服务经济形态——“Token经济”,已具雏形。
需要清醒认识到,Token并非天然同质、可脱离模型与任务独立流通的商品,更不能简单视作新的法定生产要素。不同模型的分词机制各异,同等数量的Token在能力释放、成本结构和能耗水平上可能相差悬殊。发展Token经济,不能只看调用量的膨胀,更应衡量智能投入究竟形成了多少有效产出。推动评价逻辑从“拼参数、拼卡数、拼消耗”转向“比质量、比效率、比价值”,是迈向高质量发展的第一道关口。
一、算力规模持续扩大,更要拒绝Token虚耗
Token是连接底层算力投入与上层任务产出的关键计量接口,其经济运转离不开算力的基础支撑。近年来,我国算力基础设施建设明显提速:截至2026年1月,已建成42个万卡智算集群,智能算力规模超过1590EFLOPS,位居全球前列。2026年政府工作报告进一步部署,适度超前建设数字基础设施,加快超大规模智算集群技术突破与工程落地。算力规模扩大意味着Token供给能力增强,却并不等于实际生产力必然同步提高。
当前的市场叙事,仍容易停留在“买了多少芯片、训练了多大模型、消耗了多少Token”,甚至将模型接入数和接口调用量直接等同于应用成效。基础问答、文本整理、信息抽取等相对低价值任务并非不应运行,它们既是现实业务的必要组成部分,也是培育用户习惯、积累应用经验的重要入口。但是脱离实际需求反复运行低价值任务,或者为了增加Token消耗量而人为拉长提示词、增加无效轮次、用高成本模型处理本可由小模型完成的任务是本末倒置。衡量Token经济,不能看“跑了多少”,而要看“解决了什么问题、形成了多少价值”。
这种脱离任务价值的无效或低效消耗,构成了“Token虚耗”,凸显出Token消耗与有效产出不匹配的结构性矛盾。国际能源署2026年4月发布的报告显示,全球数据中心用电量预计将从2025年的约485太瓦时攀升至2030年的约950太瓦时;尽管单次人工智能任务的能耗年均下降超过一个数量级,但推理、智能体等复杂任务的单次能耗可达简单文本生成的数百乃至数千倍。这组数据揭示了一个深刻事实:技术效率的提升并不会自动带来资源节约。Token经济高质量发展的核心,不是抑制合理的调用需求,而是在确保质量与安全的前提下,持续压降完成单位有效任务所需的Token、算力、能源、时间与人工投入。
二、建立“效价比”标尺,算清单位有效任务成本
评价Token经济,先要校准“用什么量”的问题。“Token per task”——完成一项任务消耗多少Token,是直观的起点,却远非完整的终点。模型输出少不等于质量高,调用单价低也不等于总成本低。完整的衡量体系,还需纳入任务成功率、准确性与安全性,以及时延、能耗和人工复核成本。
由此,可将核心指标凝练为“单位有效任务综合智能成本”,并以“效价比”作为标尺:“效”指任务质量与生产率增量,“价”涵盖模型调用、算力、能源、时间与人工成本。企业不应只问“每百万Token多少钱”,更应追问“解决一个合格问题多少钱”“完成一次可靠质检多少钱”。这才是从技术计量迈向经济核算的关键一跃。
建议政府主管部门牵头,推动建立分行业、分场景的智能服务效率评估体系。在客服、代码生成、工业质检、科研辅助等典型场景中,设置任务质量、响应时间、资源消耗和人工介入率等指标,鼓励第三方开展基准测试,并在公共采购、算力补贴和示范项目中率先引入应用成效考核。
国际上,MLCommons推出的MLPerf Power基准已将性能、功耗与能效结合测量;欧盟《人工智能法》要求通用模型提供者披露训练能耗等技术信息。这些探索的共同指向,是让人工智能的资源成本可测量、可比较、可问责。我国构建Token效率标准,不能照搬单一排行榜,而应突出产业场景与结果导向,形成既能测技术性能、又能测经济价值的“中国标尺”。
三、以技术创新降本增效,让“少消耗、多办事”成为核心竞争力
效率提升的着力点,必须从堆叠硬件资源转向算法、架构与工程能力的突破。2026年4月发布的DeepSeek-V4 Preview提供了一个生动的国内案例:V4-Pro总参数达1.6万亿,每个Token仅激活490亿参数;V4-Flash总参数2840亿,每个Token激活130亿参数,两者均支持100万Token上下文。更值得关注的是,在长上下文场景下,V4-Pro单Token推理计算量仅为V3.2的27%,KV缓存需求仅为后者的10%。这有力证明,模型规模扩大并不必然带来单位成本同比例增长,注意力压缩、稀疏激活和低精度计算等技术路径,正在释放显著的效率红利。
国际前沿模型的竞争,同样从单纯追求评测分数,转向提升复杂任务的“一次完成率”。OpenAI发布的GPT-5.5在三项复杂编码评测中全面超越前代,同时消耗更少Token,其中Expert-SWE准确率从68.5%跃升至73.1%。真正有经济意义的效率,不是机械地缩短单次输出,而是以更少的Token和重试次数博取更高的任务成功率。模型压缩、量化、蒸馏、缓存复用、大小模型协同与智能路由等,均应围绕这一核心展开。
这一趋势可概括为“Token效率倍增”:完成同等质量任务所需的资源持续递减。企业的竞争力,不只在于拥有多少算力,更在于能否为任务精准匹配模型——简单任务用小模型,复杂推理调高能力模型,高频问题借助缓存与知识库减少重复计算。让“十份资源办成的事,用一份资源办成”,理应成为重要的创新导向。
四、优化生态分工,让稀缺资源流向高价值环节
做大Token经济,决不能滑向各类主体重复建设基础模型的“算力军备竞赛”,而应形成层次清晰、优势互补的产业生态。前沿科研机构与头部实验室应聚焦基础模型、世界模型、多模态推理等高风险、长周期方向;应用型企业应更多依托成熟模型,在行业知识、专有数据和业务流程上深耕;基础设施与平台企业则应提供稳定、低成本、可切换的模型服务,降低中小企业的应用门槛。
公共算力、重大专项和政策性资金,应向基础研究、共性技术、开源生态和关键短板倾斜。对于一般商业应用,则须强化市场检验,避免将“接入大模型”本身包装为创新成果。项目验收要看良品率是否提升、研发周期是否缩短、服务成本是否下降、新增收入是否形成,而不是止步于调用量和模型规模。
政策工具亦需相应调整。算力补贴可从按购置规模、使用时长补助,逐步转向按有效任务、技术增量与应用成效支持;算力券、模型券可设置分档兑现和结果评估机制。尤为重要的是,不同模型的Token并不等价,现阶段不宜将其简单设计为统一交易品。更可行的方向是完善模型服务计量、账单披露、跨平台调度和按效果结算规则,让原本隐藏在接口背后的智能成本变得透明、可管理、可优化。
五、以普惠智能赋能实体经济,形成“增值型Token经济”
Token经济的终极价值,不在Token本身,而在其承载的智能能力能否深入千行百业。正如企业不必自建电厂才能用上电力,也不必都从头训练基础大模型。通过公共云、行业模型平台和标准化接口,企业可按需调用智能能力,将有限资源集中到数据治理、流程再造和产品创新上。国家“十五五”规划纲要明确提出,提升算力普惠易用水平,降低中小企业用算成本,建立健全模型能力评估体系,正彰显了这一政策方向。
Token可支撑研发设计、工艺优化、设备运维、质量检测、知识管理和科研辅助等广泛场景,但每一项应用都应回答三个根本问题:是否解决了真实问题?是否优于原有方案?是否形成了可持续收益?只有当每单位智能投入都对应可测量的效率提升、成本下降或质量改善时,Token才从“消耗品”质变为“增值载体”。
推动这种增值转化,还需以场景为牵引,促进业务流程与组织方式的同步变革。大型企业应将Token服务嵌入研发、生产、供应链和客户服务等关键环节,推动智能能力从单点工具升级为贯穿价值链的基础能力;中小企业则可依托公共云、行业平台和“Token工厂”等专业服务商,以按需调用、灵活组合的方式获取适配的模型能力。产业主管部门可围绕重点行业,打造可复制的场景方案与公共服务平台,协同推进供需对接、数据治理与人才培训,使更多企业不仅“用上”Token,更通过流程再造,将Token转化为产品创新、质量提升与经营效率改善的澎湃动力。
结语:以质量跃升打开Token经济新空间
推动Token经济从“拼消耗”迈向“比产出”,实现高质量发展,应系统抓好五方面工作:一是牢固确立有效产出导向,改革以消耗量、接入数和算力规模论成效的评价方式,将降低单位有效任务综合资源投入作为关键目标;二是建立面向典型行业与场景的Token效率和智能服务质量标准,形成可测量、可比较的分级评价体系;三是支持模型压缩、推理优化、软硬件协同和智能路由等提效技术,使“少消耗、多办事”成为产业竞争力;四是优化前沿研究、应用开发与基础设施之间的生态分工,完善资源配置、补贴考核、服务计量和价格披露机制,引导稀缺资源流向高价值环节;五是提升Token服务的普惠性与易用性,以行业场景和流程再造带动中小企业应用,让智能投入真正转化为实体经济的效率、质量和创新增量。
人工智能发展的上半场,竞争焦点是模型能不能做、算力有没有;进入规模化应用阶段,关键已转向做得好不好、成本降不降、价值高不高。从“跑马圈地”走向“精耕细作”,不是放慢人工智能发展的步伐,而是为它建立一种更可持续的增长范式。以单位有效任务为尺度,以产业增值为目标,以标准、技术和生态协同为支撑,Token经济方能从规模扩张真正迈向质量跃升,为智能经济的高质量发展注入源源不断的持久动力。(赵雨 作者系漕河泾天罡人工智能研究院执行院长、博士)
