AI大狗
已收录一千多项AI工具
返回资讯资讯详情
AI进入算账时代:Token成本战背后,电力成为终极博弈

AI进入算账时代:Token成本战背后,电力成为终极博弈

点击查看原文>

2026-06-30AI大狗3 分钟阅读12718128 阅读热度 759行业动态大模型智能硬件
01

导读

过去一年,国产大模型价格战打得火热,DeepSeek、通义千问、智谱、MiniMax等厂商将Token调用价格拉至新低。然而,优刻得董事长兼CEO季昕华在接受InfoQ采访时直言,表面上是模型厂商的竞争,底层却是电力、土地、机柜、制冷、GPU调度等全链条的成本博弈。AI正从“要不要用”进入“算不算得过来账”的新阶段。

AI进入算账时代:Token成本战背后,电力成为终极博弈閰嶅浘1

季昕华表示,当前企业老板最关心的三件事是:如何让员工用上并用好AI、如何降低持续攀升的成本、如何真正提升效率。这标志着企业不再拒绝AI,而是开始精打细算每一笔投入。

02

Token的终局是电力

优刻得副总裁刘杰回忆,2017年筹划乌兰察布数据中心时,AI尚未爆发,当时主要考虑CPU业务。选择乌兰察布并非偶然:电价低廉、苹果要求100%绿电(内蒙古有条件实现)、气候寒冷利于降低PUE,且距离北京近,网络时延和人员往来都便利。这些因素在云计算时代已很重要,在AI时代则成为核心竞争力。

季昕华指出,Token降本的终局是电力——电便宜,Token就便宜。以一台功耗约6.5千瓦的国外顶级服务器为例,每台搭载8张GPU卡,千卡集群需125台服务器,仅服务器年耗电就十分惊人,再乘以PUE系数才是数据中心总用电。因此,数据中心选址、电价、PUE、高功率机柜直接决定Token成本。

传统IDC行业关注“柜子数量”,但AI时代需要高功率机柜。优刻得青浦数据中心约42亩地、设计5000个机柜;乌兰察布园区约212亩地、设计12000个机柜。普通机柜无法容纳多台高功耗GPU服务器,液冷单机柜可达35千瓦,需专门改造电路和散热系统。这导致传统低功率数据中心出现空置,而高功率数据中心供不应求——季昕华透露,优刻得新建数据中心尚未开建已有订单签约。

03

降本五方向:从模型选择到组织管理

季昕华给出了降低Token成本的五个具体方向。首先,使用国内模型。DeepSeek、智谱、MiniMax等国产模型在价格上具有明显优势,并非所有任务都需要调用最贵最强的模型,80分的模型若成本更低,就是更现实的选择。

其次,从技术上提高“每度电产生的Token数量”。这要求提升GPU利用率、推理框架效率、模型部署、网络通信和存储读写能力,将成本问题拉回到基础设施效率上。

第三,选择合适的数据中心位置。乌兰察布适合训练及覆盖北方推理需求,上海青浦则适合华东地区对时延敏感的业务(如金融、汽车),这对应了“东数西算”的分工逻辑:按任务类型拆分算力布局。

第四,模型组合。不同模型能力边界不同,企业不应试图用一个模型解决所有问题。未来合理的方式是将任务拆解,让不同模型处理各自擅长的部分,甚至由平台自动选择模型。一个复杂任务中,真正需要顶级模型的部分可能仅占20%,其余可交给更便宜、更快的模型。

第五,Prompt管理与工程。许多企业一边抱怨AI成本高,一边未建立内部使用规则。员工提问方式、模型调用、模板复用、重复调用等都会影响Token消耗。季昕华强调,让员工按规则用好Token是降本的重要手段。

04

企业治理的新命题

季昕华透露,优刻得内部每天都会查看AI使用报告,包括员工使用人数、花费金额和应用场景。Coding是最大用量场景,查询、PPT等也在增长。但最大难题是如何衡量投入产出。AI工具铺开后,会出现员工摸索效果不稳定、个人使用挤占业务资源、提效评估困难等情况。优刻得正开发产品,帮助企业分析员工使用AI是否服务于公司业务及效率高低。

Token需求不会只是一次热闹。SaaS时代按账号付费,越活跃越有价值;AI时代却用得越多成本越高。如果缺乏治理体系,老板推动AI可能反而推高成本。季昕华总结,Token降本的第一层答案是选对地方、压低电力成本、优化PUE、建设高功率机柜;更深层则涉及模型选择、技术优化、组织管理——这是一场贯穿“电力—算力—模型—应用—组织”的系统工程。

文章来源:https://aidadog.com/news/ai/ydewsui5dj30esn02m4j2d1f

同类推荐

继续阅读

查看更多