
5 月 27 日,小米晓谕 MiMo-V2.5 系列大模子 API 价钱体系进行永久性调价,最高降幅度达 99%,且不再划分高下文长度。
具体来看 MiMo-V2.5-Pro:
百万 tokens 输入(缓存射中)只需要 0.025 元。
百万 tokens 输入(缓存未射中)3 元。
百万 tokens 输出 6 元。
不仅如斯,Token Plan 方面,小米罗致"加量不涨价"政策,用户在 Agent 或 Code 场景下的可用 Token 数目将晋升至原本的 5-8 倍,并把律例调理为"所见即所得",简化了因换算导致的复杂计价逻辑。
这是继 DeepSeek 上周晓谕 V4-Pro 永久降价至原价 25% 之后,国内头部大模子在短短一周内的又一次重磅价钱调理。
国际比拟看,DeepSeek 与小米的最新订价已显赫低于主流国外厂商。
国际主流模子方面,OpenAI GPT-4o 的标准输入价钱为每百万 Tokens 2.5 好意思元,输出价钱为 10 好意思元;Claude Sonnet 4.6 的输入为每百万 Tokens 3 好意思元,输出为 15 好意思元。
2026FIFA世界杯中国比分网与粗浅的"烧钱"不同,小米这次降价的逻辑指向工程层面的资本结构优化。
据小米阐扬,基于 SGLang HiCache 齐全维持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量裁汰至优化前的近 1/7,九游体育(NineGameSports)官网并将可缓存 token 数目晋升至优化前的近 5 倍,显赫晋升了缓存射中率和推理后果。此外,小米还通过优化群众决策、输入长度分桶政策等技巧,进一步晋升集群输入隐隐智商。
这与 DeepSeek 的降价逻辑有始有卒,齐是通过架构更正以及推理系统的工程化优化,结构性地压低单元 Token 奇迹资本,再将红利让渡给开荒者。
从行业情况来看,本轮国产大模子降价潮亦是伴跟着诈欺方需求的变化,跟着大模子正在从"聊天"进入"干活"的阶段,真确让开荒者和企业用户狂躁的也不再仅仅一次问答金额,而是 Agent 在多轮推理、调用和自动化资本使命流等经由中执续点火的 Token。
当百万 Tokens 价钱被禁止压低,国内大模子的竞争也会链接向卑劣传导。关于开荒者来说,资本着落意味着更多 Agent 等诈欺供给会迎来井喷;关于厂商来说,廉价背后则是更高的推理后果、更强的算力移动智商,以及更长周期的生态插足。
价钱战偶然能径直决定谁的模子最强九游体育(NineGameSports)官方网站,但不错鼓动其更快地被开荒者调用,小米 MiMo 此时大幅降价恰是国内大模子走向"限度化使用"的又一个注脚。


备案号: