认同价格与性价比
Step 3.5 Flash 推理速度极快,token 速度可达 200-400 token/秒,适合密集 Agent 任务。
博主指出其速度优势让它成为国内最快的模型公司,并在 Open Router 上免费用量达榜一。
来源:2026上半年大模型盘点:选对你的AI底座不认同价格与性价比
Claude 4.7 中文表达能力显著减弱,指令遵循不如 4.6 稳健,且换用新 tokenizer 导致消耗增加,变相涨价约 35%。
博主指出其类似 GPT 蒸馏的机械感,加上变相涨价,口碑大幅下滑。
来源:2026上半年大模型盘点:选对你的AI底座中立价格与性价比
Kimi K 2.6 主打 agent 集群,但在实际开发中被 GLM-5.1 拉开差距,仅在画图和前端上仍有优势。
博主认为其 agent 集群功能使用度不高,编程不如 GLM-5.1 稳定。
来源:2026上半年大模型盘点:选对你的AI底座中立价格与性价比
DeepSeek V4 首次具备百万上下文,开启 max 思考时能达到 Claude Opus 4.5 的稳定交付水平,但未达到 4.6。
博主称其没有多模态,复杂问题上不及 4.6,但价格极低,被动缓存命中率超 93%,成本优势巨大。
来源:2026上半年大模型盘点:选对你的AI底座认同价格与性价比
MiniMax M3 发布后,前端能力可达 Claude Opus 4.6-4.7 之间水平,编程在 GLM-5 到 5.1 之间,成为多功能小水桶。
博主认为其拥有原生多模态和百万上下文,知识密度高,token plan 调整后获得好评。
来源:2026上半年大模型盘点:选对你的AI底座中立价格与性价比
GLM-5.2 编码能力进一步提升,可与 Claude 4.7 较量,但推理时间极长,通过时间换准确率。
博主肯定其编码国产领跑,但指出无多模态且推理慢,成本不敏感时推荐国外模型。
来源:2026上半年大模型盘点:选对你的AI底座中立价格与性价比
当前编程能力榜单上,国外模型仍领头,GLM-5.2 是唯一冲到前列的国产模型。
博主总结榜单情况,指出 Cloud Fibo 5 被禁,MiniMax M3 和 V4 Pro 也上榜。
来源:2026上半年大模型盘点:选对你的AI底座中立价格与性价比
海外模型 API 输出价格昂贵,如 Claude Sonnet 4.6 每百万输出超百元,最便宜的 Haiku 也需三十多元。
博主引用价格数据,说明纯 API 直用成本高,与国内模型形成对比。
来源:2026上半年大模型盘点:选对你的AI底座中立价格与性价比
海外模型想要获得良好体验,每月订阅中高档套餐需要 100-200 美元(约 500-1400 元)。
博主统计了 Anthropic、OpenAI、Google 的订阅档次,给出价格区间。
来源:2026上半年大模型盘点:选对你的AI底座中立价格与性价比
隐性涨价(如修改 tokenizer、压缩 token plan 用量)已成为行业常态。
博主列举 Claude、Google、GLM、MiniMax 等案例,认为推理成本上升导致厂商普遍如此。
来源:2026上半年大模型盘点:选对你的AI底座认同价格与性价比
成本敏感的开发环境推荐使用 DeepSeek 或 GLM/Mimo 的 coding plan,因其极低价格和够用的量。
博主建议成本优先时用 DeepSeek 或国产 coding plan,必要时灵活切换。
来源:2026上半年大模型盘点:选对你的AI底座认同价格与性价比
质量敏感的开发者应使用 Claude 4.8/Fibo 5 + Claude Code 或 GPT-5.5 + Codex CLI 的组合。
博主认为这是当前没有疑问的最佳组合,适合不计成本但要求高质交付的场景。
来源:2026上半年大模型盘点:选对你的AI底座