国产大模型横评

局部模型/特定场景评价

国产大模型横评 · 子话题 7

共识较强
腾讯混元/元宝在大模型评测中整体表现差,多项垫底
豆包日常对话够用但开发编程不推荐
千问开源小模型(如27B)表现优秀,适合本地部署
视角多元
小米MiMo是否有自主大模型技术能力
观点A小米MiMo是国产首个支持多模态和超大上下文的模型,具有里程碑意义
肯定其颠覆性,为国产打开先河
观点BMiMo V2.5能力不足,疑似缺乏自主技术
水部员外郎称其输出胡言乱语模仿痕迹明显;直男山禾称其能力不强但价格极便宜
编辑分析:小诺的评价聚焦历史意义(先河),水部员外郎和直男山禾关注实测表现。如果你看重生态创新,MiMo值得关注;如果追求实际可用性,目前建议谨慎选择
独家观察
豆包App国内C端月活第一远超竞争对手,但闭源策略削弱开发者生态
揭示了豆包在消费者市场的统治地位与其技术开放度之间的矛盾
美团LongCat模型带有明显蒸馏痕迹,缺乏自有技术特色
评价了一个其他博主未覆盖的大厂模型
小红书大词典LAM模型应用入口有限,存在感低
提供了非主流厂商AI布局的独家观察