VideoStance
全部话题
全部视频
← 国产大模型横评
上下文长度能力
国产大模型横评 · 子话题 4
共识较强
长上下文能力在多轮复杂任务中表现更好
AI随风随风
直男山禾
可信度:中
视角多元
DeepSeek V4 Pro百万上下文是否名副其实
观点A:
实际测试只能阅读《红楼梦》前19%
猜测因算力紧张限制了官网上下文长度
直男山禾
观点B:
百万上下文在多轮测试中表现良好
小诺称其开启max思考时可达Claude Opus 4.5水平;AI随风随风表示大上下文模型不易触发对话压缩
圣徒城的小诺
AI随风随风
编辑分析:
如果你的应用场景真正需要处理超长文档,建议先小规模实测目标模型的实际可用上下文长度,官方宣称与实测可能有差距
独家观察
Kimi K2.7 Code上下文窗口仅256K,远小于竞品1兆,可能是K3前置模型
提示Kimi可能即将发布大更新,当前版本是过渡产品
AI随风随风
豆包在长文本测试中直接死机
具体失败案例,对需处理长文档的用户有警示意义
直男山禾