不该被 GPT-5.5 淹没的 DeepSeek V4

背景故事

最近我在 GPT-5.5 的辅助下复习计算机相关知识，它的实力让我深受震撼。之前 GPT-5 系列模型给我的感觉是“不够有人味”，但 5.5 明显改变了这种印象。相信很多小伙伴和我一样，这段时间都开始重新追捧 GPT：Image 2 直接断层式领先其余文生图模型，GPT-5.5 同样展现出 LLM 之王的水准。

记得当时，GPT-5.5 在北京时间 2026 年 4 月 24 日凌晨横空出世，而 DeepSeek V4 则在北京时间 2026 年 4 月 24 日中午发布。这是 DeepSeek 团队在沉寂半年之久后交出的又一份答卷。

DeepSeek 的发布文章里，拿来对比的模型大多是海外 AI 公司的上一代产品。毋庸置疑，DeepSeek V4 无法胜过 GPT-5.5，但它的价值与贡献不应被 GPT-5.5 的光芒掩盖。

我看好的 DeepSeek 能力

1、1M 上下文，召回能力能打

Context Arena 上 DeepSeek Pro 模型表现能打

在 Context Arena 上下文竞技场榜单中，DeepSeek V4 Pro 模型在 128K 上下文压力测试下的召回能力位居国产开源模型第一。

为啥这很重要？你给模型布置一个任务，再让模型借助 OpenCode 等工具执行。任务执行越久、上下文越长，模型就越容易忘记前文内容，最终效果也更可能偏离用户预期。

2、国产乃至全球开源模型中，参数规模第一

虽然这几年受算力等因素限制，国内不少团队，包括阿里 Qwen 团队，都在研究小模型，并不断把小模型性能推向极致。但真正有望实现 AGI、持续提升模型能力的有效路径，依旧是把模型做得更大、更高效。DeepSeek 这一次将 V4 Pro 的总参数量直接提升到 1.6T，是 R1 模型的 2 倍多，这能确保模型具备更充足的世界知识。

3、…

还有许多我未曾发现的亮点，网友们有新见解可以在评论区补充。

我个人使用 DeepSeek V4 Pro 模型的体验

昨天开了 Kimi 的最低档会员，搭配官方 Kimi CLI 来进行数据预处理。

预处理效果与 Claude Code 搭配 Opus 模型、Codex 搭配 GPT-5.5 模型相比仍有差距。而且 Kimi K2.6 模型的上下文只有 256K，就算给了较好的提示，依旧没能剔除一些显而易见的噪声。

于是今天充值了 50 块的 DeepSeek API，搭配 OpenCode 来给 Kimi 收个尾。一开始处理结果并不如人意，于是我暂停了 OpenCode 中的执行，指导它完整读一篇、预处理一篇。最终，DeepSeek V4 Pro 在 OpenCode 的加持下，较好地完成了我布置的扫尾任务。

DeepSeek V4 Pro 在 OpenCode 的加持下，较好地完成了我布置的扫尾任务