文章阅读

不该被 GPT-5.5 淹没的 DeepSeek V4

背景故事

最近我在 GPT-5.5 的辅助下复习计算机相关知识,它的实力让我深受震撼。之前 GPT-5 系列模型给我的感觉是“不够有人味”,但 5.5 明显改变了这种印象。相信很多小伙伴和我一样,这段时间都开始重新追捧 GPT:Image 2 直接断层式领先其余文生图模型,GPT-5.5 同样展现出 LLM 之王的水准。

记得当时,GPT-5.5 在北京时间 2026 年 4 月 24 日凌晨横空出世,而 DeepSeek V4 则在北京时间 2026 年 4 月 24 日中午发布。这是 DeepSeek 团队在沉寂半年之久后交出的又一份答卷。

DeepSeek 的发布文章里,拿来对比的模型大多是海外 AI 公司的上一代产品。毋庸置疑,DeepSeek V4 无法胜过 GPT-5.5,但它的价值与贡献不应被 GPT-5.5 的光芒掩盖。

我看好的 DeepSeek 能力

1、1M 上下文,召回能力能打

Context Arena 上 DeepSeek Pro 模型表现能打

在 Context Arena 上下文竞技场榜单中,DeepSeek V4 Pro 模型在 128K 上下文压力测试下的召回能力位居国产开源模型第一。

为啥这很重要?你给模型布置一个任务,再让模型借助 OpenCode 等工具执行。任务执行越久、上下文越长,模型就越容易忘记前文内容,最终效果也更可能偏离用户预期。

2、国产乃至全球开源模型中,参数规模第一

虽然这几年受算力等因素限制,国内不少团队,包括阿里 Qwen 团队,都在研究小模型,并不断把小模型性能推向极致。但真正有望实现 AGI、持续提升模型能力的有效路径,依旧是把模型做得更大、更高效。DeepSeek 这一次将 V4 Pro 的总参数量直接提升到 1.6T,是 R1 模型的 2 倍多,这能确保模型具备更充足的世界知识。

3、…

还有许多我未曾发现的亮点,网友们有新见解可以在评论区补充。

我个人使用 DeepSeek V4 Pro 模型的体验

昨天开了 Kimi 的最低档会员,搭配官方 Kimi CLI 来进行数据预处理。

预处理效果与 Claude Code 搭配 Opus 模型、Codex 搭配 GPT-5.5 模型相比仍有差距。而且 Kimi K2.6 模型的上下文只有 256K,就算给了较好的提示,依旧没能剔除一些显而易见的噪声。

于是今天充值了 50 块的 DeepSeek API,搭配 OpenCode 来给 Kimi 收个尾。一开始处理结果并不如人意,于是我暂停了 OpenCode 中的执行,指导它完整读一篇、预处理一篇。最终,DeepSeek V4 Pro 在 OpenCode 的加持下,较好地完成了我布置的扫尾任务。

DeepSeek V4 Pro 在 OpenCode 的加持下,较好地完成了我布置的扫尾任务

后续我又让它继续处理一些数据预处理相关任务,效果也让我较为满意。

DeepSeek V4 Pro 进行数据预处理

总结

DeepSeek V4 Pro 模型在 Web 端或客户端上的体验不如豆包丝滑,功能也没有豆包全面,但在 API 调用场景下完成任务还算出色。

临近五一期间,DeepSeek API 价格打骨折,性价比十足。

临近五一期间,DeepSeek 打骨折

目前 DeepSeek 处于帕累托前沿,模型能力强又便宜。如果你预算较为有限,同时又想确保模型能力,它是不错的选项。

DeepSeek 处于帕累托前沿

虽然性能不及最新的 GPT-5.5 等模型,但贵在开源、便宜,并且加速了 AI 平权。Gemini 等模型的参数量远大于 DeepSeek,DeepSeek 目前打不过最顶尖的模型并不意外,但它的贡献值得人们称赞。

DeepSeek 团队低调内敛,不诱于誉,不恐于诽,率道而行,端然正己,秉持长期主义。这种态度比 OpenAI 的 Sam Altman 式炒作、Anthropic 捂着 Mythos 炒作要好太多了。

低调的 DeepSeek

我读研时,研二(2024 年下半年到 2025 年),R1 还没出,处理数据我就用的它家,便宜、不限制并发、性价比最高!

看好 DeepSeek。小蓝鲸每一次搅动,都是对开源 AI 的进一步推进。DeepSeek 站在历史正确的一边,期待未来它带给我们更多惊喜。

小蓝鲸每一次搅动,都是对开源 AI 的进一步推进

← 上一篇: 当AI开始研究如何“对齐”自己,我们该警惕什么?
下一篇: 先 docker compose down 再 up -d,还是直接 up -d?读完官方文档终于搞懂了 →

评论