Blog
GEB的AI沉思录
这里记录我对 AI 的一些观察、判断和阶段性理解,也会整理值得反复回看的知识点, 分享给同样在学习和实践中的人。
DeepSeek-V4:百万上下文的工程答案
DeepSeek-V4 技术报告 百万上下文的工程答案 DeepSeek-V4 的重点不是单纯把上下文窗口拉长,而是把 长上下文的计算、缓存、训练和服务成本 一起压下来。 换成论文里的原词,它是在为 ...
这里记录我对 AI 的一些观察、判断和阶段性理解,也会整理值得反复回看的知识点, 分享给同样在学习和实践中的人。
DeepSeek-V4 技术报告 百万上下文的工程答案 DeepSeek-V4 的重点不是单纯把上下文窗口拉长,而是把 长上下文的计算、缓存、训练和服务成本 一起压下来。 换成论文里的原词,它是在为 ...