同理,在 AI 世界里,DeepSeek 就是那台效率更高的发动机,而算力就是汽油,单辆车的耗油量变低了,整个市场的汽油用量却会增多。
要知道,DeepSeek-R1 虽然训练成本低,但也是遵循 Scaling Law ( 规模扩展法则 )的。
在 Scaling Law 之下,我们可以简单粗暴地把模型表现和算力需求看成一个 y=ax 的正相关函数,过去的模型的斜率 a 相对较小( 效率相对较低 ),模型表现虽然会随着算力的加大而变得更好,但是增长较慢。DeepSeek 的斜率 a 则相对较大( 效率相对较高 ),模型表现随算力加大而表现变得更好的速度会更快。