DeepSeek 代表着一次重大飞跃。大多数新的人工智能模型感觉都像是小步前进。DeepSeek R1则不同。这是近来第一个让你停下来思考的模型,这可能很重要。
上周日,中国的一个团队发布了该模型,并已引起轰动。其基准在推理任务(数学、编码和科学)方面接近 OpenAI 的 01 模型。但有趣的不仅仅是数字。而是他们如何达到这一水平。
DeepSeek R1背后有三个关键思想:
- 思路链——让模型自我解释。
- 强化学习——让它自我训练。
- 蒸馏——在不损失功率的情况下缩小体积。
思绪之链
如果你向大多数人工智能模型提出一个难题,它们会给你答案,但不会给出背后的原因。这是一个问题。如果答案是错误的,你不知道它在哪里偏离了轨道。
Chain of Thought 解决了这个问题。模型不会直接给出答案,而是逐步解释其推理过程。如果模型出错了,你可以准确地看到错误出在哪里。更重要的是,模型本身也能看到错误出在哪里。
这不仅仅是一个调试工具。它改变了模型的思维方式。解释的行为迫使他们放慢速度并检查自己的工作。即使没有额外的训练,他们也能得到更好的答案。