DeepSeek R1 催化了 reasoning model 的竞争:在过去的一个月里,头部 AI labs 已经发布了三个 SOTA reasoning models:OpenAI 的 o3-mini 和deep research, xAI 的 Grok 3 和 Anthropic 的 Claude 3.7 Sonnet。随着头部 Al labs 先后释出自己的 reasoning model ...
确信无疑了,deepseek的模型结构进一步发扬光大,kimi 2.5 作为ds v3继承者 base model做的也扎实,让老外也开始抄。 回想之前的厂,来之前训自己的moe基座,训不过deepseek-v2,直接quit了,后续直接在v2上sft, 也在在Qwen 72B模型RL; 那个时候对于很多公司在开源模型上sft、continue ...