Base-Model - 搜索 News

从 R1 到 Sonnet 3.7，Reasoning Model 首轮竞赛中有哪些关键信号？

DeepSeek R1 催化了 reasoning model 的竞争：在过去的一个月里，头部 AI labs 已经发布了三个 SOTA reasoning models：OpenAI 的 o3-mini 和deep research， xAI 的 Grok 3 和 Anthropic 的 Claude 3.7 Sonnet。随着头部 Al labs 先后释出自己的 reasoning model ...

Opinion

知乎 on MSNOpinion

Cursor 被曝「套壳」国产开源模型 Kimi，创始人回应称忘记署名了 ...

确信无疑了，deepseek的模型结构进一步发扬光大，kimi 2.5 作为ds v3继承者 base model做的也扎实，让老外也开始抄。回想之前的厂，来之前训自己的moe基座，训不过deepseek-v2，直接quit了，后续直接在v2上sft，也在在Qwen 72B模型RL；那个时候对于很多公司在开源模型上sft、continue ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

从 R1 到 Sonnet 3.7，Reasoning Model 首轮竞赛中有哪些关键信号？

Cursor 被曝「套壳」国产开源模型 Kimi，创始人回应称忘记署名了 ...

今日热点