标签:RL范式

对DeepSeek和智能下半场的几条判断

DeepSeek的出现推动了AI行业进入新范式,尽管其并未完全超越第一梯队厂商如OpenAI、Anthropic和Google,但通过开源强化学习(RL)和推理模型的核心技术,极大...