标签：RL范式

对DeepSeek和智能下半场的几条判断

DeepSeek的出现推动了AI行业进入新范式，尽管其并未完全超越第一梯队厂商如OpenAI、Anthropic和Google，但通过开源强化学习（RL）和推理模型的核心技术，极大...

AI-Agent

2天前