标签：准确率提升

新研究揭示DeepSeek/o3弱点：频繁切换思路放弃正确方向，最短答案往往就是对的！

最新研究揭示了推理大模型在面对高难度问题时可能表现出的“欠思考”现象，即频繁切换解题思路而缺乏深入探索。这一现象在解决数学竞赛题等复杂任务时尤为明显...

AIGC动态

3个月前

谷歌发布新RL方法，性能提升巨大，o1模型已证明

在AIGC领域，大语言模型（LLM）的自我纠错能力一直是研究的重点。谷歌DeepMind的研究人员开发了一种名为SCoRe的多轮强化学习方法，旨在提升大模型在数学和代...

AIGC动态

7个月前

谷歌最新发布Med-Gemini多模态医学大模型，科研与临床诊疗落地的鸿沟

Med-Gemini是基于Gemini 1.0和1.5模型的进一步发展，它在10项基准测试中取得了最先进的性能。研究人员使用了自我训练与网络搜索集成、多模态微调和定制编码器...

AIGC动态

12个月前