标签:准确率提升
新研究揭示DeepSeek/o3弱点:频繁切换思路放弃正确方向,最短答案往往就是对的!
最新研究揭示了推理大模型在面对高难度问题时可能表现出的“欠思考”现象,即频繁切换解题思路而缺乏深入探索。这一现象在解决数学竞赛题等复杂任务时尤为明显...
谷歌发布新RL方法,性能提升巨大,o1模型已证明
在AIGC领域,大语言模型(LLM)的自我纠错能力一直是研究的重点。谷歌DeepMind的研究人员开发了一种名为SCoRe的多轮强化学习方法,旨在提升大模型在数学和代...
谷歌最新发布Med-Gemini多模态医学大模型,科研与临床诊疗落地的鸿沟
Med-Gemini是基于Gemini 1.0和1.5模型的进一步发展,它在10项基准测试中取得了最先进的性能。研究人员使用了自我训练与网络搜索集成、多模态微调和定制编码器...