标签:推理模型
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名AI研究者Sebastian Raschka基于DeepSeek技术报告,系统阐述了增强大语言模型推理能力的四大核心方法。_推理模型被定义为擅长处理需要多步骤中间推导的复...
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
通过蒸馏技术,研究团队成功训练出一个性能可媲美DeepSeek-R1和OpenAI o1的推理模型s1,其成本不到150元人民币。这一成果由李飞飞、斯坦福大学、华盛顿大学及...
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
OpenAI最近推出了新的推理模型系列o3-mini,这是其推理模型系列中最新、最具成本效益的模型,相比之前的o1系列,成本降低了15倍。o3-mini的推出引起了广泛关...
首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了
OpenAI最近发布了o3-mini系列推理模型,旨在推动低成本推理的边界。该系列包含三个版本:low、medium和high,其中o3-mini和o3-mini-high已上线。o3系列模型针...
超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱
ETH Zurich等机构的研究人员提出了推理语言模型(RLM)的蓝图,旨在克服最先进RLM的高昂成本和专有特性带来的可访问性和公平性问题。RLM被视为AI领域的革命性...
DeepSeek的提示词技巧,就是没有技巧。
DeepSeek-R1是由中国公司深度求索开发的AI大模型,其背后的支持者为量化私募幻方基金。自2023年7月17日成立以来,深度求索陆续发布了多个AI大模型,包括DeepS...
Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品
中国人民大学和清华大学联合推出了名为Search-o1的最新Agentic搜索增强推理模型框架,该框架在博士级别的科学问答、数学和代码能力的11项评测中表现出色,赢...
刚刚,阶跃星辰发布Step R-mini!推理模型从此不再文理偏科
阶跃星辰发布了其Step系列模型家族的首个推理模型——Step Reasoner mini(Step R-mini),标志着国内推理模型领域的一大进展。Step R-mini擅长规划、尝试和反...
讯飞星火X1数学碾压o1封神,首个全国产算力推理王者诞生!多指标国内TOP 1
科大讯飞最近发布了国内首个全国产算力深度推理模型——讯飞星火深度推理大模型X1。该模型在《通用认知智能大模型测评体系》指导下构建的测试集CogNKLab-MathEv...
OpenAI员工在推特上,像极了上班的你
OpenAI近期发布了其旗舰推理模型o3和o3-mini,标志着公司2024年的收官。此次发布在Twitter上引发了广泛讨论,特别是OpenAI员工的积极参与,几乎全员出动为公...