标签:性能提升

OpenAI深夜上线o3满血版和o4 mini – 依旧领先。

OpenAI在直播中正式发布了o3和o4-mini模型,取代了之前的o1、o3-mini和o3-mini-high。ChatGPT Plus、Pro和Team用户从即日起可以在模型选择器中看到这些新模型...

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域,学术界和工业界在探索模型推理性能提升的过程中,提出了一个核心问题:什么方法有效,什么方法无效?近期研究...

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

澳大利亚国立大学的研究团队提出了一种全新的图像生成模型ARINAR,该模型在生成质量和速度上均取得了显著提升。ARINAR全称为双层自回归逐特征生成模型,其核...

多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%

近年来,DeepSeek R1、OpenAI o1/o3等大语言模型在数学和编程领域的推理能力取得显著进展,但在国际数学奥林匹克竞赛(IMO)组合问题、抽象推理语料库(ARC)...

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席

OpenAI的最新模型GPT-4.5已经发布,这是一个规模更大、知识储备更丰富的模型,其特点在于高情商和类人交互。GPT-4.5向ChatGPT Pro版用户和付费开发者开放,但...

刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1

Anthropic发布全球首款混合推理模型Claude 3.7 Sonnet,该模型通过独特的双模式架构实现了即时响应与深度思考的融合。在扩展思考模式下,模型通过自我反思机...

超过DeepSeek、o3,双思维模型Claude 3.7来了

著名大模型平台Anthropic推出的Claude 3.7 Sonnet首次引入双思维模式,通过标准与扩展两种思考机制实现差异化响应。标准思考模式适用于即时问答场景,例如直...

Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了。

Claude 3.7 Sonnet作为Claude家族首个具备推理能力的模型正式发布,其混合推理架构引发行业关注。该模型通过下拉菜单实现普通模式与扩展模式的无缝切换,普通...

DeepSeek最新论文解读:NSA,物美价廉的超长上下文方案

DeepSeek最新提出的原生稀疏注意力(NSA)机制解决了传统稀疏注意力技术在训练与推理阶段的割裂问题。传统方法通常只能在推理阶段应用稀疏注意力,导致模型能...

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好

OpenAI的GPT-4o近期进行了版本更新,在大模型竞技场中与DeepSeek-R1并列第一,并在多个单项评测中表现突出。除数学能力排名第六外,其在创意写作、编程、指令...
1 2 3 15