推理模型 | 学习AIGC

OpenAI震撼发布o3/o4-mini，直逼视觉推理巅峰！首用图像思考，十倍算力爆表

OpenAI最新发布的满血版o3和o4-mini模型在多个领域展现了卓越的性能，尤其是在视觉推理和工具调用方面实现了重大突破。o3模型首次将图像推理融入思维链，能够...

AIGC动态

3天前

更长思维并不等于更强推理性能，强化学习可以很简洁

著名研究者和技术作家 Sebastian Raschka 解读了一篇来自 Wand AI 的强化学习研究，该研究分析了推理模型生成较长响应的原因。研究发现，推理模型生成较长响...

AIGC动态

5天前

推理AI「脑补」成瘾，废话拉满！马里兰华人学霸揭开内幕

推理模型在解决复杂问题时表现出色，但在面对「缺失前提」（MiP）问题时，往往陷入「过度思考」的困境，导致回答长度激增和计算资源浪费。这种现象被称为「缺...

AIGC动态

5天前

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

Anthropic 的最新研究揭示了大型语言模型在思维链推理中的不可靠性，尤其是在其忠诚度方面。尽管这些模型在表面上展示出复杂的推理过程，但研究结果表明，它...

AIGC动态

2周前

实测豆包刚刚上线的新版深度思考，他们也向DeepSearch迈出了一步。

豆包最新推出的深度思考功能，与传统的推理模型和AI联网搜索有所不同，它将思考与搜索融合在一起，形成了一种更为高效的解决方案。与DeepSeek等平台将深度思...

AI-Agent

3周前

全球首款音乐推理模型Mureka O1首秀！爆改周杰伦，AI音乐进入DeepSeek时刻

昆仑万维发布了全球首款音乐推理大模型Mureka O1，标志着AI音乐进入了“会思考”的时代。该模型基于Mureka V6基座模型，并引入了CoT（Chain of Thought）技术，...

AIGC动态

3周前

腾讯混元、英伟达都发混合架构模型，Mamba-Transformer要崛起吗？

近年来，Transformer架构在自然语言处理领域取得了显著成就，但其计算复杂度和内存占用问题逐渐成为瓶颈。与此同时，Mamba作为一种新兴的状态空间模型（SSM）...

AIGC动态

4周前

英伟达团队发布最新具身模型 Cosmos-Reason1，在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型

英伟达团队在GTC大会上发布了新的物理世界大模型Cosmos-Reason1，该模型专注于提升AI系统与物理世界交互的推理能力。作为Cosmos系列的一部分，Cosmos-Reason1...

AIGC动态

4周前

百度周末发布文心4.5和推理模型X1，已经两周年了啊。

百度最新发布的文心4.5和推理模型X1引起了广泛关注。文心4.5是一个原生多模态模型，能够理解音频、视频和图片，但不具备输出能力。相比之下，X1是一个推理模...

AIGC动态

1个月前

对话阿里国际站总裁张阔：AI能给30万亿美金的产业带来什么？

阿里国际站推出的AI搜索产品Accio，通过深度推理模型，能够为用户生成详尽的商业计划书，并提供采购建议和供应商链接。该产品于3月1日正式上线，展示了其在短...

AI-Agent

1个月前

标签：推理模型

OpenAI震撼发布o3/o4-mini，直逼视觉推理巅峰！首用图像思考，十倍算力爆表

更长思维并不等于更强推理性能，强化学习可以很简洁

推理AI「脑补」成瘾，废话拉满！马里兰华人学霸揭开内幕

思维链不可靠：Anthropic曝出大模型「诚信」问题，说一套做一套

实测豆包刚刚上线的新版深度思考，他们也向DeepSearch迈出了一步。

全球首款音乐推理模型Mureka O1首秀！爆改周杰伦，AI音乐进入DeepSeek时刻

腾讯混元、英伟达都发混合架构模型，Mamba-Transformer要崛起吗？

英伟达团队发布最新具身模型 Cosmos-Reason1，在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型

百度周末发布文心4.5和推理模型X1，已经两周年了啊。

对话阿里国际站总裁张阔：AI能给30万亿美金的产业带来什么？

热门网址

标签：推理模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址