大模型

LLM,VLM,模型

DeepSeek+华为芯片!“卷王”硅基流动交出DeepSeek推理国产方案,持平英伟达们

DeepSeek在全球AI市场迅速崛起,上线18天下载量达1600万次,成为140个市场下载量最高的应用。作为首个支持联网的开源推理模型,DeepSeek以免费策略吸引用户,...

为什么说DeepSeek的R1-Zero比R1更值得关注?

DeepSeek发布的R1-Zero和R1两个模型在ARC-AGI-1上的得分与OpenAI的o1系统低计算量版本相当,显示出纯LLM scaling的局限性。R1-Zero特别值得关注,因为它完全...

o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭

OpenAI的最新模型o3-mini在AI领域取得了显著进展,其性能在多个基准测试中超越了DeepSeek R1。o3-mini在数学代码基准测试中取得了最高成绩,并在物理模拟挑战...

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025年初,中国团队DeepSeek在全球AI领域引起广泛关注,他们仅用2048张H800 GPU在两个月内训练出一个与全球顶尖水平相媲美的AI模型,这一成就不仅挑战了英伟...

寡头化的硅谷公司们想让DeepSeek迅速变成下个TikTok

DeepSeek的连续发布V3和R1版本在美国市场引起了巨大反响,被视为比OpenAI-英伟达-stargate模式更高效的新方法,引发了中美竞争的讨论。OpenAI调整了o系列模型...

硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了

OpenAI和Anthropic对DeepSeek的指控引起了广泛关注。OpenAI声称DeepSeek侵犯了其知识产权,通过模型蒸馏技术,即利用大模型的输出来提升小模型性能,以低成本...

OpenAI称有DeepSeek「偷窃」证据?美军已发起攻击!Anthropic CEO喊话加强芯片管制

美国方面近日对DeepSeek提出多项指控,指责其“偷窃”数据。特朗普的AI事务主管David Sacks声称有“确凿证据”显示DeepSeek利用OpenAI模型数据开发技术,微软研究...

DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉

DeepSeek-R1推理模型以其出色的性能和较低的训练成本,在AI竞技场中与OpenAI的o1模型和o1 Pro模型展开激烈竞争。在科技媒体arstechnica资深编辑的对比测试中...

预训练时代走向终结,然后呢?| 对话AMD首席工程师、Nexa AI联创

近日,DeepSeek发布了Janus-Pro多模态模型系列,声称其图像生成能力超越了OpenAI的DALL-E 3、Google的Emu3-Gen和Stability AI的Stable Diffusion XL等领先产...

五角大楼90天AI计划启动!美国将AI用在现实军事场景,开发作战原型

美国五角大楼启动了一项90天的AI计划,旨在评估生成式人工智能在现实军事场景中对抗高科技对手的潜力,特别是针对中国的战略竞争。这一行动标志着美国在国防...
1 15 16 17 18 19 477