标签:成本效益
SemiAnalysis万字解析DeepSeek:训练成本、技术创新点、以及对封闭模型的影响
Semianalysis的分析报告对DeepSeek进行了全面分析,揭示了其在AI领域的多项关键成就和战略布局。报告指出,DeepSeek拥有约5万块Hopper GPU,总投资超过5亿美...
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
OpenAI最近推出了新的推理模型系列o3-mini,这是其推理模型系列中最新、最具成本效益的模型,相比之前的o1系列,成本降低了15倍。o3-mini的推出引起了广泛关...
DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声
DeeSeek R1的问世在硅谷引起了巨大震动,其技术突破得到了奥特曼和OpenAI首席研究官Mark Chen的认可。DeeSeek R1以其低成本和高性能的特点,挑战了硅谷对AI的...
中国DeepSeek的惊艳,或利空英伟达
美国对中国的芯片出口限制意外地推动了中国人工智能开发商在技术上超越美国竞争对手。这一现象展示了初创公司在资源受限的情况下往往能够激发出更多的创新。...
确认了!o3-mini几周内发布,奥特曼表示AGI只需872兆瓦计算功率
OpenAI和Anthropic等前沿大模型公司可能已经训练出了下一代大模型,但由于成本过高,短期内不会发布。为了满足用户期待,这些公司可能会不断推出基于下一代大...
把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek“国产之光”实至名归?
中国AI初创公司DeepSeek发布了其最新人工智能模型DeepSeek-V3的首个版本,并宣布开源。该模型能够处理多种基于文本的工作负载和任务,包括编码、翻译和撰写论...
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开
DeepSeek V3,一个参数量为671B的MoE模型,已全面开源。该模型在14.8T高质量token上进行了预训练,激活37B参数,并在多项测评中达到开源SOTA,超越了Llama 3....
英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了
英伟达近期推出了AI芯片领域的新核弹——GPU新核弹B300和附带CPU的超级芯片GB300。这两款产品在算力和显存方面相比前代B200有显著提升,FLOPS提高50%,显存从19...
OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题
OpenAI最近推出了其下一代推理模型o3,这是一个在多个领域刷新了现有最佳性能(SOTA)的模型。o3在数学、编程和软件工程等领域的表现超越了前代o1,特别是在A...
OpenAI狂打“骨折价”的一天:暴降成本开放全新o1,实时 API 全面降价 60%
近期,OpenAI和谷歌在人工智能领域展开了激烈的竞争。OpenAI推出了一系列针对开发者的新功能和升级,包括API中的OpenAI o1模型,该模型支持函数调用、开发人...
1
2