标签:AI模型
为什么说DeepSeek的R1-Zero比R1更值得关注?
DeepSeek发布的R1-Zero和R1两个模型在ARC-AGI-1上的得分与OpenAI的o1系统低计算量版本相当,显示出纯LLM scaling的局限性。R1-Zero特别值得关注,因为它完全...
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
2025年初,中国团队DeepSeek在全球AI领域引起广泛关注,他们仅用2048张H800 GPU在两个月内训练出一个与全球顶尖水平相媲美的AI模型,这一成就不仅挑战了英伟...
OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
近期,AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引,这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能,引发了市场对AI硬件需求...
滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion
DeepSeek最近发布了新模型多模态Janus-Pro-7B,并立即开源。这一新模型在GenEval和DPG-Bench基准测试中超越了DALL-E 3和Stable Diffusion。Janus-Pro-7B基于D...
DeepSeek的提示词技巧,就是没有技巧。
DeepSeek-R1是由中国公司深度求索开发的AI大模型,其背后的支持者为量化私募幻方基金。自2023年7月17日成立以来,深度求索陆续发布了多个AI大模型,包括DeepS...
变天!——由一个惊艳例子引发对 DeepSeek 的 10 条思考
DeepSeek R1模型以其卓越的性能在AI领域引起了广泛关注。该模型在回答关于李世民在玄武门之变后的心理活动的问题时,展现了深入的历史背景理解、复杂的情感分...
创造历史!DeepSeek登顶AppStore,开源竞相复现、Meta 很焦虑
DeepSeek自20日发布以来,其iOS应用下载量超越了ChatGPT官方应用,登顶AppStore。这一成就得到了广泛认可,DeepSeek-R1迅速成为美国顶尖大学研究人员的首选模...
最懂医疗的国产推理大模型,果然来自百川智能
近期,全球AI大模型领域竞争加剧,百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview,具备语言、视觉和搜索推理能力,在多个领域评测中表现优异...
OpenAI微软关系现裂痕,奥特曼紧急公关,导火索竟是DeepMind联创
微软不再是OpenAI的独家云计算供应商,这一变化引发了业界的广泛关注。OpenAI与甲骨文合作建立数据中心,使得微软与OpenAI之间的关系出现裂痕。微软紧急公关...
1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首
谷歌近期发布了Gemini 2.0 Flash Thinking推理模型的加强版,并在Chatbot Arena排行榜上再次登顶。谷歌AI负责人Jeff Dean表示,新版本引入了1M长的上下文,以...