大模型
LLM,VLM,模型
李飞飞团队50美元训练出DeepSeek R1?
近期,一则关于“50美元蒸馏出DeepSeek R1模型”的新闻引发了广泛关注,甚至被认为对OpenAI和英伟达造成了巨大冲击。然而,深入研究相关论文后发现,这种说法存...
百度点亮自研万卡集群,大模型应用拐点加速到来
DeepSeek是一款以较少GPU芯片和低成本实现高性能的国产大模型,其迅速获得包括百度在内的主流云厂商支持。2月3日,百度智能云千帆平台正式上线DeepSeek-R1和D...
DeepSeek辟谣:任何非官方账号、个人账号发布的信息均不代表公司观点|钛媒体AGI
DeepSeek近期针对仿冒账号和不实信息的传播发布了官方声明,明确指出与DeepSeek有关的信息应以官方账号发布为准,并提醒公众注意甄别。官方账号仅限于微信公...
SemiAnalysis万字解析DeepSeek:训练成本、技术创新点、以及对封闭模型的影响
Semianalysis的分析报告对DeepSeek进行了全面分析,揭示了其在AI领域的多项关键成就和战略布局。报告指出,DeepSeek拥有约5万块Hopper GPU,总投资超过5亿美...
a16z发布2025 AI语音图谱:语音将成为与AI交互的主要模式
语音AI技术的发展正从基础设施层向应用层过渡,为企业和消费者带来革命性的改变。企业通过AI技术替代人工,实现成本效益、速度和可靠性的提升,同时打破传统...
OpenAI 的 Agent 路线图:Operator 和 Deep Research 之后卷什么?
OpenAI 在 2025 年初通过发布 Operator 和 Deep Research 两款产品,标志着 AGI 第三层 -Agent 时代的到来。这些产品展示了 AI 在任务执行和信息处理方面的潜...
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
近期,斯坦福大学教授李飞飞及其团队推出了S1模型,随后李飞飞的学生、OpenAI早期成员及前特斯拉AI总监发布了一段3小时长视频,详细介绍了AI大模型的进化历程...
英伟达、英特尔和 AMD, 联手投出一家「芯片独角兽」
光学互连技术正在成为人工智能和高性能计算领域解决数据传输瓶颈的关键方向。Ayar Labs 是一家致力于开发光 I/O 解决方案的初创公司,其核心技术结合了 TeraP...
观点博弈:我们还应该期待AGI吗?
本文探讨了大型语言模型(LLMs)规模扩大对实现人工通用智能(AGI)的影响。文章通过虚构的坚信者和质疑者之间的辩论,分析了规模扩大的有效性和潜在挑战。质...
16张H100训26分钟,超越o1-preview!李飞飞等用1K样本,揭秘测试时Scaling
提升大模型推理性能通常依赖于大量数据和算力,但李飞飞团队提出了一种新方法,仅使用1000个样本进行微调,并引入预算强制技术(budget forcing),在测试时...