大模型

李飞飞团队50美元训练出DeepSeek R1?

近期，一则关于“50美元蒸馏出DeepSeek R1模型”的新闻引发了广泛关注，甚至被认为对OpenAI和英伟达造成了巨大冲击。然而，深入研究相关论文后发现，这种说法存...

AIGC动态

5天前

DeepSeek是一款以较少GPU芯片和低成本实现高性能的国产大模型，其迅速获得包括百度在内的主流云厂商支持。2月3日，百度智能云千帆平台正式上线DeepSeek-R1和D...

AIGC动态

5天前

DeepSeek近期针对仿冒账号和不实信息的传播发布了官方声明，明确指出与DeepSeek有关的信息应以官方账号发布为准，并提醒公众注意甄别。官方账号仅限于微信公...

AIGC动态

5天前

Semianalysis的分析报告对DeepSeek进行了全面分析，揭示了其在AI领域的多项关键成就和战略布局。报告指出，DeepSeek拥有约5万块Hopper GPU，总投资超过5亿美...

AIGC动态

6天前

语音AI技术的发展正从基础设施层向应用层过渡，为企业和消费者带来革命性的改变。企业通过AI技术替代人工，实现成本效益、速度和可靠性的提升，同时打破传统...

AI-Agent

6天前

OpenAI 在 2025 年初通过发布 Operator 和 Deep Research 两款产品，标志着 AGI 第三层 -Agent 时代的到来。这些产品展示了 AI 在任务执行和信息处理方面的潜...

AI-Agent

6天前

近期，斯坦福大学教授李飞飞及其团队推出了S1模型，随后李飞飞的学生、OpenAI早期成员及前特斯拉AI总监发布了一段3小时长视频，详细介绍了AI大模型的进化历程...

AIGC动态

6天前

光学互连技术正在成为人工智能和高性能计算领域解决数据传输瓶颈的关键方向。Ayar Labs 是一家致力于开发光 I/O 解决方案的初创公司，其核心技术结合了 TeraP...

AIGC动态

6天前

本文探讨了大型语言模型（LLMs）规模扩大对实现人工通用智能（AGI）的影响。文章通过虚构的坚信者和质疑者之间的辩论，分析了规模扩大的有效性和潜在挑战。质...

AIGC动态

6天前

提升大模型推理性能通常依赖于大量数据和算力，但李飞飞团队提出了一种新方法，仅使用1000个样本进行微调，并引入预算强制技术（budget forcing），在测试时...

AIGC动态

6天前