大模型

3秒变导演！DeepSeek生成AI视频堪比大片

利用AI生成高质量视频内容正在成为现实，填空式提问法为初学者提供了一种简单有效的入门方式。通过向AI工具如DeepSeek输入基础描述，并借助身份特征、环境氛...

AIGC动态

5天前

本文围绕AI发展历程，从AlphaGo到ChatGPT，再到DeepSeek R1，阐述了AI底层原理的突破及其对AGI/ASI的重要性。1. AlphaGo突破人类上限：1997年深蓝击败国际象...

AIGC动态

5天前

谷歌发布了 Gemini 2.0，这是一套功能强大的人工智能模型，包含多个版本以满足不同需求。Gemini 2.0 Flash 是主打高效性和低延迟的主力模型，具备处理多模态...

AIGC动态

5天前

DeepSeek作为国产AI大模型，在短时间内获得了广泛的产业支持。首先，16家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务，其中包括华为昇腾、沐曦、天数...

AIGC动态

5天前

近期研究围绕类 R1-Zero 的训练展开，聚焦于模型自我反思能力及响应长度变化的机制。研究表明，“顿悟时刻”并非如以往所认为出现在强化学习（RL）训练后，而是...

AIGC动态

5天前

大模型时代的到来使算力成为技术发展的核心驱动力，同时也带来了大规模、高弹性、低成本的算力需求挑战。为了应对这一趋势，清微智能推出了基于可重构计算架...

AIGC动态

5天前

群组相对策略优化（GRPO）作为一种在线学习算法，通过使用训练过程中由模型自身生成的数据进行迭代改进，已因其高效性和易用性成为大型语言模型强化学习中的...

AIGC动态

5天前

DeepSeek作为中国开源AI公司，其迅速崛起在全球范围内引发了广泛的关注与讨论。美国企业界、学术界和政府机构已展开多方面的应对行动，试图在技术、政策和投...

AIGC动态

5天前

斯坦福大学和华盛顿大学的研究人员开发了一个名为 s1 的人工智能推理模型，该模型以不到 50 美元的云计算成本成功训练而成，并在数学和编码能力测试中表现出...

AIGC动态

5天前

随着DeepSeek的出现，AI领域迎来了一场“效率革命”，通过优化模型架构和算法创新显著提升了性能并降低了成本。然而，这种效率提升并未减少算力需求，反而因应...

AIGC动态

5天前