大模型

LLM,VLM,模型

3秒变导演!DeepSeek生成AI视频堪比大片

利用AI生成高质量视频内容正在成为现实,填空式提问法为初学者提供了一种简单有效的入门方式。通过向AI工具如DeepSeek输入基础描述,并借助身份特征、环境氛...

Deepseek R1可能找到了超越人类的办法

本文围绕AI发展历程,从AlphaGo到ChatGPT,再到DeepSeek R1,阐述了AI底层原理的突破及其对AGI/ASI的重要性。1. AlphaGo突破人类上限:1997年深蓝击败国际象...

国产 DeepSeek V3 被秒成”前浪”?谷歌开放最强 Gemini 2.0 全家桶:速度快60倍,上下文还长16倍!

谷歌发布了 Gemini 2.0,这是一套功能强大的人工智能模型,包含多个版本以满足不同需求。Gemini 2.0 Flash 是主打高效性和低延迟的主力模型,具备处理多模态...

创历史!DeepSeek获16大国产AI芯片力挺,中国智算的半壁江山都出动了

DeepSeek作为国产AI大模型,在短时间内获得了广泛的产业支持。首先,16家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务,其中包括华为昇腾、沐曦、天数...

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

近期研究围绕类 R1-Zero 的训练展开,聚焦于模型自我反思能力及响应长度变化的机制。研究表明,“顿悟时刻”并非如以往所认为出现在强化学习(RL)训练后,而是...

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

大模型时代的到来使算力成为技术发展的核心驱动力,同时也带来了大规模、高弹性、低成本的算力需求挑战。为了应对这一趋势,清微智能推出了基于可重构计算架...

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

群组相对策略优化(GRPO)作为一种在线学习算法,通过使用训练过程中由模型自身生成的数据进行迭代改进,已因其高效性和易用性成为大型语言模型强化学习中的...

美国朝中国DeepSeek打了一记重拳|钛媒体AGI

DeepSeek作为中国开源AI公司,其迅速崛起在全球范围内引发了广泛的关注与讨论。美国企业界、学术界和政府机构已展开多方面的应对行动,试图在技术、政策和投...

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!

斯坦福大学和华盛顿大学的研究人员开发了一个名为 s1 的人工智能推理模型,该模型以不到 50 美元的云计算成本成功训练而成,并在数学和编码能力测试中表现出...

国产万卡集群落地,为中国AI创新按下“加速键”

随着DeepSeek的出现,AI领域迎来了一场“效率革命”,通过优化模型架构和算法创新显著提升了性能并降低了成本。然而,这种效率提升并未减少算力需求,反而因应...
1 7 8 9 10 11 476