标签:大模型
满血DeepSeek-R1+Cursor打通!无问芯穹上线API服务,能力拉满,7大国产算力保驾护航
随着DeepSeek系列模型影响力的持续扩大,其官网频繁出现服务器繁忙现象。值得关注的是,无问芯穹大模型服务平台已正式上线满血版DeepSeek-R1和DeepSeek-V3的A...
DeepSeek劝不了谷歌们
过去一个月,DeepSeek以较低成本推出性能接近OpenAI o1的开源模型R1,引发了全球AI行业的震动。这一“小力出奇迹”的新范式挑战了行业对高昂研发成本的依赖,但...
钛媒体AGI独家|王小川下场做VC,百川智能已投资三家公司,并高薪聘请投资经理
搜狗创始人王小川创立的百川智能近期通过招聘投融资岗位释放出布局AGI生态投资的信号,其投资方向聚焦AI、具身智能及医疗技术领域。公开信息显示,百川智能已...
为什么中国只有一个 DeepSeek?
在DeepSeek风暴过后,中国的大模型创业圈出现了两个极端:一边是热血沸腾的算力厂商与模型服务厂商,以及开源受益者;另一边则是其他中国大模型创业公司和投...
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜
近期,AIME 2025 I数学竞赛中大语言模型的表现引发了广泛关注。 一些顶尖模型如o3-mini和DeepSeek-R1分别取得了78%和65%的高分,而部分较小的蒸馏模型也意外...
刘知远详解 DeepSeek 出圈背后的逻辑:自身算法的创新以及 OpenAI 的傲慢
在探讨人工智能(AI)如何赋能全人类,实现大模型和通用人工智能的普及时,高效性成为了一个核心议题。智能革命被认为将经历与信息革命相似的阶段,即提高能...
「鲶鱼」DeepSeek 正在搅动上下游
DeepSeek的出现引发了AI领域的剧烈震荡,其低成本、高效能的大模型训练和推理方式推动了开源潮流,并给整个行业带来了深远影响。通过引入MoE架构和FP8混合精...
架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练
大模型时代的到来使算力成为技术发展的核心驱动力,同时也带来了大规模、高弹性、低成本的算力需求挑战。为了应对这一趋势,清微智能推出了基于可重构计算架...
DeepSeek无问西东!先行者早已趟平全国产之路
DeepSeek的迅速走红推动了国产AI产业的全面动员,其影响主要体现在平台层、算力层和应用层。在平台层,华为云、阿里云等云厂商快速接入相关服务,提供性能相...
百度点亮自研万卡集群,大模型应用拐点加速到来
DeepSeek是一款以较少GPU芯片和低成本实现高性能的国产大模型,其迅速获得包括百度在内的主流云厂商支持。2月3日,百度智能云千帆平台正式上线DeepSeek-R1和D...