大模型

LLM,VLM,模型

原来,这些顶级大模型都是蒸馏的

中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在新论文《Distillation Quantification for Large Language Models》中探讨了大型语言模型(LL...

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

近期,AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引,这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能,引发了市场对AI硬件需求...

Sam Altman狂赞中国大模型DeepSeek,OpenAI有这对手很兴奋!

新年之际,OpenAI联合创始人兼首席执行官Sam Altman对中国大模型平台DeepSeek开源的最新模型R1表示赞赏,认为其性价比令人印象深刻。这一公开赞扬在社交媒体...

DeepSeek震动硅谷AI圈,GPT-5还秘而“不发”?7千亿利润奥特曼都看不上了

中国人工智能实验室DeepSeek发布的低成本推理大模型R1性能与OpenAI的o1相当,引发对美国在AI领域领先地位的担忧。AI领域分析师Alberto Romero提出,OpenAI的G...

Deepseek又出连招:刚发布了超越DALL-E3的多模态模型

春节之际,AI公司DeepSeek(深度求索)以其创新的AI模型在全球科技圈引起震动。1月20日,DeepSeek发布了推理模型DeepSeek-R1正式版,该模型以低成本训练出的...

英伟达市值蒸发近6000亿美元,而DeepSeek刚刚又开源新模型

随着低成本推理模型DeepSeek-R1的热潮,美股市场遭遇重挫,英伟达和Broadcom等依赖AI的芯片制造商市值大幅下跌。中国人工智能实验室DeepSeek发布的开源大语言...

新年大礼!阿里刚开源视觉 AI Agent模型—Qwen2.5-VL

阿里巴巴最新发布了视觉多模态模型Qwen2.5-VL,该模型在图像、文本、视频的理解与识别能力上显著增强,并且具备直接作为视觉Agent自动化操作电脑和手机的独特...

今年春晚必会充斥AI梗,我先让DeepSeek们自己预测了一下

人工智能(AI)在春晚中的运用成为今年的一大看点,各大AI模型纷纷预测春晚将如何融合AI元素。技术层面上,AI跟踪技术、XR、数字孪生和VP等技术被看好,以实...

超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

ETH Zurich等机构的研究人员提出了推理语言模型(RLM)的蓝图,旨在克服最先进RLM的高昂成本和专有特性带来的可访问性和公平性问题。RLM被视为AI领域的革命性...

变天!——由一个惊艳例子引发对DeepSeek的10条思考

DeepSeek R1模型以其卓越的表现在AI领域引起了广泛关注。该模型在回答关于李世民在玄武门之变后独白的问题时,展现了深刻的思考过程和细腻的输出结果。它不仅...
1 17 18 19 20 21 477