大模型

原来，这些顶级大模型都是蒸馏的

中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在新论文《Distillation Quantification for Large Language Models》中探讨了大型语言模型（LL...

AIGC动态

2周前

近期，AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引，这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能，引发了市场对AI硬件需求...

AIGC动态

2周前

新年之际，OpenAI联合创始人兼首席执行官Sam Altman对中国大模型平台DeepSeek开源的最新模型R1表示赞赏，认为其性价比令人印象深刻。这一公开赞扬在社交媒体...

AIGC动态

2周前

中国人工智能实验室DeepSeek发布的低成本推理大模型R1性能与OpenAI的o1相当，引发对美国在AI领域领先地位的担忧。AI领域分析师Alberto Romero提出，OpenAI的G...

AIGC动态

2周前

春节之际，AI公司DeepSeek（深度求索）以其创新的AI模型在全球科技圈引起震动。1月20日，DeepSeek发布了推理模型DeepSeek-R1正式版，该模型以低成本训练出的...

AIGC动态

2周前

随着低成本推理模型DeepSeek-R1的热潮，美股市场遭遇重挫，英伟达和Broadcom等依赖AI的芯片制造商市值大幅下跌。中国人工智能实验室DeepSeek发布的开源大语言...

AIGC动态

2周前

阿里巴巴最新发布了视觉多模态模型Qwen2.5-VL，该模型在图像、文本、视频的理解与识别能力上显著增强，并且具备直接作为视觉Agent自动化操作电脑和手机的独特...

AI-Agent

2周前

人工智能（AI）在春晚中的运用成为今年的一大看点，各大AI模型纷纷预测春晚将如何融合AI元素。技术层面上，AI跟踪技术、XR、数字孪生和VP等技术被看好，以实...

AIGC动态

2周前

ETH Zurich等机构的研究人员提出了推理语言模型（RLM）的蓝图，旨在克服最先进RLM的高昂成本和专有特性带来的可访问性和公平性问题。RLM被视为AI领域的革命性...

AIGC动态

2周前

DeepSeek R1模型以其卓越的表现在AI领域引起了广泛关注。该模型在回答关于李世民在玄武门之变后独白的问题时，展现了深刻的思考过程和细腻的输出结果。它不仅...

AIGC动态

2周前