大模型

LLM,VLM,模型

DeepSeek震动硅谷AI圈,GPT-5还秘而“不发”?7千亿利润奥特曼都看不上了

中国人工智能实验室DeepSeek发布的低成本推理大模型R1性能与OpenAI的o1相当,引发对美国在AI领域领先地位的担忧。AI领域分析师Alberto Romero提出,OpenAI的G...

Deepseek又出连招:刚发布了超越DALL-E3的多模态模型

春节之际,AI公司DeepSeek(深度求索)以其创新的AI模型在全球科技圈引起震动。1月20日,DeepSeek发布了推理模型DeepSeek-R1正式版,该模型以低成本训练出的...

英伟达市值蒸发近6000亿美元,而DeepSeek刚刚又开源新模型

随着低成本推理模型DeepSeek-R1的热潮,美股市场遭遇重挫,英伟达和Broadcom等依赖AI的芯片制造商市值大幅下跌。中国人工智能实验室DeepSeek发布的开源大语言...

新年大礼!阿里刚开源视觉 AI Agent模型—Qwen2.5-VL

阿里巴巴最新发布了视觉多模态模型Qwen2.5-VL,该模型在图像、文本、视频的理解与识别能力上显著增强,并且具备直接作为视觉Agent自动化操作电脑和手机的独特...

今年春晚必会充斥AI梗,我先让DeepSeek们自己预测了一下

人工智能(AI)在春晚中的运用成为今年的一大看点,各大AI模型纷纷预测春晚将如何融合AI元素。技术层面上,AI跟踪技术、XR、数字孪生和VP等技术被看好,以实...

超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

ETH Zurich等机构的研究人员提出了推理语言模型(RLM)的蓝图,旨在克服最先进RLM的高昂成本和专有特性带来的可访问性和公平性问题。RLM被视为AI领域的革命性...

变天!——由一个惊艳例子引发对DeepSeek的10条思考

DeepSeek R1模型以其卓越的表现在AI领域引起了广泛关注。该模型在回答关于李世民在玄武门之变后独白的问题时,展现了深刻的思考过程和细腻的输出结果。它不仅...

杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini

阿里巴巴集团旗下的通义Qwen发布了新的视觉理解模型Qwen2.5-VL,这是一个开源的视觉语言模型,包含3B、7B和72B三个版本。Qwen2.5-VL-72B-Instruct在多个领域...

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

浙江大学和上海交通大学的研究团队提出了一种名为MergeNet的知识迁移框架,旨在解决边缘计算设备如智能物联网设备在部署深度神经网络时面临的计算资源和存储...

DeepSeek重创美国芯片产业,英伟达一夜蒸发6000亿!巨头破防,美股历史性崩盘

除夕夜,美股科技股遭遇历史性崩盘,英伟达股价暴跌17%,市值一夜蒸发近6000亿美元,创下单个公司史上最大市值损失纪录。DeepSeek的突破性AI模型以低成本、非...
1 18 19 20 21 22 477