标签:模型
媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开
今天凌晨4点,著名大模型训练平台Together AI和智能体平台Agentica联合开源了新模型DeepCoder-14B-Preview。该模型仅有140亿参数,但在知名代码测试平台LiveC...
斯坦福 AI 指数报告发布:2024 年美国 AI 私人投资约为中国的 12 倍、GPT-3.5级别模型推理成本下降 280 倍
斯坦福大学以人为本的人工智能研究所(HAI)发布的《2025年人工智能指数报告》显示,中美在人工智能领域的差距正在显著缩小。报告指出,过去一年中,美国的AI...
Llama 4遭竞技场背刺!实锤用特供版刷榜,2000+对战记录公开
大模型竞技场(Chatbot Arena)官方团队lmarena.ai近日公开了对Llama-4-Maverick-03-26-Experimental版本的评测数据,并对其表现进行了详细分析。该模型在竞...
斯坦福2025 AI指数出炉!中美AI终极对决差距仅剩0.3%,DeepSeek领衔
2025年斯坦福HAI报告揭示了全球AI领域的最新趋势,重点分析了中美在AI模型性能上的差距缩小、推理成本的大幅下降以及小模型性能的显著提升。中美顶级AI模型的...
反击DeepSeek失败!Llama 4效果不好,Meta承认有问题
Meta生成式AI领导者Ahmad Al-Dahle针对Llama 4开源后的质疑进行了官方回应。Ahmad承认,由于模型在开发完成后立即发布,不同服务中的模型质量存在差异,并承...
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
Meta近日发布了Llama 4系列模型,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth,宣称这些模型经过大量未标注的文本、图像和视频数据训练,视觉理...
Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
Meta最新发布的Llama 4本应成为AI领域的焦点,然而却因一系列问题引发了广泛争议。开源首日,Llama 4的代码能力表现极差,甚至不如GPT-4o等现有模型。更令人...
CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!
视觉自监督学习(SSL)在多模态任务中的潜力得到了验证,研究表明,通过扩展模型和数据规模,SSL能够媲美甚至超越语言监督方法(如CLIP)。这项研究由杨立昆...
Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
Meta最新发布的基础模型Llama 4在发布36小时后,引发了广泛的负面评价,尤其是在代码能力方面表现不佳。经典的小球反弹测试中,模型未能正确模拟物理效果,小...
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
Llama 4 Behemoth作为教师模型,拥有2880亿个活跃参数和近2万亿个总参数,在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...