标签:性能
Agent 要被吃进大模型了
OpenAI近期发布了全新的o系列模型,包括满血版o3和o4-mini,这两款模型在性能和价格上均实现了显著提升。o3在多个基准测试中刷新了纪录,尤其在编程、商业咨...
GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的
GPT-4.1模型的发布标志着OpenAI在AI领域的最新进展,尽管其性能在某些方面超越了前代模型,但在与谷歌的Gemini 2.5 Pro的竞争中仍显不足。GPT-4.1以其强大的...
GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹
Optimus Alpha作为一款新推出的大模型,在短时间内展现了惊人的处理能力,日Token处理量已超过340亿,位列Trending榜单第一。其表现不仅在编程任务中尤为突出...
Llama 4重测竞技场排名大跳水,网友:社区很难再信任Meta了
Llama 4模型在大模型竞技场中被曝作弊后,重新上架了非特供版模型,但其排名从第2位骤降至第32位。最初提交的“实验版”模型实际上是对人类偏好进行了优化,具...
为什么李飞飞团队经常cue通义千问?
近年来,人工智能领域的发展呈现出“更大、更多、更强”的趋势,特别是在大模型技术方面,中美两国的差距正在迅速缩小。根据斯坦福大学以人为本人工智能研究所...
【 ICLR 2025 】Adam 有了 mini 版:内存减半,吞吐量可提升 50%
在大语言模型训练中,内存开销是一个关键挑战,尤其是Adam优化器的高内存需求。为了解决这一问题,研究团队提出了一种轻量化优化器Adam-mini,通过分析Transf...
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
英伟达于4月8日发布了最新大语言模型Llama3.1 Nemotron Ultra 253B,该模型基于Meta的Llama-3.1-405B-Instruct构建,并通过神经架构搜索(NAS)技术进行了深...
反英伟达联盟的里程碑,UA Link 1.0:正式发布
UALink 1.0 规范的发布标志着人工智能计算领域的一个重要里程碑。该规范由 UALink 联盟于 2024 年 5 月成立,成员包括 AMD、AWS、博通、思科、谷歌、HPE、英...
斯坦福 AI 指数报告发布:2024 年美国 AI 私人投资约为中国的 12 倍、GPT-3.5级别模型推理成本下降 280 倍
斯坦福大学以人为本的人工智能研究所(HAI)发布的《2025年人工智能指数报告》显示,中美在人工智能领域的差距正在显著缩小。报告指出,过去一年中,美国的AI...
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
Llama 4 Behemoth作为教师模型,拥有2880亿个活跃参数和近2万亿个总参数,在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...