标签:数学
刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明
AI辅助人类完成了首个非平凡研究数学证明,破解了50年未解的数学难题。这项研究由美国纽约布鲁克海文国家实验室的华人学者Weiguo Yin主导,通过引入最大对称...
实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?
最近,针对国内外7款大模型进行了一场数学能力测试,测试题目主要来自“阿里巴巴全球数学竞赛”和“中国数学奥林匹克(CMO)”的真题,涵盖了多个数学领域,包括...
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错
大型语言模型(LLMs)在高等数学测试中表现出色,平均得分达到90.4分(按百分制计算),显示出其在数学问题求解中的强大能力。 研究通过32道测试题,涵盖向量...
阿里开源新模型:媲美DeepSeek-R1,参数大降20倍!
阿里巴巴近日开源了其最新的大模型QwQ-32B,该模型支持Apache 2.0开源协议,允许商业化使用。QwQ-32B在多个主流测试基准中表现优异,能够与DeepSeek的R1-671B...
阿里深夜开源推理模型QwQ-32B,性能比肩R1满血版。
阿里在凌晨发布了全新的推理模型QwQ-32B,这一模型在多个数据集上的表现令人震惊,尤其是在数学和代码领域,其性能甚至能与DeepSeek R1(671B)相媲美。QwQ-3...
讯飞星火X1单挑满血版DeepSeek-R1,全国产算力单机部署!中国AI再下一城
星火X1模型的全面升级标志着中国AI技术的显著进步,尤其在数学领域表现突出。该模型以70B参数规模追平了OpenAI o1和DeepSeek-R1,并在竞赛级难题和中小学实用...
清华北航博士生「强迫」Gemma-2说中文!弱智吧、角色扮演、数学问题表现惊喜
谷歌最新发布的Gemma 2模型在中文处理能力上存在不足,但清华大学和北航的两名博士生迅速推出了针对该模型的指令微调版本,显著提升了其在中文通用对话、角色...
深度思辨:高纬度剖析阿里数学竞赛姜萍事件的是是非非
姜萍事件引发了广泛的讨论,主要围绕教育、选拔和用人体系是否存在系统性埋没人才的问题。事件中的质疑者认为姜萍的数学成绩和能力存在疑点,提出了四种主要...
阿里数赛首次向AI开放!知乎网友:给AI捏了把汗,该防止人类替考
阿里全球数学竞赛2024年开启报名,首次向AI开放,最高奖金可达1万美元。网友热烈参与,有人表示双厨狂喜,有人担心AI解答证明题的准确性。竞赛题目涉及一个抽...
40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果
摘要:克雷西报道了由DeepMind联合创始人Mustafa Suleyman领导的大模型初创公司Inflection-2.5推出的新产品Pi,以及该公司背后的故事。Inflection-2.5是一款...
1
2