标签：学术考试

DeepSeek-R1、o1都低于10%，人类给AI的「最后考试」来了，贡献者名单长达两页

随着人工智能技术的快速发展，评估前沿大语言模型能力的需求变得愈加迫切。为此，Center for AI Safety 与 Scale AI 共同开发了一个名为 Humanity's Last Exa...

AIGC动态

2个月前