标签:AI模型

DeepSeek劝不了谷歌们

过去一个月,DeepSeek以较低成本推出性能接近OpenAI o1的开源模型R1,引发了全球AI行业的震动。这一“小力出奇迹”的新范式挑战了行业对高昂研发成本的依赖,但...

今年,还要抢GPU?

近期国内AI初创公司DeepSeek凭借开源大模型DeepSeek-V3和DeepSeek-R1引发关注,其性能与GPT-4等顶级模型相当,但训练成本仅为560万美元,显著低于行业平均的1...

人类自愧不如 :DeepSeek R1、o3-mini和Gemini 2.0 思考过程大横评,AI们比你脑子清楚多了

本次评测针对o3-mini、DeepSeek R1和Gemini 2.0 Flash Thinking三款推理模型展开七项核心任务测试。逻辑推理测试中,三款模型均正确解答阶乘数列问题,但思维...

不断有人在问,这个中国模型到底有什么魔力?

低成本、高性能的AI模型开发方法正在全球范围内掀起新一轮技术热潮。通过李飞飞团队的研究以及上海交大团队的工作可以看出,利用Qwen作为基座模型,结合创新...

DeepSeek技术解析:如何冲击英伟达两大壁垒?

DeepSeek的V3模型通过557.6万美元的低成本训练实现了与OpenAI O1相近的性能,这一突破引发了对英伟达技术壁垒的重新审视。其核心创新在于基础模型能力的跃升...

DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页

随着人工智能技术的快速发展,评估前沿大语言模型能力的需求变得愈加迫切。为此,Center for AI Safety 与 Scale AI 共同开发了一个名为 Humanity's Last Exa...

网上关于DeepSeek的说法,哪些是错误的?

DeepSeek近期通过采用PTX编程优化了跨芯片通信能力,但这并不意味着它绕过了NVIDIA CUDA生态。PTX是CUDA编程模型的一部分,DeepSeek直接使用PTX编写程序,虽...

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

谷歌本周发布了新一代的AI模型系列Gemini 2.0,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite和旗舰模型Gemini 2.0 Pro实验版本,并在Gemini App中推出了推理...

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

DeepSeek R1,一款由中国公司DeepSeek开发的先进大模型,因其开源和性能与OpenAI的o1相当而引发全球关注。该模型以其相对较低的训练预算、易用性和良好的用户...

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

阿里巴巴推出的Qwen2.5-Max模型在大模型竞技场榜单上取得了显著成绩,以总分1332位列第七,并在编程和数学领域表现突出,与顶级模型并列第一。Chatbot Arena...
1 2 3 16