标签:AI模型
DeepSeek劝不了谷歌们
过去一个月,DeepSeek以较低成本推出性能接近OpenAI o1的开源模型R1,引发了全球AI行业的震动。这一“小力出奇迹”的新范式挑战了行业对高昂研发成本的依赖,但...
今年,还要抢GPU?
近期国内AI初创公司DeepSeek凭借开源大模型DeepSeek-V3和DeepSeek-R1引发关注,其性能与GPT-4等顶级模型相当,但训练成本仅为560万美元,显著低于行业平均的1...
人类自愧不如 :DeepSeek R1、o3-mini和Gemini 2.0 思考过程大横评,AI们比你脑子清楚多了
本次评测针对o3-mini、DeepSeek R1和Gemini 2.0 Flash Thinking三款推理模型展开七项核心任务测试。逻辑推理测试中,三款模型均正确解答阶乘数列问题,但思维...
不断有人在问,这个中国模型到底有什么魔力?
低成本、高性能的AI模型开发方法正在全球范围内掀起新一轮技术热潮。通过李飞飞团队的研究以及上海交大团队的工作可以看出,利用Qwen作为基座模型,结合创新...
DeepSeek技术解析:如何冲击英伟达两大壁垒?
DeepSeek的V3模型通过557.6万美元的低成本训练实现了与OpenAI O1相近的性能,这一突破引发了对英伟达技术壁垒的重新审视。其核心创新在于基础模型能力的跃升...
DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页
随着人工智能技术的快速发展,评估前沿大语言模型能力的需求变得愈加迫切。为此,Center for AI Safety 与 Scale AI 共同开发了一个名为 Humanity's Last Exa...
网上关于DeepSeek的说法,哪些是错误的?
DeepSeek近期通过采用PTX编程优化了跨芯片通信能力,但这并不意味着它绕过了NVIDIA CUDA生态。PTX是CUDA编程模型的一部分,DeepSeek直接使用PTX编写程序,虽...
冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂
谷歌本周发布了新一代的AI模型系列Gemini 2.0,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite和旗舰模型Gemini 2.0 Pro实验版本,并在Gemini App中推出了推理...
自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言
DeepSeek R1,一款由中国公司DeepSeek开发的先进大模型,因其开源和性能与OpenAI的o1相当而引发全球关注。该模型以其相对较低的训练预算、易用性和良好的用户...
杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距
阿里巴巴推出的Qwen2.5-Max模型在大模型竞技场榜单上取得了显著成绩,以总分1332位列第七,并在编程和数学领域表现突出,与顶级模型并列第一。Chatbot Arena...