标签：推理性能

16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

提升大模型推理性能通常依赖于大量数据和算力，但李飞飞团队提出了一种新方法，仅使用1000个样本进行微调，并引入预算强制技术（budget forcing），在测试时...

AIGC动态

5天前

Kimi、DeepSeek中门对狙？中外开发者大对比还暗讽OpenAI，DeepSeek新涌现被赞爆！

近期，Kimi和DeepSeek两大AI研究机构分别发布了各自的最新模型：Kimi的k1.5和DeepSeek的DeepSeek-R1系列。Kimi 1.5在Github上发布技术报告，获得不到300 star...

AIGC动态

3周前