DeepSeek掀低成本革命，中科院系黑马闯入全球TOP 10！破解高精度-低能耗困局

542 0 0

文章摘要

2025年中国大模型领域迎来重要突破，DeepSeek与YAYI-Ultra两大模型展现出显著技术优势。DeepSeek-R1通过算法优化突破算力限制，其深度推理能力为国内大模型行业注入新活力，证明高质量模型可通过算法创新实现低算力训练，这一突破缓解了行业对算力瓶颈的担忧。中科院孵化的中科闻歌推出的YAYI-Ultra大模型，以64.5分跻身OpenCompass全球榜单前十，成为TOP10中五个中国模型之一，标志着国产大模型技术进入国际第一梯队。

在具体能力维度上，YAYI-Ultra展现出多领域优势：代码生成能力在LiveCodeBench评测中超越GPT-4o版本，位列第五；复杂指令理解（IFEval）与知识推理（MMLU-Pro）均进入全球前十。中文场景下，该模型在C-Eval自主验证榜单中排名第二，凸显本土化技术优势。实测验证显示，其核心突破集中于六大场景：多模态图表理解、复杂图像解析、智能任务规划、数据统计分析及超长文本处理。

视觉理解方面，模型通过跨语言多模态对齐技术升级，可精准解析堆积条形图、散点图等复杂图表，支持中英文混合指令。在表格处理场景中，YAYI-Ultra对嵌套结构、不规则排版表格的数据提取准确率达行业领先水平，涵盖金融报告、学术论文等专业领域。工具调用能力的强化使其可串联搜索引擎、代码解释器等工具，完成如奥运会奖牌数据可视化等复杂任务，实现从数据获取到图形生成的全流程自动化。

多模态输出功能实现图文协同呈现，用户提问时模型可同步展示原始文献图片，提升信息溯源效率。超长文本处理能力支持20万字输入与10万字输出，通过联网智能创作与文献锚定双模式，将长文生成拆解为大纲构建与分段填充的标准化流程，确保内容结构严谨。能耗控制方面，模型采用混合专家架构与动态计算策略，推理成本较行业平均水平降低80%，为大规模商业化应用奠定基础。