标签:性能优化

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

李锡涵在其AIxiv专栏中分享了如何将DeepSeek R1 671B模型部署到本地环境的详细教程。DeepSeek R1因其出色的性能而广受欢迎,但本地部署可以提供更个性化的服...

百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径

随着春节的临近,国内AI厂商纷纷发布新一代大模型。豆包公司在春节前推出了实时语音功能,实现了中文语音对话的断崖式领先,为用户提供了智商与情商双高的实...

CUDA护城河,有多深?

Nvidia正面临来自英特尔和AMD的新加速器的激烈竞争,这些加速器在内存容量、性能和价格方面对Nvidia的最佳芯片构成挑战。Nvidia通过其CUDA运行时在开发者社区...

重磅!OpenAI开放满血o1模型API,成本暴降60%

OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能...

Sora发布!这次的惊艳居然不在模型,而是产品设计和制作流

OpenAI在发布会上推出了备受期待的视频生成模型Sora Turbo,这是对2月份Sora预览版的高端加强版,提升了速度并保留了“世界模拟”能力。Sora Turbo支持从文本和...

LeCun团队新作:在世界模型中导航

近期,AI领域的研究热点之一是世界模型(World Models),其中Meta FAIR的Yann LeCun团队发布了导航世界模型(Navigation World Models,NWM),这一模型能够...

智源发布心脏模型!超实时仿真人体生理功能,速度提升180倍

智源研究院开发了一种实时心脏电生理仿真系统,该系统能够实现心脏3D电活动的实时模拟,并深入探讨不同生理、病理因素对心脏功能的影响。这一系统在医学基础...

Mooncake 分离式推理架构创新与实践

在2024年QCon全球软件开发大会(上海站)上,月之暗面推理系统负责人何蔚然分享了“Mooncake分离式推理架构创新与实践”。何蔚然从实际业务出发,探讨了在固定...

每帧都是AI实时生成的,全球首款AI游戏问世了!

谷歌GameNGen的突破性技术使得AI能够基于扩散模型实时生成可玩的游戏,这一技术的发展预示着全球游戏产业的重大变革。紧随其后,Etched和Decart AI两家初创公...

一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源

智源研究院联合多所高校发布了超长视频理解大模型Video-XL,该模型利用语言模型的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,还在长视频理...
1 2 3 4