标签:性能优化
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
李锡涵在其AIxiv专栏中分享了如何将DeepSeek R1 671B模型部署到本地环境的详细教程。DeepSeek R1因其出色的性能而广受欢迎,但本地部署可以提供更个性化的服...
百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径
随着春节的临近,国内AI厂商纷纷发布新一代大模型。豆包公司在春节前推出了实时语音功能,实现了中文语音对话的断崖式领先,为用户提供了智商与情商双高的实...
CUDA护城河,有多深?
Nvidia正面临来自英特尔和AMD的新加速器的激烈竞争,这些加速器在内存容量、性能和价格方面对Nvidia的最佳芯片构成挑战。Nvidia通过其CUDA运行时在开发者社区...
重磅!OpenAI开放满血o1模型API,成本暴降60%
OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能...
Sora发布!这次的惊艳居然不在模型,而是产品设计和制作流
OpenAI在发布会上推出了备受期待的视频生成模型Sora Turbo,这是对2月份Sora预览版的高端加强版,提升了速度并保留了“世界模拟”能力。Sora Turbo支持从文本和...
LeCun团队新作:在世界模型中导航
近期,AI领域的研究热点之一是世界模型(World Models),其中Meta FAIR的Yann LeCun团队发布了导航世界模型(Navigation World Models,NWM),这一模型能够...
智源发布心脏模型!超实时仿真人体生理功能,速度提升180倍
智源研究院开发了一种实时心脏电生理仿真系统,该系统能够实现心脏3D电活动的实时模拟,并深入探讨不同生理、病理因素对心脏功能的影响。这一系统在医学基础...
Mooncake 分离式推理架构创新与实践
在2024年QCon全球软件开发大会(上海站)上,月之暗面推理系统负责人何蔚然分享了“Mooncake分离式推理架构创新与实践”。何蔚然从实际业务出发,探讨了在固定...
每帧都是AI实时生成的,全球首款AI游戏问世了!
谷歌GameNGen的突破性技术使得AI能够基于扩散模型实时生成可玩的游戏,这一技术的发展预示着全球游戏产业的重大变革。紧随其后,Etched和Decart AI两家初创公...
一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源
智源研究院联合多所高校发布了超长视频理解大模型Video-XL,该模型利用语言模型的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,还在长视频理...