多模态 | 第 2 页

原生多模态大模型也能强化学习，思维链长达几万字，商汤日日新V6来了

商汤推出的「日日新 SenseNova V6」大模型在多模态推理与交互能力上展现了行业领先水平。该模型通过多模态长思维链训练、全局记忆、强化学习等技术突破，显著...

AIGC动态

1周前

AI看柯南2分钟揪真凶，商汤600B多模态MoE推理封神！交互记忆全线升级

商汤科技最新发布的第六代大模型SenseNova V6，标志着多模态大模型技术的重大突破。该模型不仅在文本、图像和视频的原生融合上实现了全面升级，还展现了强大...

AIGC动态

1周前

阿里开源R1-Omni，多模态情感识别

阿里巴巴通义实验室的研究人员开源了多模态情感识别模型R1-Omni，该模型首次将强化学习与可验证奖励（RLVR）应用于多模态大模型，显著提升了情感识别任务中的...

AIGC动态

2周前

四个维度深入剖析「 Test-Time Scaling 」！首篇系统综述，拆解推理阶段扩展的原理与实战

随着大模型训练成本的急剧攀升和优质数据的逐渐枯竭，推理阶段扩展（Test-Time Scaling, TTS）技术迅速成为后预训练时代的关键突破口。与传统的“堆数据、堆参...

AIGC动态

2周前

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

视觉自监督学习（SSL）在多模态任务中的潜力得到了验证，研究表明，通过扩展模型和数据规模，SSL能够媲美甚至超越语言监督方法（如CLIP）。这项研究由杨立昆...

AIGC动态

2周前

1000万上下文！新开源多模态大模型，单个GPU就能运行

今年2月初，谷歌发布的Gemini 2.0 Pro支持200万上下文，震惊了整个大模型领域。然而，仅过了2个月，Meta最新开源的Llama 4 Scout就将上下文扩展至1000万，整...

AIGC动态

2周前

1000万上下文+2880亿参数的Llama4，却让DeepSeek们松了一口气

Meta于4月5日发布了Llama4系列开源模型，包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这三种模型分别针对不同的使用需求，展示了Meta在人工智能...

AIGC动态

2周前

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

Llama 4 Behemoth作为教师模型，拥有2880亿个活跃参数和近2万亿个总参数，在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...

AIGC动态

2周前

Meta深夜开源Llama 4！首次采用MoE，惊人千万token上下文，竞技场超越DeepSeek

Meta在周末发布了其最新AI模型系列Llama 4，包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这些模型经过大量未标注的文本、图像和视频数据训练，...

AIGC动态

2周前

刚刚，Meta发布Llama 4系列模型

Meta今日发布了Llama 4系列模型，标志着其在人工智能领域的又一重要进展。Llama 4系列是首批开放权重的原生多模态模型，支持超长上下文，并首次采用了混合专...

AIGC动态

2周前

标签：多模态

原生多模态大模型也能强化学习，思维链长达几万字，商汤日日新V6来了

AI看柯南2分钟揪真凶，商汤600B多模态MoE推理封神！交互记忆全线升级

阿里开源R1-Omni，多模态情感识别

四个维度深入剖析「 Test-Time Scaling 」！首篇系统综述，拆解推理阶段扩展的原理与实战

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

1000万上下文！新开源多模态大模型，单个GPU就能运行

1000万上下文+2880亿参数的Llama4，却让DeepSeek们松了一口气

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

Meta深夜开源Llama 4！首次采用MoE，惊人千万token上下文，竞技场超越DeepSeek

刚刚，Meta发布Llama 4系列模型

热门网址

标签：多模态

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址