标签:多模态模型
推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体
在东京大学举行的OpenAI高管对话中,Sam Altman与Kevin Weil透露了公司技术路线图的核心进展与未来规划。OpenAI内部已实现GPT-4.5模型,并确认通过推理模型与...
阿里挖来AI大牛许主洪,接下来目标明确:要靠多模态打通AI应用了
随着AI技术竞争加剧,消费市场成为科技公司争夺的核心战场。阿里巴巴近期通过引入顶尖人才和重组业务线,加速布局AI To C领域。人工智能科学家许主洪教授的加...
全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁
许主洪的加入标志着阿里在AI To C业务上的重要布局。作为一名IEEE Fellow和新加坡管理大学终身教授,他凭借深厚的学术积累与产业实践经验,将推动阿里的多模...
原生融合多模态上的突破,让商汤大模型打破Scaling Laws撞墙「魔咒」
下一代AI发展遭遇瓶颈,大型语言模型竞赛中各实验室似乎同时撞墙。OpenAI的GPT-5模型发布多次延迟,至今仍未达到可发布水平。大型模型训练成本高昂,耗时数月...
卖身、豪赌Killer App的AI 厂商:被“吊”麻了,明年咋活?
自ChatGPT发布以来,AI行业的大模型领域经历了快速增长,但随着应用落地,市场对大模型的热情有所降温,资本也趋于理性。AI行业经历了剧烈洗牌,创企寻求收购...
MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
2025年被AI业界领袖视为AI Agent的关键年份,预计将对公司生产力产生重大影响。在这一背景下,MiniMax开源了两个新模型:基础语言模型MiniMax-Text-01和视觉...
独家丨前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型
胡瀚,前微软亚洲研究院视觉计算组首席研究员,已加入腾讯,接替刘威负责多模态大模型研发。胡瀚清华大学本科及博士学位,师从周杰教授,博士论文获2016年中...
李飞飞、谢赛宁等探索MLLM「视觉空间智能」,网友:2025有盼头了
纽约大学、耶鲁大学和斯坦福大学的研究者们提出了VSI-Bench,这是一个基于视频的基准测试,旨在评估多模态大语言模型(MLLM)在视觉空间智能方面的表现。VSI-...
中国AI竞争加剧:苹果或与腾讯字节合作,新增46万张GPU芯片、豆包语言模型排名第一|钛媒体AGI
苹果公司正在与中国的腾讯和字节跳动进行谈判,考虑将这两家公司的AI模型整合到在中国销售的iPhone中。字节跳动的豆包大模型和腾讯的混元模型在评测中表现突...
OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1
谷歌DeepMind宣布了新一代原生多模态模型Gemini 2.0 Flash的正式发布,标志着智能体时代的进一步发展。Gemini 2.0 Flash在性能上超越了前代1.5 Pro,速度提升...