大模型
LLM,VLM,模型
谷歌研究科学家意外离世,两月前留下绝笔:从事大模型研究让我深陷抑郁症
人工智能社区本周四对Google DeepMind的研究科学家菲利克斯·希尔(Felix Hill)表示哀悼,他在与严重精神疾病斗争后于2024年12月5日去世。希尔在DeepMind工作...
数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆
近期AI社区热议的Scaling Law是否撞墙问题中,一个论点是AI即将耗尽现有高质量数据。对此,卡内基梅隆大学和Google DeepMind的研究发现,利用低质量数据和反...
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
AI搜索技术在过去一年中经历了显著的演进,主要得益于基座大模型技术的快速迭代。这一演进体现在搜索技术链路的全面重构,包括数据采集、文档解析、向量检索...
科研背 KPI、暴富但痛苦,41 岁DeepMind 天才科学家疑因抑郁症去世,众大佬集体缅怀
谷歌DeepMind的科学家Felix Hill因抑郁症自杀,年仅41岁。Hill在AI领域成就卓越,特别是在自然语言处理(NLP)领域,他的工作包括开发能理解语言的代理和GLUE...
造车的理想要「All in AI」,这事靠谱吗?
理想汽车近期通过「2024 理想 AI Talk」系列活动,展示了其在人工智能领域的最新进展和未来规划。公司董事长兼CEO李想宣布,基于自研基座大模型Mind GPT的理...
刚拿下NeurIPS最佳论文,字节就开源VAR文生图版本,拿下SOTA击败扩散模型
字节跳动商业化技术团队开发了一款名为Infinity的自回归文生图新模型,该模型在图像生成质量上超越了扩散模型,并在推理速度上继承了VAR的速度优势。Infinity...
OpenAI再招华人研究员!高中入围美国“少年诺贝尔奖”,还在哈佛教书
哈佛华人研究员Jeffrey Wang宣布加入OpenAI,担任基础团队研究员,负责模型预训练和推理。此前,Wang在哈佛一边教课一边研究机器学习。他于2021年本科入学哈...
DeepSeek-V3:美国芯片封锁的“意外”产物?
中国团队DeepSeek在AI领域取得了显著成就,仅用600万美元和两个月时间,就训练出了一个6710亿参数的AI模型DeepSeek-V3,其训练效率是Meta训练Llama 3模型的11...
突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型
Meta公司近期发布了一项名为“记忆层”的创新研究,旨在解决预训练大模型中因参数增加而导致算力需求指数级增长的问题。记忆层通过高效查询机制,避免了遍历整...
大厂加码AI,阿里云与“大模型六虎”零一万物成立产业大模型联合实验室|钛媒体AGI
阿里云与零一万物达成战略合作,共同成立“产业大模型联合实验室”,旨在加速大模型技术从研发到产业应用的转化,并扩大产业大模型的生态整合。此次合作将结合...