标签:大语言模型
招生信息丨香港大学建筑学院招收「大模型 BIM 应用」博士后/RA
马骏博士及其团队专注于智能建造和智慧城市领域的前沿研究,致力于将人工智能与建筑信息模型(BIM)结合,推动行业技术创新。此次招聘的重点在于探索大语言模...
OpenAI反击DeepSeek!刚发布新模型Deep research,刷新最高记录
OpenAI东京分部近日发布了一款新型大语言模型(LLM)——Deep Research。该模型突破了传统LLM的局限,能够像人类分析师一样逐步分解复杂任务,并在互联网上进行...
LLM带来了「编程末日」?哥本哈根大学CS教授:别做梦了!
哥本哈根大学计算机教授Hans Hüttel最近发表观点,认为尽管大语言模型(LLM)在文本生成等领域取得了显著进展,但编程并不会因此被淘汰。他反驳了Matt Welsh...
英特尔至强6独享MRDIMM,内存带宽飙升,加速推理达2.4倍!
英特尔至强6性能核处理器以其显著的推理性能提升2.4倍而受到业界关注。其架构、核数和内存带宽的大幅提升是性能激增的关键因素。尽管至强6性能核处理器的Die ...
OpenAI发布强化微调API,能深度定制超复杂大模型了
OpenAI最近发布了一项名为“强化微调”的新技术,旨在通过深度定制技术提升大语言模型(LLM)在特定领域的应用能力。与传统微调不同,强化微调允许开发者利用高...
谷歌发布双思维AI Agent:像人类一样思考,重大技术突破!
在AIGC领域,大语言模型(LLM)的发展和应用落地备受关注。OpenAI的高级研究科学家Noam Brown提出了一个理论,即AI模型思考20秒的性能提升相当于将模型扩大并...
创业太苦、重回大厂,Reka创始人Yi Tay创业639天后重返谷歌
前谷歌大脑高级研究科学家、Reka首席科学家兼联合创始人Yi Tay在创业一年半后宣布重返谷歌DeepMind,担任高级资深研究科学家,继续研究人工智能和大语言模型...
斯坦福开源学术研究神器STORM再进化,AI智能体像人一样进行圆桌讨论
斯坦福大学推出了一款名为STORM的开源工具,利用大语言模型(LLM)辅助编写类维基百科文章。STORM能在三分钟内将输入的主题转换为长篇文章或研究论文,并支持...
Meta开源多模态模型——Llama 3.2
Meta公司最近发布了其首个多模态大语言模型(LLM)Llama-3.2,标志着Llama系列的重大升级。此次升级包括四个不同规模的模型,旨在满足不同应用场景的需求。Ll...
万字推演OpenAI o1 self-play RL 技术路线
曹宇在其文章中深入分析了OpenAI的新型自我博弈强化学习(RL)模型o1,该模型在数理推理领域取得了显著成绩,并提出了训练时计算(train-time compute)和测...