音频生成
音频,audio
围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创
谷歌的新一代视频生成模型Veo2以其高分辨率和电影拍摄技巧在视频生成领域取得了显著进步,尽管生成的视频仍是默片。与此同时,国内互联网公司通过音乐大模型...
干活不再东挑西选,一个豆包电脑版All in One!
2024年见证了AI应用的爆发,众多产品涌现,但似乎没有一款产品能覆盖整个工作流程。然而,豆包电脑版的一次重大更新,将其从对话为主的产品转变为集成AI浏览...
模型评测不是用来刷榜的,智源要用“辩论赛”的方式找回评测该有的样子
在人工智能国际顶会NeurIPS 2024上,大模型评测成为焦点,7000余篇投稿与之相关。去年,评测榜单因刷榜行为受争议,如C-Eval和SuperCLUE。评测大模型比构建更...
相机公司瞄上了线上会议这块大蛋糕
影石Insta360,以全景相机品牌起家,近年来悄然布局会议市场。自2022年推出在线会议和直播场景的Link摄像头后,2024年进一步推出AI双摄视频会议一体机产品Con...
2025英伟达奖学金名单公布,7位华人入选!中科大浙大校友在列,人均6万美元
英伟达2025-2026年度博士奖学金名单公布,共有10位博士研究生入选,其中7位为华人学者。该奖学金计划已持续二十多年,旨在支持与英伟达技术相关的杰出研究生...
苹果正与腾讯、字节跳动洽谈,在iPhone集成类ChatGPT
苹果公司正在与中国科技巨头腾讯和字节跳动探讨合作,旨在将类ChatGPT功能集成到iPhone、Siri等产品中。由于ChatGPT在中国无法使用,苹果寻求本土技术平台以...
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
CMU联合20多所研究实验室开源发布了名为Genesis的生成式物理引擎,标志着我们向构建一个综合生成文本、图像、音频、视频和3D对象的世界迈出了重要一步。Genes...
潘乱对谈小宇宙 CEO Kyth:播客是在饱和时代,提供稀缺价值
中文播客在过去两年中经历了快速的发展,越来越多的明星、喜剧演员、品牌机构和企业家投资人参与其中,内容覆盖影视、科技、商业等多个领域。在极客公园IF202...
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪
斯坦福大学的研究团队在多模态语言模型领域取得了新进展,提出了一种能够同时处理语音、文本和动作生成任务的模型。该模型能够理解并生成富有表现力的人类动...
重磅!OpenAI开放满血o1模型API,成本暴降60%
OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能...