音频生成

谷歌最强大模型免费开放了！长音频理解功能独一份，100万上下文敞开用

Gemini 1.5 Pro是谷歌最强大的模型，现在全面对外开放，免费供开发者使用。这个版本增加了音频理解功能，可以解析各种音频内容，无需提供字幕文档。Gemini 1....

AIGC动态

10个月前

随着人工智能技术的不断进步，AIGC（人工智能生成内容）领域正迎来新的发展高潮。谷歌最新发布的Gemini 1.5 Pro模型，标志着大型语言模型（LLM）在多模态理解...

AIGC动态

10个月前

2021年底，OpenAI面临数据供应短缺，耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统，他们开发了Whisper语音识别工具，转录YouTube视频中的音...

AIGC动态

10个月前

Andrej KarpathyAndrej Karpathy，一位在人工智能领域享有盛誉的大神，近期复出并带来了一项引人注目的项目：使用纯C语言实现GPT的训练，仅用1000行代码就完...

AI-Agent

10个月前

上个月，彭博社报道了苹果公司正在与谷歌进行谈判，希望将谷歌的AI系统Gemini集成到iPhone中，以增强iPhone的AI功能。这一消息引起了业界的广泛关注，因为苹...

AIGC动态

10个月前

腾讯最近开源了一个名为AniPortrait的新项目，它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标，显示出其受...

AIGC动态

10个月前

生成式人工智能（AIGC）领域最近推出了多款新应用，钛媒体AGI整理了五款免费AI“神器”，每款都在其领域内展现了创新和潜力。苹果ReALM：这是一款由苹果研究团...

AIGC动态

10个月前

Stability AI 最近推出了 Stable Audio 2.0，这是一款在 AI 音频生成领域具有划时代意义的产品。Stable Audio 2.0 在前一版本的基础上进行了显著升级，引入了...

AIGC动态

10个月前

Stability AI最近发布了Stable Audio 2.0，一款能够创作长达3分钟的音乐作品的AI音乐工具。这个工具可以通过简单的自然语言指令或音频输入，生成高质量、结构...

AIGC动态

10个月前

昆仑万维近期宣布了其AI音乐生成大模型「天工SkyMusic」的开放邀测，这一模型基于公司的「天工3.0」超级大模型构建。这个模型的亮点在于其情感表达能力，特别...

AI-Agent

11个月前