音频生成

音频,audio

实测丨年底了,我用 AI 做了一份年终总结。

百度六边形AI创作新物种——自由画布,以其强大的功能和易用性,为用户带来了全新的创作体验。自由画布能够无视文件格式,一键整合PDF、Word、音频、视频等资料...

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

随着春节的临近,2025年初大模型领域迎来了新一轮的竞争高潮。OpenAI的ChatGPT推出了新功能“Tasks”,而国内厂商如月之暗面、MiniMax、生数科技等也纷纷发布了...

“自由画布”开启公测,百度文库 AI 功能月活量突破 9000 万

在1月21日的百度AI DAY活动中,百度副总裁王颖宣布,百度文库的AI功能月活跃用户(MAU)已超过9000万,日活跃用户(DAU)实现了翻倍增长。同时,百度文库与百...

原生融合多模态上的突破,让商汤大模型打破Scaling Laws撞墙「魔咒」

下一代AI发展遭遇瓶颈,大型语言模型竞赛中各实验室似乎同时撞墙。OpenAI的GPT-5模型发布多次延迟,至今仍未达到可发布水平。大型模型训练成本高昂,耗时数月...

大模型商用格局雏形初现:Tokens用量决高下,火山引擎问鼎2024

2024年下半年,国内大模型商用落地的日均Tokens消耗量激增,从1000亿级增长至10000亿规模,月复合增长率达到45%。火山引擎在这一领域表现突出,其商用Tokens...

几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的

MiniMax公司推出的海螺语音AI工具以其卓越的语音生成能力在市场中占据领先地位。该工具基于升级的T2A-01系列语音大模型,能够快速稳定地生成语音,具备音质清...

一年卖超 500 万副耳机的韶音,杀入「AI 眼镜」赛道

韶音在CES 2025后宣布入局智能眼镜市场,展示了其第一代智能眼镜工程样机,标志着这家国内蓝牙耳机龙头企业的业务范围进一步扩展。韶音在开放式耳机领域保持...

端侧 GPT-4o来了! 面壁发布全新端侧模型,全模态、端到端,支持实时流式音视频通话!

面壁智能最近发布了全新一代小钢炮MiniCPM-o 2.6,这是一款端到端模型,参数规模为8B,在视觉、语音和多模态方面与GPT-4o-202405性能相当。MiniCPM-o 2.6支持...

全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑

面壁智能最新推出的AI模型MiniCPM-o 2.6因其在多模态能力上的卓越表现而受到广泛关注。该模型仅8B的体量,就能在多模态任务中与GPT-4o相媲美,且能在iPad等移...

CES提前上演百镜大战,AI眼镜这2个方向4大技术最火

在2025年的CES展会上,AI眼镜成为了备受瞩目的焦点,尤其是中国品牌的表现尤为突出。AI眼镜产品主要分为AI拍摄眼镜和AI+AR眼镜两大类,其中Halliday Glasses...
1 2 3 4 34