全球人工智能芯片霸主英伟达研发团队,推出全新音频人工智能系统「Fugatto」,只要输入文字指令,就能自动产生或改变任何音乐、人声及音效。
据报导,英伟达表示,目前并未打算立即公开推出这项Fugatto技术。
这套系统不仅能创作音乐、去除或新增乐器、改变口音与情绪,还能产生前所未闻的全新音效,为音乐创作、游戏开发及广告制作开创崭新可能,主要锁定音乐、电影和电玩制作人。
Runway等初创公司以及诸如Meta Platforms等更大型企业,都有发布可根据文字提示生成音频或视频的技术。
英伟达的新模型会根据文字描述生成音效和音乐,包括新奇的声音,例如小号会发出像狗叫的声音。
Fugatto与其他AI技术不同的地方,在于它能接收和修改现有音频,例如将钢琴弹奏的一段音乐转换为人声演唱版本,或让录下来的口语改变口音及其情绪表达。
辉达深度学习应用研究副总裁卡坦察罗表示:「想想过去50年的合成音频,就会发现当下的音乐听起来不一样,因为有计算机、合成器」、「我认为生成式AI将为音乐、电玩和想创作的普通人带来新的能力」。