blog details

2024年6月7日

19

125

Stability AI开源47秒音频生成模型

音频生成领域迎来新突破,Stability AI 正式宣布推出其开放模型 Stable Audio Open。该模型能够生成高质量的音频数据,为AI解决方案和AI定制开发提供了新的技术支持。与 Stability AI 的商业版 Stable Audio 产品(可生成长达三分钟的更长、连贯音乐曲目)不同,Stable Audio Open 可以通过简单的文本提示生成长达 47 秒的高质量音频数据。这为AI技术在更多领域中的应用打开了大门。

Stable Audio Open 经过全面训练,特别适合创建鼓点、乐器 riffs、环境音和拟声录音等用于音乐制作和声音设计的音频样本。尽管它无法生成完整的歌曲、旋律或人声,但在短片段音频的生成上表现卓越,为AI企业解决方案提供了更多选择。此外,该模型的一大优势在于用户可以根据自定义音频数据对模型进行微调。这为希望在音乐生成中应用AI定制开发的企业带来了新的可能性和更高的灵活性。

专业训练与多样化应用

随着音乐生成器的日益普及,版权问题成为关注的焦点。Stability AI 在训练该模型时采取了负责任的态度,避开了之前在文生图模型训练中的「版权问题」。Stable Audio Open 使用来自 FreeSound 和 Free Music Archive 的音频数据进行训练,确保未经任何许可未使用受版权保护的材料。这为大型语言模型开发树立了一个道德和法律合规的新标准。

刚刚,Stability AI 宣布推出开放模型 Stable Audio Open,该模型能够生成高质量的音频数据。

“机器之心”

版权合规与道德责任

在杭州和浙江寻找AI定制开发、ChatGPT开发以及基于Langchain框架的相关服务的企业,将受益于这一创新技术的广阔应用前景。特别是杭州AI定制开发和浙江AI解决方案的市场需求,将因这种高质量音频生成技术的引入而得到进一步推动。

通过这些新技术,如何利用AI提升企业效率成为一个热门话题,并且在教培行业AI应用、税务AI咨询等行业特定领域,也将迎来更多创新与突破。

如有侵权,请联系删除。

Related Articles