什么是Stable Audio?
Stable Audio 由 Stability AI 开发,是一款前沿的 AI 音乐生成工具,赋能创作者生成最长三分钟的原创高保真音频。通过潜变量扩散模型与先进音频压缩技术,Stable Audio 可生成包含引子、发展和结尾等结构的立体声音乐。支持文本到音频与音频到音频双模式,用户可用自然语言提示创造新声音,或转换已有音频样本。平台基于授权数据集训练,保障质量与创作者权益,适用于商业及非商业项目。
主要功能
●
全长音乐生成
可生成连贯且结构完整的音乐曲目,时长最长可达三分钟,包含清晰的音乐段落与立体声效果。
●
音频到音频转换
支持用户上传音频样本,并通过自然语言提示将其转换为全新声音或风格。
●
高质量立体声输出
以44.1kHz立体声品质生成音频,确保满足各类项目的专业音质需求。
●
风格迁移与多样化
可根据特定情绪、流派或风格主题,自定义生成或上传的音频。
●
高效潜变量扩散模型
采用扩散Transformer与压缩音频表示,快速生成多样且复杂的音频内容。
●
合规授权数据集训练
基于授权音乐库进行训练,尊重创作者权益及退出请求,确保AI合规使用。
1. ⌄
2. 我可以上传自己的音频进行修改吗?⌄
支持,Stable Audio 支持音频到音频生成,您可以上传音频样本并通过文本提示进行转换。
3. 生成的音乐可以用于商业项目吗?⌄
可以。Pro 用户可将生成的音频用于商业项目,Basic 用户可用于非商业项目。
4. Stable Audio 提供什么音质?⌄
可生成44.1kHz高质量立体声音频,满足专业需求。
5. 生成的曲目最长多长?⌄
生成的曲目最长可达三分钟,并具备连贯的音乐结构。
6. 训练数据是否合规?⌄
是的,Stable Audio 基于授权数据集训练,尊重创作者权益及退出政策。
7. 可以自定义生成音频的风格或情绪吗?⌄
支持。平台提供风格迁移与情绪定制功能,可个性化音频输出。
