solidot新版网站常见问题,请点击这里查看。

Stability AI 宣布文本音乐生成模型 Audio Diffusion

人工智能
Wilson (42865)发表于 2023年09月14日 15时49分 星期四

来自生命之书
Stability AI 宣布了文本音乐生成模型 Audio Diffusion,允许任何人用简单的文本去生成音乐片段。Stability AI表示会在未来发布基于 Audio Diffusion 的开源模型和训练代码,允许你训练自己的音乐生成模型。Audio Diffusion 使用了音频库 AudioSparks 中超过 80 万首授权音乐训练,大约有 12 亿个参数,与最早发布的图像生成模型 Stable Diffusion 相当。Audio Diffusion 有免费和付费方案,免费版本允许每月生成 20 首最长 20 秒的音乐,付费版本提高到 500 首最长 90 秒。


https://stability.ai/research/stable-audio-efficient-timing-latent-diffusion