首页 > 科技 > 人工智能 > 正文

Stable Audio Open 发布开源 AI 模型

卡饭网 夜夜 2024-06-07 16:12:52

卡饭网 6 月 7 日消息,Stability AI 依托 Stable Diffusion 模型,成功扩展到音频领域,推出Stable Audio Open,该K AI 开源模型仅需用户输入提示词,即可生成高品质的音频样本。

Stable Audio Open 发布开源 AI 模型

Stable Audio Open 能够生成最长 47 秒的音乐,适用于鼓点、乐器旋律、环境音及拟声等音效制作。这款开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中精细操作,从而提升生成音频的质量和多样性。