在数字时代,人工智能(AI)变得越来越普遍,在各个领域都有应用。 最近,我们看到了谷歌通过简单的“提示”生成音乐的项目的进展。 今天我们也发现了 元 踏上了这次冒险之旅, 创建 语言模型能够 从文本描述生成音频。 这个革命性工具的名字是“音响工艺“。
Meta Audiocraft:每个人(或几乎)都可以使用的音乐生成的新视野
Audiocraft 是一种基于人工智能的工具,它利用 三种语言模型:AudioGen、EnCodec 和 MusicGen。 目标是让用户从他们想听的内容的简单文本描述开始获取音轨。 Audiocraft 可用于生成音乐和声音,并提供压缩功能。
在这三个模型中, MusicGen 是一款经过专门训练可以从文本生成音乐的软件。 为此,使用了 Meta 授权的数千首音乐作品。 最令人兴奋的消息是,三款车型均已于 打开 资源,这意味着任何人都可以使用它们来创建工具和应用程序。 据 Meta 称,这些模板是专门为音乐艺术家和声音设计师设计的,目的是“提供灵感”。
另见: Meta定向广告新策略:用户许可
模板已经可用,并且可以通过以下方式下载其代码 拥抱脸 或相关页面 Github上。 MusicGen 可用于获取 AI 生成的歌曲片段,同时 AudioGen 可以为音乐制作提供可用的声音。 另一方面,EnCodec 是一种基于人工智能的压缩工具。
生成一首音乐就足够了 描述您想要获取的音乐,然后按“生成”按钮。 此外,还可以在描述中附上音频文件或麦克风录音,以便模型能够更准确地处理您想要生成的音乐类型。
生成的音频将是一个大约 12 秒长的曲目。 为了获得一个可以生成更完整片段的工具,我们必须等待一些开发人员基于这些模板构建应用程序。 提供元数据 工具,现在由社区来找出可以用它们做什么。