政安晨【零基础玩转开源AI项目】ACE-Step —— 迈向音乐生成基础模型的重要一步:AI自动谱曲与自动演唱的免费开源框架部署实践

政安晨的个人主页:政安晨

欢迎 👍点赞✍评论⭐收藏

希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正!

目录

项目简介

开始部署

下载项目

虚拟环境

进入项目目录安装依赖

启动应用


项目简介

我们推出 ACE-Step,这是一款全新的开源音乐生成基础模型,它克服了现有方法的关键局限,并通过整体架构设计实现了领先的性能。当前的方法在生成速度、音乐连贯性和可控性之间存在固有权衡。例如,基于大语言模型(LLM)的模型(如 Yue、SongGen)在歌词对齐方面表现出色,但推理速度较慢且存在结构瑕疵。另一方面,扩散模型(如 DiffRhythm)能够实现更快的合成,但往往缺乏长距离的结构连贯性。🎼
🌉 ACE-Step 通过将基于扩散的生成与 Sana 的深度压缩自动编码器(DCAE)以及轻量级线性变换器相结合,弥合了这一差距。它在训练过程中进一步利用 MERT 和 m-hubert 来对齐语义表示(REPA),从而实现快速收敛。因此,我们的模型在 A100 GPU 上仅需 20 秒就能合成长达 4 分钟的音乐,比基于 LLM 的基线快 15 倍,同时在旋律、和声和节奏指标上实现了卓越的音乐连贯性和歌词对齐。⚡ 此外,ACE-Step 保留了细粒度的声学细节,支持诸如语音克隆、歌词编辑、混音和音轨生成(如 lyric2vocal、singing2accompaniment)等高级控制机制。🎚️
🔮 我们的愿景并非构建又一个端到端的文本转音乐管道,而是建立一个音乐人工智能基础模型:一个快速、通用、高效且灵活的架构,便于在其基础上训练子任务。这为开发强大的工具铺平了道路,这些工具能够无缝融入音乐艺术家、制作人和内容创作者的创作工作流程。简而言之,我们旨在打造音乐领域的 Stable Diffusion 时刻。🎸

项目地址如下:

ACE-Step: A Step Towards Music Generation Foundation Modelhttps://ace-step.github.io/代码地址如下:

https://github.com/ace-step/ACE-Stephttps://github.com/ace-step/ACE-Step我们先大概读一读论文,然后开始部署实践,开发人员千辛万苦让好东西出来了,我们努力学习一下下也是应该。

下面这段描述让小伙伴们放心了:

支持19种语言,包括中文,有了这个基础能力,我们就可以尽情地玩耍了。

创作吧创作,AI时代,你需要开源的助力,这是平衡商业的力量,让普通人拥有同样的技术自由,嘻嘻。

 论文地址:[2506.00045] ACE-Step: A Step Towards Music Generation Foundation ModelAbstract page for arXiv paper 2506.00045: ACE-Step: A Step Towards Music Generation Foundation Modelhttps://arxiv.org/abs/2506.00045

感兴趣的小伙伴可以详细阅读。

主要的工作框架如下:

主要的音乐生成模型的性能比较如下:

ACE-Step的综合评分在各方面都是比较平衡且优秀的。

细节不再赘述,我们开始部署。

开始部署

激动人心的时刻开始了,我们出发......

下载项目

git clone git@github.com:ace-step/ACE-Step.git

虚拟环境

我们依然是用conda,不知道怎么用的小伙伴在我的博客里搜conda关键词,会出来一些手把手的文章,小伙伴们不用客气,照着抄,拿着用。

创建一个python 3.10版本的conda,建议使用这个版本,比较稳定,准确来讲,应该是3.10.16版本。

所以,我这里把环境稍稍修改了一下下。


conda create -n ace_step python=3.10.16 -y

安装完毕之后激活它:

conda activate ace_step

进入项目目录安装依赖

cd ACE-Step

在安装依赖之前先装一下框架:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

这一步骤中请确保你的网络通畅,出错了就重新尝试。

在安装的过程中多说两句:AI资源是很多的,关键在于发掘,在这个时代,许多免费的东西创造的价值超过付费的,所以,对自己有点信心,好好学,掌握AI世界的密码,未来,模型将多如牛毛,会像现在的网络小说一样无穷无尽,这是信息世界的福气,但也是我们人类短暂寿命的“悲哀”,明白你想要的,找到你想要的,这是一件非常重要的事。

没有什么时候比现在更需要知道我们生命的意义,生活的意义,否则,你将会迷失在AI的洪流中,小伙伴们,我们共勉,为了更加清醒,为了不再浪费生命的时间,多多努力一些,为了你在意的人。嘻嘻。

好了,框架安装完成:

安装依赖:

pip install -e .

一定要在项目目录下执行上述命令哦。

我以前设置的pip的阿里云镜像,速度会更快,需要设置的小伙伴可以搜索我以前的博客文章。

如果安装时遇到某些错误不要怕,好好读读提示,都是大家验证过的,你肯定可以成功安装,最好的技巧就是重试一下,嘻嘻。

启动应用

acestep --port 7865

这是默认参数启动的方案,在执行时会自动下载模型。

可以选择指定checkpoint的方式:
 

acestep --checkpoint_path /path/to/checkpoint --port 7865 --device_id 0 --share true --bf16 true

可以单独执行推理(会自动下载模型):

python infer.py

模型的缓存位置在这里(不需要的话可以删除):

~/.cache/ace-step/checkpoints

下载模型的过程中可以去吃点东西,模型比较大,时间会比较长。

另外,在安装依赖的时候,你还可以这样执行:

pip install -r requirements.txt

好了,你尽情地玩耍吧:


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

政安晨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值