找回密码
 注册

微信登录

微信扫一扫,快速登录

萍聚头条

查看: 559|回复: 0

AI音乐的5种输入形式

[复制链接]
发表于 2025-9-16 21:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
你好,我是懂点AI音乐的乔木kelly,是一名AI音乐的程序员,今天介绍AI音乐的几种输入形式。

一、MIDI

MIDI的全称为Musical Instrument Digital Interface。MIDI文件包含了音乐的事件信息(如音高、速度、音量、颤音和时钟信号等),这些信息都是经过量化或者编码后的数字。

MIDI中的音高有128种(编码为0-127),其中中央C编码为60,钢琴的88个键对应的音高编码为21-108;此外,MIDI对通用128种乐器进行编码,如编码0代表大钢琴,编码25代表电吉他等。MIDI 文件有16个通道(最多可以同时使用16种乐器)。MIDI的音轨与通道的对应关系可以是一对一,也可以多对多。

w1.jpg

(图片参考来源:基于和弦与旋律双编码的多情感音乐生成算法研究)

二、WAV

WAV是标准数字音频文件格式,是微软公司开发用于记录各种单声道或立体声音信息的一种标准数字音频文件。音频的可视化图形为连续波形。

w2.jpg

WAV可支持大部分播放器,由于是一种压缩的音频形式,容易丢失一些音乐数据。WAV在AI音乐创作中极少使用。

影响WAV音质的因素主要包括以下三种:

(1)采样频率:每秒钟对音频数据进行采集的次数。采样频率越高,音频保真度越高。

(2)采样位数:也叫振幅采样精度,即采样值或取样值。采样位数越大,分辨率越高,发出声音的能力越强。

(3)声道数:声音的通道数量,分为单声道和立体声。单声道只能用一个喇叭发声,立体声可以用两个喇叭发声。

三、ABC记谱法

ABC记谱法是一种基于文本的标准音乐表示格式。在ABC记谱法中,每个音符均被编码为一个符号。音符音高使用字母表示,音高和持续时间都有明确描述。这种表示方式简单易读,能够更清晰地呈现小节等重要元素。但不能有效表示用于复调音乐的多声部。

w3.jpg

图片参考来源:
https://zh.wikipedia.org/zh-cn/ABC%E8%AE%B0%E8%B0%B1%E6%B3%95

四、Piano Roll

钢琴卷(Piano Roll)类似于一个坐标系,其中横轴表示时间,纵轴表示对应键位的音高。通常编码成类似于图像的二维音符数据。Piano Roll可以采用不同的编码方式,适用于不同输入要求的算法,但是未存储每个音符的持续时间,无法准确区分长音符和短音符。

w4.jpg

(图片参考来源:基于改进多轨序列生成对抗网络的背景音乐生成算法)

五、独热编码

独热编码采用了一个固定长度的二进制向量,其长度等于总音符的数量。独热编码中的唯一数字1对应当前音符的位置,其他位置均置为0。独热编码简洁,近似计算更具鲁棒性。但是,对复调音乐的编码时则较为复杂。




好了,今天的分享就到这里。

欢迎关注,一起成长
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+2, 2025-9-22 11:48 , Processed in 0.107309 second(s), 30 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表