钢琴转录推理工具箱
piano-transcription-inference的Python项目详细描述
钢琴转录推理
这个工具箱是一个钢琴转录推理软件包,可以很容易地安装。安装后,用户可以将自己喜欢的钢琴录音转录成MIDI文件。要了解钢琴转录系统是如何训练的,请访问:https://github.com/bytedance/piano_transcription。在
演示
这是我们钢琴转录系统的演示:https://www.youtube.com/watch?v=5U-WL0QvKCg
安装
钢琴转录系统是用Python3.7和Pythorch 1.4.0开发的(应该可以与其他版本一起使用,但还没有完全测试)。 在https://pytorch.org/之后安装PyTorch。用户应该安装ffmpeg来转录mp3文件。在
pip install piano_transcription_inference
安装完成!在
使用
^{pr2}$这将从https://zenodo.org/record/4034264下载经过预训练的模型。在
用户也可以逐行执行推理代码:
from piano_transcription_inference import PianoTranscription, sample_rate, load_audio
# Load audio
(audio, _) = load_audio(audio_path, sr=sample_rate, mono=True)
# Transcriptor
transcriptor = PianoTranscription(device='cuda') # 'cuda' | 'cpu'
# Transcribe and write out to MIDI file
transcribed_dict = transcriptor.transcribe(audio, 'cut_liszt.mid')
钢琴演奏可视化
演示。朗朗:弗兰兹·李斯特——爱情梦(Liebestraum)[audio][transcribed_midi]
常见问题解答
此回购支持Linux和Mac。Windows尚未测试。在
如果用户满足“audio.exceptions.NoBackendError,然后检查是否安装了ffmpeg。在
如果用户遇到“被杀”的问题。这是由于内存不足造成的。在
应用
我们已经建立了一个大规模的古典钢琴MIDI数据集https://github.com/bytedance/GiantMIDI-Piano使用我们的钢琴转录系统。在
引用
[1]通过回归起始点和偏移时间,使用踏板的高分辨率钢琴转录,[将出现],2020年
- 项目
标签: