COMI

Codes are tested on:

python 3.7
pytorch 1.4.0
pretty_midi 0.2.9
mido 1.2.9

Data Preparation

data processing-related files:

data_config.py
data_cleaning.py
tokenization_by_time.py
preprocess.py

First, the midi data is put under ./data/midicn/midi/

Then, do some data filtering and cleaning. The cleaned midi files are put under ./data/midicn/cleaned_midi/

python data_cleaning.py midicn

Then, pre-process each midi file and save as a txt file; at the same time, the ./data/vocab.txt is created. Saved txt files are separated as three sub-sets (train, val, test) and are put under ./data/midicn/txt/. This step is to represent a midi as a token sequence using the vocabulary that we've defined.

python preprocess.py midicn

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
data		data
static		static
utils		utils
README.md		README.md
data_cleaning.py		data_cleaning.py
data_config.py		data_config.py
data_utils.py		data_utils.py
eval.py		eval.py
generate.py		generate.py
index.html		index.html
main_rnn.py		main_rnn.py
preprocess.py		preprocess.py
run.sh		run.sh
run_rnn.sh		run_rnn.sh
tokenization_by_time.py		tokenization_by_time.py
train.py		train.py
transformer_xl.py		transformer_xl.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

COMI

Data Preparation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

COMI

Data Preparation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages