dan
/
fastspeech_squeezewave

import torchimport numpy as npimport shutilimport os
from utils import load_data, get_Tacotron2, get_WaveGlowfrom utils import process_text, load_datafrom data import ljspeechimport hparams as hpimport waveglowimport audio as Audio

def preprocess_ljspeech(filename):    in_dir = filename    out_dir = hp.mel_ground_truth    if not os.path.exists(out_dir):        os.makedirs(out_dir, exist_ok=True)    metadata = ljspeech.build_from_path(in_dir, out_dir)    write_metadata(metadata, out_dir)
    shutil.move(os.path.join(hp.mel_ground_truth, "train.txt"),                os.path.join("data", "train.txt"))

def write_metadata(metadata, out_dir):    with open(os.path.join(out_dir, 'train.txt'), 'w', encoding='utf-8') as f:        for m in metadata:            f.write(m + '\n')

def main():    path = os.path.join("data", "LJSpeech-1.1")    preprocess_ljspeech(path)
    text_path = os.path.join("data", "train.txt")    texts = process_text(text_path)
    if not os.path.exists(hp.alignment_path):        os.mkdir(hp.alignment_path)    else:        return
    tacotron2 = get_Tacotron2()
    num = 0    for ind, text in enumerate(texts[num:]):        print(ind)
        character = text[0:len(text)-1]        mel_gt_name = os.path.join(            hp.mel_ground_truth, "ljspeech-mel-%05d.npy" % (ind+num+1))        mel_gt_target = np.load(mel_gt_name)        _, _, D = load_data(character, mel_gt_target, tacotron2)
        np.save(os.path.join(hp.alignment_path, str(            ind+num) + ".npy"), D, allow_pickle=False)

if __name__ == "__main__":    main()