dan
/
fastspeech_squeezewave

import torchimport torch.nn as nnimport numpy as np

class ScaledDotProductAttention(nn.Module):    ''' Scaled Dot-Product Attention '''
    def __init__(self, temperature, attn_dropout=0.1):        super().__init__()        self.temperature = temperature        self.dropout = nn.Dropout(attn_dropout)        self.softmax = nn.Softmax(dim=2)
    def forward(self, q, k, v, mask=None):
        attn = torch.bmm(q, k.transpose(1, 2))        attn = attn / self.temperature
        if mask is not None:            attn = attn.masked_fill(mask, -np.inf)
        attn = self.softmax(attn)        attn = self.dropout(attn)        output = torch.bmm(attn, v)
        return output, attn