dan
/
pruned-nlu

import random
import torchimport torch.nn as nnimport torch.nn.functional as Fimport numpy as npfrom sklearn.metrics import accuracy_scorefrom seqeval.metrics import f1_score
import models
kernel_size = 5
def load_model(model_name, num_words, num_intent, num_slot, dropout, wordvecs=None, embedding_dim=100, filter_count=300):    if model_name == 'intent':        model = models.CNNIntent(num_words, embedding_dim, num_intent, (filter_count,), kernel_size, dropout, wordvecs)    elif model_name == 'slot':        model = models.CNNSlot(num_words, embedding_dim, num_slot, (filter_count,), kernel_size, dropout, wordvecs)    elif model_name == 'joint':        model = models.CNNJoint(num_words, embedding_dim, num_intent, num_slot, (filter_count,), kernel_size, dropout, wordvecs)    return model
def rep(seed=None):    if not seed:        seed = random.randint(0, 10000)
    torch.manual_seed(seed)    np.random.seed(seed)            # CUDA    torch.backends.cudnn.deterministic = True    torch.backends.cudnn.benchmark = False    return seed
def train_intent(model, iter, criterion, optimizer, cuda):    model.train()    epoch_loss = 0    true_intents = []    pred_intents = []
    for i, batch in enumerate(iter):        optimizer.zero_grad()        query = batch[0]        true_intent = batch[1]
        if cuda:            query = query.cuda()            true_intent = true_intent.cuda()                pred_intent = model(query)
        true_intents += true_intent.tolist()        pred_intents += pred_intent.max(1)[1].tolist()
        loss = criterion(pred_intent, true_intent)        loss.backward()        optimizer.step()                epoch_loss += loss.item()
    return epoch_loss / len(iter), accuracy_score(true_intents, pred_intents)

def distill_intent(teacher, student, temperature, iter, criterion, optimizer, cuda):    teacher.eval()    student.train()
    true_intents = []    pred_intents = []        epoch_loss = 0    for i, batch in enumerate(iter):        optimizer.zero_grad()        query = batch[0]        true_intent = batch[1]
        if cuda:            query = query.cuda()            true_intent = true_intent.cuda()
        with torch.no_grad():            teacher_pred_intent = teacher(query)
        student_pred_intent = student(query)
        true_intents += true_intent.tolist()        pred_intents += student_pred_intent.max(1)[1].tolist()
        loss = criterion(F.log_softmax(student_pred_intent / temperature, dim=-1), F.softmax(teacher_pred_intent / temperature, dim=-1))        loss.backward()        optimizer.step()
        epoch_loss += loss.item()
    return epoch_loss / len(iter), accuracy_score(true_intents, pred_intents)
def valid_intent(model, iter, criterion, cuda):    model.eval()    epoch_loss = 0    true_intents = []    pred_intents = []
    for i, batch in enumerate(iter):        query = batch[0]        true_intent = batch[1]
        if cuda:            query = query.cuda()            true_intent = true_intent.cuda()                pred_intent = model(query)
        true_intents += true_intent.tolist()        pred_intents += pred_intent.max(1)[1].tolist()
        loss = criterion(pred_intent, true_intent)        epoch_loss += loss.item()        return epoch_loss / len(iter), accuracy_score(true_intents, pred_intents)        
def train_slot(model, iter, criterion, optimizer, cuda):    model.train()    epoch_loss = 0    true_history = []    pred_history = []
    for i, batch in enumerate(iter):        optimizer.zero_grad()        query = batch[0]        true_slots = batch[2]        true_length = batch[3]
        if cuda:            query = query.cuda()            true_slots = true_slots.cuda()                pred_slots = model(query).permute(0, 2, 1) # batch * slots * seq len
        true_history += [str(item) for batch_num, sublist in enumerate(true_slots.tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        pred_history += [str(item) for batch_num, sublist in enumerate(pred_slots.max(1)[1].tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]
        loss = criterion(pred_slots, true_slots)        loss.backward()        optimizer.step()                epoch_loss += loss.item()
    return epoch_loss / len(iter), f1_score(true_history, pred_history)
def distill_slot(teacher, student, temperature, iter, criterion, optimizer, cuda):    teacher.eval()    student.train()
    true_history = []    pred_history = []
    epoch_loss = 0    for i, batch in enumerate(iter):        optimizer.zero_grad()        query = batch[0]        true_slots = batch[2]        true_length = batch[3]
        if cuda:            query = query.cuda()            true_slots = true_slots.cuda()            true_length = true_length.cuda()
        with torch.no_grad():            teacher_pred_slot = teacher(query).permute(0, 2, 1) # batch * slot * seq len
        student_pred_slot = student(query).permute(0, 2, 1)
        true_history += [str(item) for batch_num, sublist in enumerate(true_slots.tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        pred_history += [str(item) for batch_num, sublist in enumerate(student_pred_slot.max(1)[1].tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]                loss = criterion(F.log_softmax(student_pred_slot / temperature, dim=1), F.softmax(teacher_pred_slot / temperature, dim=1))        loss.backward()        optimizer.step()
        epoch_loss += loss.item()
    return epoch_loss / len(iter), f1_score(true_history, pred_history)
def valid_slot(model, iter, criterion, cuda):    model.eval()    epoch_loss = 0    true_history = []    pred_history = []
    for i, batch in enumerate(iter):        query = batch[0]        true_slots = batch[2]        true_length = batch[3]
        if cuda:            query = query.cuda()            true_slots = true_slots.cuda()                pred_slots = model(query).permute(0, 2, 1) # batch * slots * seq len                true_history += [str(item) for batch_num, sublist in enumerate(true_slots.tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        pred_history += [str(item) for batch_num, sublist in enumerate(pred_slots.max(1)[1].tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]
        loss = criterion(pred_slots, true_slots)                epoch_loss += loss.item()        return epoch_loss / len(iter), f1_score(true_history, pred_history)

def train_joint(model, iter, criterion, optimizer, cuda, alpha):    model.train()    epoch_loss = 0
    epoch_intent_loss = 0    true_intents = []    pred_intents = []
    epoch_slot_loss = 0    true_history = []    pred_history = []
    for i, batch in enumerate(iter):        optimizer.zero_grad()        query = batch[0]        true_intent = batch[1]        true_slots = batch[2]        true_length = batch[3]
        if cuda:            query = query.cuda()            true_intent = true_intent.cuda()            true_slots = true_slots.cuda()            true_length = true_length.cuda()
        pred_intent, pred_slots = model(query)                true_intents += true_intent.tolist()        pred_intents += pred_intent.max(1)[1].tolist()        intent_loss = criterion(pred_intent, true_intent)        epoch_intent_loss += intent_loss
        #pred_slots.permute(0, 2, 1)        true_history += [str(item) for batch_num, sublist in enumerate(true_slots.tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        pred_history += [str(item) for batch_num, sublist in enumerate(pred_slots.max(1)[1].tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        slot_loss = criterion(pred_slots, true_slots)        epoch_slot_loss += slot_loss
        loss = alpha * intent_loss + (1 - alpha) * slot_loss        loss.backward()        optimizer.step()
        epoch_loss += loss.item()            return (epoch_loss / len(iter),            (epoch_intent_loss / len(iter), accuracy_score(true_intents, pred_intents)),            (epoch_slot_loss / len(iter), f1_score(true_history, pred_history)))
def distill_joint(teacher, student, temperature, iter, criterion, optimizer, cuda, alpha):    teacher.eval()    student.train()
    epoch_loss = 0
    epoch_intent_loss = 0    true_intents = []    pred_intents = []
    epoch_slot_loss = 0    true_history = []    pred_history = []
    for i, batch in enumerate(iter):        optimizer.zero_grad()        query = batch[0]        true_intent = batch[1]        true_slots = batch[2]        true_length = batch[3]
        if cuda:            query = query.cuda()            true_intent = true_intent.cuda()            true_slots = true_slots.cuda()            true_length = true_length.cuda()
        with torch.no_grad():            teacher_pred_intent, teacher_pred_slot = teacher(query)
        student_pred_intent, student_pred_slot = student(query)
        true_intents += true_intent.tolist()        pred_intents += student_pred_intent.max(1)[1].tolist()        intent_loss = criterion(F.log_softmax(student_pred_intent / temperature, dim=-1), F.softmax(teacher_pred_intent / temperature, dim=-1))        epoch_intent_loss += intent_loss
        true_history += [str(item) for batch_num, sublist in enumerate(true_slots.tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        pred_history += [str(item) for batch_num, sublist in enumerate(student_pred_slot.max(1)[1].tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        slot_loss = criterion(F.log_softmax(student_pred_slot / temperature, dim=1), F.softmax(teacher_pred_slot / temperature, dim=1))        epoch_slot_loss += slot_loss                loss = alpha * intent_loss + (1 - alpha) * slot_loss        loss.backward()        optimizer.step()        epoch_loss += loss.item()            return (epoch_loss / len(iter),            (epoch_intent_loss / len(iter), accuracy_score(true_intents, pred_intents)),            (epoch_slot_loss / len(iter), f1_score(true_history, pred_history)))
def valid_joint(model, iter, criterion, cuda, alpha):    model.eval()    epoch_loss = 0
    epoch_intent_loss = 0    true_intents = []    pred_intents = []
    epoch_slot_loss = 0    true_history = []    pred_history = []
    for i, batch in enumerate(iter):        query = batch[0]        true_intent = batch[1]        true_slots = batch[2]        true_length = batch[3]
        if cuda:            query = query.cuda()            true_intent = true_intent.cuda()            true_slots = true_slots.cuda()            true_length = true_length.cuda()
        pred_intent, pred_slots = model(query)                true_intents += true_intent.tolist()        pred_intents += pred_intent.max(1)[1].tolist()        intent_loss = criterion(pred_intent, true_intent)        epoch_intent_loss += intent_loss
        #pred_slots.permute(0, 2, 1)        true_history += [str(item) for batch_num, sublist in enumerate(true_slots.tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        pred_history += [str(item) for batch_num, sublist in enumerate(pred_slots.max(1)[1].tolist()) for item in sublist[1:true_length[batch_num].item() + 1]]        slot_loss = criterion(pred_slots, true_slots)        epoch_slot_loss += slot_loss
        loss = alpha * intent_loss + (1 - alpha) * slot_loss        epoch_loss += loss.item()
    return (epoch_loss / len(iter),            (epoch_intent_loss / len(iter), accuracy_score(true_intents, pred_intents)),            (epoch_slot_loss / len(iter), f1_score(true_history, pred_history)))