Cum de a transforma ieșire de rețea neuronală și încă tren?

Question 1

Am si eu o rețea neuronală care emite output. Vreau să se transforme output înainte de pierderea și backpropogation se întâmple.

Aici este meu generale cod:

with torch.set_grad_enabled(training):
                  outputs = net(x_batch[:, 0], x_batch[:, 1]) # the prediction of the NN
                  # My issue is here:
                  outputs = transform_torch(outputs)
                  loss = my_loss(outputs, y_batch)

                  if training:
                      scheduler.step()
                      loss.backward()
                      optimizer.step()

Am o funcție de transformare care mi-am pus de ieșire prin:

def transform_torch(predictions):
    torch_dimensions = predictions.size()
    torch_grad = predictions.grad_fn
    cuda0 = torch.device('cuda:0')
    new_tensor = torch.ones(torch_dimensions, dtype=torch.float64, device=cuda0, requires_grad=True)
    for i in range(int(len(predictions))):
      a = predictions[i]
      # with torch.no_grad(): # Note: no training happens if this line is kept in
      new_tensor[i] = torch.flip(torch.cumsum(torch.flip(a, dims = [0]), dim = 0), dims = [0])
    return new_tensor

Problema mea este ca am primit o eroare la ultima linie:

RuntimeError: a view of a leaf Variable that requires grad is being used in an in-place operation.

Orice sugestii? Deja am încercat, folosind "cu lanterna.no_grad():" (comentat), dar acest lucru duce la foarte slabă pregătire și cred că degradeuri nu backpropogate în mod corespunzător, după funcția de transformare.

Multumesc!!!

Question 2

Eroarea este destul de corect despre ce problema este - atunci când creați un nou tensor cu requires_grad = True, puteți crea un nod frunză în grafic (doar ca parametri de model) și nu au voie să facă în locul operare pe el.

Soluția este simplă, nu este nevoie pentru a crea new_tensor în avans. Acesta nu ar trebui să fie un nod frunză; trebuie doar să-l creeze pe zbor

new_tensor = [ ]
for i in range(int(len(predictions))):
    a = predictions[i]
    new_tensor.append(torch.flip(torch.cumsum(torch.flip(a, ...), ...), ...))

new_tensor = torch.stack(new_tensor, 0)

Asta new_tensor va moșteni proprietăți, cum ar fi dtype, device din predictions și va avea require_grad = True deja.

ayandas · Answer 1 · 2021-11-20T04:18:52

Eroarea este destul de corect despre ce problema este - atunci când creați un nou tensor cu requires_grad = True, puteți crea un nod frunză în grafic (doar ca parametri de model) și nu au voie să facă în locul operare pe el.

Soluția este simplă, nu este nevoie pentru a crea new_tensor în avans. Acesta nu ar trebui să fie un nod frunză; trebuie doar să-l creeze pe zbor

new_tensor = [ ]
for i in range(int(len(predictions))):
    a = predictions[i]
    new_tensor.append(torch.flip(torch.cumsum(torch.flip(a, ...), ...), ...))

new_tensor = torch.stack(new_tensor, 0)

Asta new_tensor va moșteni proprietăți, cum ar fi dtype, device din predictions și va avea require_grad = True deja.

Cum de a transforma ieșire de rețea neuronală și încă tren?

Problema

Cel mai bun răspuns

În alte limbi

Această pagină este în alte limbi

Popular în această categorie

Întrebări frecvente în această categorie