首頁猿問 PyTorch：簡單的前饋神經(jīng)網(wǎng)絡...

PyTorch：簡單的前饋神經(jīng)網(wǎng)絡在沒有retain_graph=True的情況下無法運行

Python

手掌心 2022-08-16 18:33:56

下面是我用于訓練前饋神經(jīng)網(wǎng)絡（FFNN）的代碼。標簽是介于 0 和 50 之間的數(shù)字。FFNN由具有50個神經(jīng)元的單個隱藏層和具有51個神經(jīng)元的輸出層組成。此外，我還使用了負對數(shù)似然損失。我對PyTorch很陌生，所以我使用幾個網(wǎng)站作為指導。奇怪的是，它們都不需要retain_graph設置為 True（它們在調(diào)用時不會傳遞任何參數(shù)）。此外，它運行得非常慢，精度似乎在固定值附近波動，而不是降低。backward()假設輸入的格式是正確的，有人可以向我解釋為什么網(wǎng)絡表現(xiàn)如此糟糕，以及為什么網(wǎng)絡需要將retain_graph設置為True？謝謝！n_epochs = 2batch_size = 100for epoch in range(n_epochs): permutation = torch.randperm(training_set.size()[0]) for i in range(0, training_set.size()[0], batch_size): opt.zero_grad() indices = permutation[i:i + batch_size] batch_features = training_set[indices] batch_labels = torch.LongTensor([label for label, sent in train[indices]]) batch_outputs = model(batch_features) loss = loss_function(batch_outputs, batch_labels) loss.backward(retain_graph=True) opt.step()

查看完整描述