1 回答

TA貢獻(xiàn)1872條經(jīng)驗(yàn) 獲得超4個(gè)贊
在一個(gè)簡(jiǎn)單的觀點(diǎn)中,您可以將一個(gè)LSTM層視為具有內(nèi)存的增強(qiáng)Dense層(因此可以有效地處理序列)。所以“單元”的概念對(duì)于兩者來說也是相同的:這些層的神經(jīng)元或特征單元的數(shù)量,或者換句話說,這些層可以從輸入中提取的獨(dú)特特征的數(shù)量。
因此,當(dāng)您將層的單元數(shù)指定為 3 時(shí)LSTM,或多或少意味著該層只能從輸入時(shí)間步長(zhǎng)中提取 3 個(gè)不同的特征(注意,單元數(shù)與輸入序列的長(zhǎng)度無關(guān),即LSTM無論單元的數(shù)量或輸入序列的長(zhǎng)度是多少,該層都將處理整個(gè)輸入序列)。
通常,這可能不是最理想的(不過,這實(shí)際上取決于您正在處理的特定問題和數(shù)據(jù)集的難度;即,對(duì)于您的問題/數(shù)據(jù)集,也許 3 個(gè)單位可能就足夠了,您應(yīng)該嘗試找出答案)。因此,通常會(huì)為單元的數(shù)量選擇更高的數(shù)字(常見選擇:32、64、128、256),并且分類任務(wù)也被委托給Dense位于頂部的專用層(或有時(shí)稱為“softmax 層”)該模型。
例如,考慮到問題的描述,具有 3 個(gè)堆疊LSTM層和Dense頂部分類層的模型可能如下所示:
model = Sequential()
model.add(LSTM(64, return_sequences=True, input_shape=(3000, 4)))
model.add(LSTM(64, return_sequences=True))
model.add(LSTM(32, return_sequences=True))
model.add(Dense(3, activation = 'softmax'))
添加回答
舉報(bào)