第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

<sub id="q11q3"></sub>

<s id="q11q3"><li id="q11q3"></li></s>

我的購(gòu)物車

已加入門課程

購(gòu)物車?yán)锟湛杖缫?/h3>
快去這里選購(gòu)你中意的課程

實(shí)戰(zhàn)課

體系課

我的訂單中心

去購(gòu)物車

全部開(kāi)發(fā)者教程

TensorFlow 入門教程

TensorFlow 簡(jiǎn)介、安裝與快速入門

TensorFlow 簡(jiǎn)介 TensorFlow 安裝 - CPU TensorFlow 安裝 - GPU TensorFlow 快速入門示例

TensorFlow 模型的簡(jiǎn)潔表示-Keras

Keras 簡(jiǎn)介使用 tf.keras 進(jìn)行圖片分類使用 Keras 進(jìn)行文本分類使用 Keras 進(jìn)行回歸在 Keras 中保存與加載模型在 Keras 中進(jìn)行模型的評(píng)估 Keras 中的Masking 與 Padding

TensorFlow 中的數(shù)據(jù)格式

TensorFlow 中的數(shù)據(jù)核心使用 TensorFlow 加載 CSV 數(shù)據(jù) 使用 TensorFlow 加載 Numpy 數(shù)據(jù) 使用 TF 加載 DateFrame 數(shù)據(jù) 使用圖像數(shù)據(jù)來(lái)訓(xùn)練模型在 TensorFlow 之中使用文本數(shù)據(jù) TF 之中的 Unicode 數(shù)據(jù)格式的處理

TensorFlow模型的高級(jí)表示-Estimat

使用預(yù)設(shè)的 Estimator 模型將Keras模型轉(zhuǎn)化為Estimator模型 Estimator實(shí)現(xiàn)BoostingTree模型

TensorFlow 高級(jí)技巧

過(guò)擬合問(wèn)題 TensorFlow 中的回調(diào)函數(shù) 文本數(shù)據(jù)嵌入在 TensorFlow 之中使用卷積神經(jīng)網(wǎng)絡(luò) 在 TensorFlow 之中使用循環(huán)神經(jīng)網(wǎng)絡(luò) 在 TensorFlow 之中使用注意力模型在 TensorFlow 之中進(jìn)行遷移學(xué)習(xí) 在 TensorFlow 之中進(jìn)行數(shù)據(jù)增強(qiáng) 在 TensorFlow 之中進(jìn)行圖像分割如何進(jìn)行多 GPU 的分布式訓(xùn)練？使用 tf.function 提升效率使用 TF HUB 進(jìn)行模型復(fù)用

TensorFlow高級(jí)技巧-自定義

使用 TensorFlow 進(jìn)行微分操作在 TensorFlow 之中自定義網(wǎng)絡(luò)層與模型在 TensorFlow 之中自定義訓(xùn)練

TF 框架中的可視化工具-TensorBoard

TensorBoard 的簡(jiǎn)介與快速上手使用 TensorBoard 記錄訓(xùn)練中的各項(xiàng)指標(biāo) 在 TensorBoard 之中查看模型結(jié)構(gòu)圖在 TensorBoard 之中記錄圖片數(shù)據(jù)

首頁(yè) 慕課教程 TensorFlow 入門教程過(guò)擬合問(wèn)題

夜流歌 · 更新于 2020-10-28

上一節(jié)

Estimator實(shí)現(xiàn)BoostingTree模型

TensorFlow 中的回調(diào)函數(shù)

下一節(jié)

過(guò)擬合問(wèn)題

在我們之前的學(xué)習(xí)之中，我們或多或少都會(huì)遇到一些訓(xùn)練時(shí)間的問(wèn)題。比如“訓(xùn)練時(shí)間越長(zhǎng)是不是最后的結(jié)果就會(huì)越好？”等問(wèn)題。答案當(dāng)然是否定的，這是因?yàn)樵谟?xùn)練的過(guò)程之中會(huì)遭遇到“過(guò)擬合”的問(wèn)題，這是一種隨著訓(xùn)練時(shí)間不斷加長(zhǎng)而產(chǎn)生的問(wèn)題，那么這節(jié)課我們就來(lái)學(xué)習(xí)一下什么是過(guò)擬合，同時(shí)了解一下 TensorFlow 之中的避免過(guò)擬合的簡(jiǎn)單的方法。

這節(jié)課之中，我們使用之前學(xué)習(xí)過(guò)的貓狗分類的例子進(jìn)行示例演示。

1. 什么是過(guò)擬合

過(guò)擬合，簡(jiǎn)單來(lái)說(shuō)就是“學(xué)習(xí)過(guò)度”，也就是說(shuō)模型在訓(xùn)練集合上的精度越來(lái)越高，但是卻在測(cè)試集上的精度越來(lái)越低的情況。

這是因?yàn)?strong>網(wǎng)絡(luò)模型在訓(xùn)練集合上學(xué)習(xí)到了太多的“沒(méi)用的”特征，以至于模型的泛化能力下降。如下面兩幅圖所示，其中藍(lán)色代表訓(xùn)練集合上的指標(biāo)，而黃色代表測(cè)試集合上的指標(biāo)。

圖片描述

改圖為準(zhǔn)確率的曲線，通過(guò)上圖我們可以看到，隨著不斷地訓(xùn)練，模型在訓(xùn)練集合上的準(zhǔn)確率逐漸逼近100%，而訓(xùn)練集合上的準(zhǔn)確率卻一直在70%徘徊。

圖片描述

改圖為損失 Loss 的曲線，通過(guò)上圖我們可以看到，隨著不斷地訓(xùn)練，模型在訓(xùn)練集合上的損失逐漸逼近0，而訓(xùn)練集合上的損失卻在第三個(gè)迭代之后不斷升高。

那么接下來(lái)我們就來(lái)學(xué)習(xí)一下如何在 TensorFlow 之中簡(jiǎn)單地避免過(guò)擬合。這節(jié)課之中，我們要學(xué)習(xí)的方法有三種：

使用 DropOut ；
使用正則化；
使用早停策略。

值得注意的是，上述圖表已經(jīng)在之前的課程使用 tf.keras 進(jìn)行圖片分類之中給出，它的完整代碼為：

import tensorflow as tf
import os
import matplotlib.pyplot as plt

# 獲取數(shù)據(jù)
dataset_url = 'https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip'
path_download = os.path.dirname(tf.keras.utils.get_file('cats_and_dogs.zip', origin=dataset_url, extract=True))

# 獲得數(shù)據(jù)的路徑
train_dataset_dir = path_download + '/cats_and_dogs_filtered/train'
valid_dataset_dir = path_download + '/cats_and_dogs_filtered/validation'

# 定義相關(guān)的超參數(shù)
BATCH_SIZE = 64
TRAIN_NUM = 2000
VALID_NUM = 1000
EPOCHS = 15
Height = 128
Width = 128

# 創(chuàng)建訓(xùn)練集與測(cè)試集的迭代器
train_image_generator = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)
valid_image_generator = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

train_data_generator = train_image_generator.flow_from_directory(batch_size=BATCH_SIZE,
                              directory=train_dataset_dir,
                              shuffle=True,
                              target_size=(Height, Width),
                              class_mode='binary')
valid_data_generator = valid_image_generator.flow_from_directory(batch_size=BATCH_SIZE,
                              directory=valid_dataset_dir,
                              shuffle=True,
                              target_size=(Height, Width),
                              class_mode='binary')

# 定義一個(gè)線性模型
model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(16, 3, padding='same', activation='relu',
                input_shape=(Height, Width ,3)),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Conv2D(32, 3, padding='same', activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Conv2D(64, 3, padding='same', activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dense(1)
])

# 編譯模型
model.compile(optimizer='adam',
       loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
       metrics=['accuracy'])
model.summary()

# 訓(xùn)練模型
history = model.fit_generator(
    train_data_generator,
    steps_per_epoch=TRAIN_NUM // BATCH_SIZE,
    epochs=EPOCHS,
    validation_data=valid_data_generator,
    validation_steps=VALID_NUM // BATCH_SIZE)

# 獲取訓(xùn)練的記錄
acc = history.history['accuracy']
loss=history.history['loss']

val_acc = history.history['val_accuracy']
val_loss=history.history['val_loss']

epochs_ran = range(EPOCHS)

# 繪制訓(xùn)練過(guò)程中的各種指標(biāo)
plt.plot(epochs_ran, acc, label='Train Acc')
plt.plot(epochs_ran, val_acc, label='Valid Acc')
plt.show()

plt.plot(epochs_ran, loss, label='Train Loss')
plt.plot(epochs_ran, val_loss, label='Valid Loss')
plt.show()

2. 使用 DropOut

在產(chǎn)生過(guò)擬合的原因之中，一個(gè)重要的原因就是“網(wǎng)絡(luò)參數(shù)過(guò)多”，也就是網(wǎng)絡(luò)模型的學(xué)習(xí)能力過(guò)強(qiáng)，從而導(dǎo)致它會(huì)學(xué)習(xí)到很多沒(méi)用的信息，從而導(dǎo)致過(guò)擬合情況的發(fā)生。而使用 DropOut 就是在一定程度上降低網(wǎng)絡(luò)參數(shù)，降低它的學(xué)習(xí)能力。

它的實(shí)現(xiàn)比較簡(jiǎn)單:

tf.keras.layers.Dropout(frac)

可以看出，它是一個(gè)網(wǎng)絡(luò)層，它的參數(shù) frac 是一個(gè) 0 到 1 的小數(shù)，該網(wǎng)絡(luò)層會(huì)按照 frac 的概率隨機(jī)丟掉一些參數(shù)，從而達(dá)到降低網(wǎng)絡(luò)參數(shù)數(shù)量的目的。在使用的過(guò)程之中，我們只需要將該網(wǎng)絡(luò)層嵌入到模型的需要 DropOut 的網(wǎng)絡(luò)層之前即可。

于是我們可以將上述的網(wǎng)絡(luò)模型修改為：

model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(16, 3, padding='same', activation='relu',
                input_shape=(Height, Width ,3)),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Conv2D(32, 3, padding='same', activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Conv2D(64, 3, padding='same', activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(1)
])

然后我們運(yùn)行代碼，便可以得到網(wǎng)絡(luò)的結(jié)構(gòu)為：

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_3 (Conv2D)            (None, 128, 128, 16)      448       
_________________________________________________________________
max_pooling2d_3 (MaxPooling2 (None, 64, 64, 16)        0         
_________________________________________________________________
dropout (Dropout)            (None, 64, 64, 16)        0         
_________________________________________________________________
conv2d_4 (Conv2D)            (None, 64, 64, 32)        4640      
_________________________________________________________________
max_pooling2d_4 (MaxPooling2 (None, 32, 32, 32)        0         
_________________________________________________________________
dropout_1 (Dropout)          (None, 32, 32, 32)        0         
_________________________________________________________________
conv2d_5 (Conv2D)            (None, 32, 32, 64)        18496     
_________________________________________________________________
max_pooling2d_5 (MaxPooling2 (None, 16, 16, 64)        0         
_________________________________________________________________
dropout_2 (Dropout)          (None, 16, 16, 64)        0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 16384)             0         
_________________________________________________________________
dropout_3 (Dropout)          (None, 16384)             0         
_________________________________________________________________
dense_2 (Dense)              (None, 512)               8389120   
_________________________________________________________________
dropout_4 (Dropout)          (None, 512)               0         
_________________________________________________________________
dense_3 (Dense)              (None, 1)                 513       
=================================================================
Total params: 8,413,217
Trainable params: 8,413,217
Non-trainable params: 0

然后我們?cè)谟?xùn)練結(jié)束后便可以看到模型訓(xùn)練結(jié)果的準(zhǔn)確率曲線為：

圖片描述

而模型訓(xùn)練結(jié)果的損失Loss曲線為：

圖片描述

可以看到，與之前的模型相比，我們現(xiàn)在的模型在一定程度上降低了過(guò)擬合。對(duì)于準(zhǔn)確率，它并沒(méi)有像之前一樣保持徘徊，而是和訓(xùn)練集保持了一致；對(duì)于損失，它也沒(méi)有上升，反而是一直處于一個(gè)較低的值。

3. 使用正則化

正則化是一種比較高級(jí)的防止過(guò)擬合產(chǎn)生的方法。它是通過(guò)網(wǎng)絡(luò)的參數(shù)來(lái)計(jì)算網(wǎng)絡(luò)的“代價(jià)”，然后將代價(jià)最小化來(lái)實(shí)現(xiàn)降低網(wǎng)絡(luò)規(guī)模的目的。它主要包括兩種方式， L1 正則化與 L2 正則化，這兩種方式都涉及到很多的數(shù)學(xué)原理，因此這里不做過(guò)多的展開(kāi)，我們可以進(jìn)行一個(gè)簡(jiǎn)單的區(qū)分：

L1 正則化，代價(jià)與網(wǎng)絡(luò)參數(shù)成正比；
L2 正則化，代價(jià)與網(wǎng)絡(luò)參數(shù)的平方成正比。

而在實(shí)踐的過(guò)程之中，我們最常使用的就是 L2 正則化。

具體來(lái)說(shuō)，我們可以通過(guò)將支持正則化的網(wǎng)絡(luò)層添加相應(yīng)的正則化參數(shù)即可實(shí)現(xiàn)該網(wǎng)絡(luò)層的正則化。比如對(duì)于 Dense 網(wǎng)絡(luò)層來(lái)說(shuō)，我們可以添加參數(shù)：

tf.keras.laysers.Dense(64, kernel_regularizer=tf.keras.regularizers.l2(0.001)),

而其中的 0.001 參數(shù)就是“代價(jià)”與網(wǎng)絡(luò)參數(shù)的平方成正比的參數(shù)。也就是說(shuō)：

代價(jià) = 0.001 * (網(wǎng)絡(luò)參數(shù)**2)

于是我們可以將我們的模型再次修改為：


model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(16, 3, padding='same', activation='relu',
                input_shape=(Height, Width ,3),
                kernel_regularizer=tf.keras.regularizers.l2(0.001)),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Conv2D(32, 3, padding='same', activation='relu',
                kernel_regularizer=tf.keras.regularizers.l2(0.001)),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Conv2D(64, 3, padding='same', activation='relu',
                kernel_regularizer=tf.keras.regularizers.l2(0.001)),
    tf.keras.layers.MaxPooling2D(),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(512, activation='relu',
                kernel_regularizer=tf.keras.regularizers.l2(0.001)),
    tf.keras.layers.Dense(1)
])

在這里，我們?yōu)榫矸e層和稠密層增加了L2正則化。我們可以看到網(wǎng)絡(luò)的模型結(jié)構(gòu)為：

Model: "sequential_2"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_9 (Conv2D)            (None, 128, 128, 16)      448       
_________________________________________________________________
max_pooling2d_9 (MaxPooling2 (None, 64, 64, 16)        0         
_________________________________________________________________
conv2d_10 (Conv2D)           (None, 64, 64, 32)        4640      
_________________________________________________________________
max_pooling2d_10 (MaxPooling (None, 32, 32, 32)        0         
_________________________________________________________________
conv2d_11 (Conv2D)           (None, 32, 32, 64)        18496     
_________________________________________________________________
max_pooling2d_11 (MaxPooling (None, 16, 16, 64)        0         
_________________________________________________________________
flatten_3 (Flatten)          (None, 16384)             0         
_________________________________________________________________
dense_4 (Dense)              (None, 512)               8389120   
_________________________________________________________________
dense_5 (Dense)              (None, 1)                 513       
=================================================================
Total params: 8,413,217
Trainable params: 8,413,217
Non-trainable params: 0

我們可以發(fā)現(xiàn)，網(wǎng)絡(luò)的參數(shù)并沒(méi)有發(fā)生變化，這是因?yàn)檎齽t化并不會(huì)引入新的參數(shù)，也不會(huì)減少參數(shù)。

在訓(xùn)練結(jié)束后我們可以得到模型訓(xùn)練結(jié)果的準(zhǔn)確率曲線為：

圖片描述

而模型訓(xùn)練結(jié)果的損失Loss曲線為：

圖片描述

可以看到，與之前的模型相比，我們現(xiàn)在的模型在一定程度上降低了過(guò)擬合。對(duì)于損失這一點(diǎn)尤為明顯，它只在第 7 個(gè) Epoch 出現(xiàn)了上升，同時(shí)并沒(méi)有像之前一樣上升的如此劇烈。

4. 使用早停策略

這個(gè)策略會(huì)使用到我們下節(jié)課學(xué)習(xí)到的回調(diào)函數(shù)，但是這也是方式過(guò)擬合產(chǎn)生的一種手段。它的思想比較簡(jiǎn)單：

“如果你在驗(yàn)證集上的準(zhǔn)確率或者損失持續(xù)沒(méi)有提升，那么我就把你停止掉，不讓你繼續(xù)訓(xùn)練。”

在 TensorFlow 之中，我們可以通過(guò)以下的回調(diào)方式來(lái)實(shí)現(xiàn)早停：

callback = tf.keras.callbacks.EarlyStopping(monitor='loss', patience=3)

其中EarlyStopping的常用參數(shù)包括：

monitor: 指定哪一個(gè)指標(biāo)作為監(jiān)控的標(biāo)準(zhǔn)，一般為損失或者準(zhǔn)確率，這里是損失；
patience：忍耐限度，如果經(jīng)過(guò)了 patience 個(gè) epoch ，monitor 指標(biāo)還沒(méi)有提升，那么會(huì)停止訓(xùn)練。

于是我們可以將模型還原為之前的模型，同時(shí)在訓(xùn)練的代碼中添加相應(yīng)的早?；卣{(diào)。

callback = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=2)
history = model.fit_generator(
    train_data_generator,
    steps_per_epoch=TRAIN_NUM // BATCH_SIZE,
    epochs=EPOCHS,
    validation_data=valid_data_generator,
    validation_steps=VALID_NUM // BATCH_SIZE,
    callbacks=[callback])

在這里我們?cè)谟?xùn)練的過(guò)程之中添加了一個(gè)EarlyStopping的回調(diào)。

在訓(xùn)練結(jié)束后我們可以得到損失的準(zhǔn)確率的曲線為：

圖片描述

同時(shí)損失的曲線為：

圖片描述

我們可以看到，該模型在第 7 個(gè) Epoch 就停止了繼續(xù)訓(xùn)練，這是因?yàn)樗?Loss 在最近的兩個(gè) Epoch 并沒(méi)有持續(xù)的提升，從而避免了后面不必要的訓(xùn)練過(guò)程。

5. 小結(jié)

在這節(jié)課之中，我們學(xué)習(xí)了什么是過(guò)擬合，同時(shí)了解了如何在 TensorFlow 之中避免過(guò)擬合的發(fā)生，我們可以采用的方法有 DropOut 、正則化以及早停策略。而在實(shí)際的應(yīng)用之中，大家可以根據(jù)自己需要將不同的放過(guò)發(fā)結(jié)合起來(lái)使用，這樣才能達(dá)到比較良好的效果。

圖片描述

上一節(jié)

Estimator實(shí)現(xiàn)BoostingTree模型

下一節(jié)

TensorFlow 中的回調(diào)函數(shù)

我要提出意見(jiàn)反饋

索引目錄

過(guò)擬合問(wèn)題

1. 什么是過(guò)擬合

2. 使用 DropOut

3. 使用正則化

4. 使用早停策略

5. 小結(jié)

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

<cite id="hlq1i"></cite>