第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

<cite id="ce13y"><rp id="ce13y"></rp></cite>

我的購(gòu)物車(chē)

已加入門(mén)課程

購(gòu)物車(chē)?yán)锟湛杖缫?/h3>
快去這里選購(gòu)你中意的課程

實(shí)戰(zhàn)課

體系課

我的訂單中心

去購(gòu)物車(chē)

全部開(kāi)發(fā)者教程

TensorFlow 入門(mén)教程

TensorFlow 簡(jiǎn)介、安裝與快速入門(mén)

TensorFlow 簡(jiǎn)介 TensorFlow 安裝 - CPU TensorFlow 安裝 - GPU TensorFlow 快速入門(mén)示例

TensorFlow 模型的簡(jiǎn)潔表示-Keras

Keras 簡(jiǎn)介使用 tf.keras 進(jìn)行圖片分類(lèi) 使用 Keras 進(jìn)行文本分類(lèi) 使用 Keras 進(jìn)行回歸在 Keras 中保存與加載模型在 Keras 中進(jìn)行模型的評(píng)估 Keras 中的Masking 與 Padding

TensorFlow 中的數(shù)據(jù)格式

TensorFlow 中的數(shù)據(jù)核心使用 TensorFlow 加載 CSV 數(shù)據(jù) 使用 TensorFlow 加載 Numpy 數(shù)據(jù) 使用 TF 加載 DateFrame 數(shù)據(jù) 使用圖像數(shù)據(jù)來(lái)訓(xùn)練模型在 TensorFlow 之中使用文本數(shù)據(jù) TF 之中的 Unicode 數(shù)據(jù)格式的處理

TensorFlow模型的高級(jí)表示-Estimat

使用預(yù)設(shè)的 Estimator 模型將Keras模型轉(zhuǎn)化為Estimator模型 Estimator實(shí)現(xiàn)BoostingTree模型

TensorFlow 高級(jí)技巧

過(guò)擬合問(wèn)題 TensorFlow 中的回調(diào)函數(shù) 文本數(shù)據(jù)嵌入在 TensorFlow 之中使用卷積神經(jīng)網(wǎng)絡(luò) 在 TensorFlow 之中使用循環(huán)神經(jīng)網(wǎng)絡(luò) 在 TensorFlow 之中使用注意力模型在 TensorFlow 之中進(jìn)行遷移學(xué)習(xí) 在 TensorFlow 之中進(jìn)行數(shù)據(jù)增強(qiáng) 在 TensorFlow 之中進(jìn)行圖像分割如何進(jìn)行多 GPU 的分布式訓(xùn)練？使用 tf.function 提升效率使用 TF HUB 進(jìn)行模型復(fù)用

TensorFlow高級(jí)技巧-自定義

使用 TensorFlow 進(jìn)行微分操作在 TensorFlow 之中自定義網(wǎng)絡(luò)層與模型在 TensorFlow 之中自定義訓(xùn)練

TF 框架中的可視化工具-TensorBoard

TensorBoard 的簡(jiǎn)介與快速上手使用 TensorBoard 記錄訓(xùn)練中的各項(xiàng)指標(biāo) 在 TensorBoard 之中查看模型結(jié)構(gòu)圖在 TensorBoard 之中記錄圖片數(shù)據(jù)

首頁(yè) 慕課教程 TensorFlow 入門(mén)教程在 TensorFlow 之中使用注意力模型

夜流歌 · 更新于 2020-11-09

上一節(jié)

在 TensorFlow 之中使用循環(huán)神經(jīng)網(wǎng)絡(luò)

在 TensorFlow 之中進(jìn)行遷移學(xué)習(xí)

下一節(jié)

在 TensorFlow 之中使用注意力模型

在之前的學(xué)習(xí)之中，我們學(xué)習(xí)了很多的網(wǎng)絡(luò)模型，比如 CNN、RNN 等基本的網(wǎng)絡(luò)模型，雖然這些模型是根據(jù)人的信息處理方式來(lái)進(jìn)行設(shè)計(jì)并實(shí)現(xiàn)的，但是這些模型都有一些特點(diǎn)，那就是只是會(huì)根據(jù)輸入的數(shù)據(jù)進(jìn)行機(jī)械地輸出。那么我們這節(jié)課便要來(lái)學(xué)習(xí)一下更加 “貼近人的信息處理方式的方法”———— 注意力機(jī)制。

1. 什么是注意力機(jī)制

顧名思義，注意力機(jī)制，“Attention”，就是模仿人的注意力來(lái)進(jìn)行網(wǎng)絡(luò)模型的設(shè)計(jì)與實(shí)現(xiàn)。

我們每個(gè)人在日常生活之中，無(wú)時(shí)無(wú)刻不在使用著注意力，比如：

我們?cè)诳措娨暤臅r(shí)候會(huì)忽略掉電視周?chē)沫h(huán)境；
我們?cè)趯W(xué)習(xí)的時(shí)候會(huì)對(duì)書(shū)本的注意力集中度較高；
我們?cè)诼?tīng)音樂(lè)的時(shí)候?qū)σ魳?lè)本身的注意力較高，反而對(duì)周?chē)脑胍糇⒁饬^小。

在神經(jīng)網(wǎng)絡(luò)之中采用注意力可以機(jī)制可以通過(guò)模仿人類(lèi)的注意力行為，來(lái)對(duì)數(shù)據(jù)之中的重要的細(xì)節(jié)賦予更高的權(quán)重，反而對(duì)于一些不重要的細(xì)節(jié)來(lái)賦予較低的權(quán)重。

舉個(gè)例子，如下圖所示，有一只手拿著一朵花在以堆草叢之前，那么我們?nèi)嗽谟^察這種圖片的時(shí)候，一般會(huì)將更多的注意力集中在這朵花和這只手上，而不是將注意力放在背景的草叢中。因此我們要讓我們的網(wǎng)絡(luò)模型學(xué)會(huì)如何使用注意力機(jī)制，從而其實(shí)將注意力更多地放在花和手上。

圖片描述

2. 注意力的分類(lèi)

注意力按照存在的地方大概可以分為四類(lèi)：

空間注意力，就是我們上述圖片所表述的注意力，它主要是強(qiáng)調(diào)我們?cè)诳臻g之上要注意哪些地方；
時(shí)間注意力，圖片沒(méi)有時(shí)間注意力，像音頻、視頻等連續(xù)的數(shù)據(jù)會(huì)使用到時(shí)間注意力，表示我們?cè)谀膫€(gè)時(shí)間段要提高注意力；
通道注意力，眾所周知，一般的圖片包含三個(gè)通道：R、G、B，那么通道注意力就是強(qiáng)調(diào)在哪個(gè)通道之上給予更高的注意力權(quán)重；
混合注意力，使用上述兩種及其以上的注意力，從而達(dá)到更好的效果。

在接下來(lái)的例子之中，我們會(huì)以通道注意力為例子進(jìn)行演示如何使用注意力機(jī)制。

3. 通道上的注意力機(jī)制的實(shí)現(xiàn) ——SELayer

SENet 是一個(gè)使用通道注意力的模型，它可以對(duì)不同的通道求得不同的權(quán)重，進(jìn)而對(duì)他們加權(quán)，從而實(shí)現(xiàn)通道域上的注意力機(jī)制。

SELayer 是 SENet 之中的一個(gè)網(wǎng)絡(luò)層，是 SENet 的核心部分，我們可以將其單獨(dú)摘出來(lái)作為一個(gè)通道域上的注意力。

SELayer 的網(wǎng)絡(luò)圖如下圖所示：

圖片描述

在上圖之中，我們可以發(fā)現(xiàn)，對(duì)于已經(jīng)求得的特征（第二個(gè)正方體），SELayer 首先使用卷積網(wǎng)絡(luò)，將其變?yōu)?1 * 1 * C 的特征，然后對(duì)于該特征進(jìn)行一定的處理，處理結(jié)束之后的每一個(gè)通道的一個(gè)數(shù)字就代表著原特征圖的相應(yīng)通道的權(quán)重。最后我們將求得的權(quán)重乘到原特征上去便可以得到加權(quán)后的特征，這就表示我們已經(jīng)在通道域上實(shí)現(xiàn)了注意力機(jī)制。

在 TensorFlow 之中，我們可以通過(guò)繼承 tf.keras.laysers.Layer 類(lèi)來(lái)定義自己的網(wǎng)絡(luò)層，于是我們可以將我們的 SELayer 定義為如下：

class SELayer(tf.keras.Model):
    def __init__(self, filters, reduction=16):
        super(SELayer, self).__init__()
        self.filters = filters
        self.reduction = reduction
        self.GAP = tf.keras.layers.GlobalAveragePooling2D()
        self.FC = tf.keras.models.Sequential([
            tf.keras.layers.Dense(units=self.filters // self.reduction, input_shape=(self.filters, )),
            tf.keras.layers.Dropout(0.5),
            tf.keras.layers.BatchNormalization(),
            tf.keras.layers.Activation('relu'),
            tf.keras.layers.Dense(units=filters),
            tf.keras.layers.Dropout(0.5),
            tf.keras.layers.BatchNormalization(),
            tf.keras.layers.Activation('sigmoid')
        ])
        self.Multiply = tf.keras.layers.Multiply()

    def call(self, inputs, training=None, mask=None):
        x = self.GAP(inputs)
        x = self.FC(x)
        x = self.Multiply([x, inputs])
        return x

在初始化的函數(shù)之中，我們定義了我們需要用到的網(wǎng)絡(luò)層以及相應(yīng)的結(jié)構(gòu)，通過(guò) call 函數(shù)與初始化函數(shù)，我們可以得到該層的執(zhí)行方式：

首先數(shù)據(jù)會(huì)經(jīng)過(guò)一個(gè)全局平均池化，來(lái)變成一個(gè) 1* 1 * c 形狀的特征；
然后經(jīng)過(guò)我們定義的 FC 層，來(lái)計(jì)算出一個(gè) 1 * 1 * c 的權(quán)重，其中 FC 層包括；
- 一個(gè)全連接層；
- 一個(gè) DropOut 層用于避免過(guò)擬合；
- 一個(gè)批次正則化層，這是便于更好地進(jìn)行訓(xùn)練；
- 一個(gè) relu 激活函數(shù)；
- 另外一個(gè)全連接層；
- 另外一個(gè) DropOut 層；
- 另外一個(gè)批次正則化層；
- 一個(gè) sigmoid 激活函數(shù)；
在得到權(quán)重之后，我們便使用矩陣的乘法，將原來(lái)的輸出與權(quán)重相乘，從而得到在最終的結(jié)果。

4. 使用通道注意力機(jī)制的完整代碼

在定義了我們的注意力層之后，我們便可以著手將注意力機(jī)制應(yīng)用到我們之前的任務(wù)之中，在這里我們以以前學(xué)習(xí)過(guò)的貓和狗分類(lèi)為例子，添加我們的 Attention 機(jī)制，并且查看最終的結(jié)果：

import tensorflow as tf
import os
import matplotlib.pyplot as plt

dataset_url = 'https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip'
path_download = os.path.dirname(tf.keras.utils.get_file('cats_and_dogs.zip', origin=dataset_url, extract=True))
train_dataset_dir = path_download + '/cats_and_dogs_filtered/train'
valid_dataset_dir = path_download + '/cats_and_dogs_filtered/validation'

BATCH_SIZE = 64
TRAIN_NUM = 2000
VALID_NUM = 1000
EPOCHS = 15
Height = 128
Width = 128

train_image_generator = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)
valid_image_generator = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

train_data_generator = train_image_generator.flow_from_directory(batch_size=BATCH_SIZE,
                              directory=train_dataset_dir,
                              shuffle=True,
                              target_size=(Height, Width),
                              class_mode='binary')
valid_data_generator = valid_image_generator.flow_from_directory(batch_size=BATCH_SIZE,
                              directory=valid_dataset_dir,
                              shuffle=True,
                              target_size=(Height, Width),
                              class_mode='binary')
class SELayer(tf.keras.Model):
    def __init__(self, filters, reduction=16):
        super(SELayer, self).__init__()
        self.filters = filters
        self.reduction = reduction
        self.GAP = tf.keras.layers.GlobalAveragePooling2D()
        self.FC = tf.keras.models.Sequential([
            tf.keras.layers.Dense(units=self.filters // self.reduction, input_shape=(self.filters, )),
            tf.keras.layers.Dropout(0.5),
            tf.keras.layers.BatchNormalization(),
            tf.keras.layers.Activation('relu'),
            tf.keras.layers.Dense(units=filters),
            tf.keras.layers.Dropout(0.5),
            tf.keras.layers.BatchNormalization(),
            tf.keras.layers.Activation('sigmoid')
        ])
        self.Multiply = tf.keras.layers.Multiply()

    def call(self, inputs, training=None, mask=None):
        x = self.GAP(inputs)
        x = self.FC(x)
        x = self.Multiply([x, inputs])
        return x

    def build_graph(self, input_shape):
        input_shape_without_batch = input_shape[1:]
        self.build(input_shape)
        inputs = tf.keras.Input(shape=input_shape_without_batch)
        _ = self.call(inputs)

model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(16, 3, padding='same', activation='relu',
                input_shape=(Height, Width ,3)),
    tf.keras.layers.MaxPooling2D(),
    SELayer(16),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Conv2D(32, 3, padding='same', activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    SELayer(32),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Conv2D(64, 3, padding='same', activation='relu'),
    tf.keras.layers.MaxPooling2D(),
    SELayer(64),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(1)
])

model.compile(optimizer='adam',
       loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
       metrics=['accuracy'])
model.summary()

history = model.fit_generator(
    train_data_generator,
    steps_per_epoch=TRAIN_NUM // BATCH_SIZE,
    epochs=EPOCHS,
    validation_data=valid_data_generator,
    validation_steps=VALID_NUM // BATCH_SIZE)

acc = history.history['accuracy']
loss=history.history['loss']

val_acc = history.history['val_accuracy']
val_loss=history.history['val_loss']

epochs_ran = range(EPOCHS)

plt.plot(epochs_ran, acc, label='Train Acc')
plt.plot(epochs_ran, val_acc, label='Valid Acc')
plt.show()

plt.plot(epochs_ran, loss, label='Train Loss')
plt.plot(epochs_ran, val_loss, label='Valid Loss')
plt.show()

通過(guò)運(yùn)行代碼，我們可以得到運(yùn)行的結(jié)果：

Found 2000 images belonging to 2 classes.
Found 1000 images belonging to 2 classes.
Model: "sequential_7"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_4 (Conv2D)            (None, 128, 128, 16)      448       
_________________________________________________________________
max_pooling2d_4 (MaxPooling2 (None, 64, 64, 16)        0         
_________________________________________________________________
se_layer_3 (SELayer)         (None, 64, 64, 16)        117       
_________________________________________________________________
dropout_8 (Dropout)          (None, 64, 64, 16)        0         
_________________________________________________________________
conv2d_5 (Conv2D)            (None, 64, 64, 32)        4640      
_________________________________________________________________
max_pooling2d_5 (MaxPooling2 (None, 32, 32, 32)        0         
_________________________________________________________________
se_layer_4 (SELayer)         (None, 32, 32, 32)        298       
_________________________________________________________________
dropout_11 (Dropout)         (None, 32, 32, 32)        0         
_________________________________________________________________
conv2d_6 (Conv2D)            (None, 32, 32, 64)        18496     
_________________________________________________________________
max_pooling2d_6 (MaxPooling2 (None, 16, 16, 64)        0         
_________________________________________________________________
se_layer_5 (SELayer)         (None, 16, 16, 64)        852       
_________________________________________________________________
dropout_14 (Dropout)         (None, 16, 16, 64)        0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 16384)             0         
_________________________________________________________________
dropout_15 (Dropout)         (None, 16384)             0         
_________________________________________________________________
dense_14 (Dense)             (None, 512)               8389120   
_________________________________________________________________
dropout_16 (Dropout)         (None, 512)               0         
_________________________________________________________________
dense_15 (Dense)             (None, 1)                 513       
=================================================================
Total params: 8,414,484
Trainable params: 8,414,246
Non-trainable params: 238
_________________________________________________________________
Epoch 1/15
31/31 [==============================] - 56s 2s/step - loss: 0.7094 - accuracy: 0.5114 - val_loss: 0.6931 - val_accuracy: 0.5310
Epoch 2/15
31/31 [==============================] - 48s 2s/step - loss: 0.6930 - accuracy: 0.4990 - val_loss: 0.6927 - val_accuracy: 0.5869
......
Epoch 14/15
31/31 [==============================] - 54s 2s/step - loss: 0.6174 - accuracy: 0.6348 - val_loss: 0.6309 - val_accuracy: 0.7240
Epoch 15/15
31/31 [==============================] - 47s 2s/step - loss: 0.6030 - accuracy: 0.6446 - val_loss: 0.6195 - val_accuracy: 0.7565

于是我們可以發(fā)現(xiàn)，我們的模型最終達(dá)到了 75% 的準(zhǔn)確率，大家可以和之前的模型的結(jié)果做一個(gè)比較。

同時(shí)大家也可以根據(jù)自己對(duì) CNN 和 MaxPooling 的理解來(lái)調(diào)整模型以及相應(yīng)的參數(shù)，從而達(dá)到一個(gè)更好的效果。

5. 小結(jié)

通過(guò)這節(jié)課的學(xué)習(xí)，我們了解了什么是注意力機(jī)制，并且了解了注意力的分類(lèi)（空間、時(shí)間、通道、混合），并且手動(dòng)實(shí)現(xiàn)了一個(gè)通道域的注意力機(jī)制，并且最后進(jìn)行了實(shí)現(xiàn)。

圖片描述

上一節(jié)

在 TensorFlow 之中使用循環(huán)神經(jīng)網(wǎng)絡(luò)

下一節(jié)

在 TensorFlow 之中進(jìn)行遷移學(xué)習(xí)

我要提出意見(jiàn)反饋

索引目錄

在 TensorFlow 之中使用注意力模型

1. 什么是注意力機(jī)制

2. 注意力的分類(lèi)

3. 通道上的注意力機(jī)制的實(shí)現(xiàn) ——SELayer

4. 使用通道注意力機(jī)制的完整代碼

5. 小結(jié)

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

<sub id="1kiv6"></sub>