寫文章

首頁手記簡要回顧 ——...

簡要回顧 —— 重塑的DenseNets：超越ResNets和ViTs的新范式

標(biāo)簽：

機(jī)器學(xué)習(xí) 深度學(xué)習(xí) 計(jì)算機(jī)視覺

此标题通俗易懂地反映了文章内容，同时使用了符合中文口语习惯的表达方式。

焕新的DenseNet （RDNet），超越了Swin Transformer，ConvNeXt，和DeiT-III，匹敌MogaNet

DenseNets 重生版：超越ResNets和ViTs的范式转变
RDNet，由NAVER Cloud AI和NAVER AI Lab开发
2024 ECCV (Sik-Ho Tsang @ Medium)

图像分类（1989 … 2023）
[Vision Permutator (ViP)] [ConvMixer] [CrossFormer++] [FastViT] [EfficientFormerV2] [MobileViTv2] [ConvNeXt V2] [SwiftFormer] [OpenCLIP] 2024[FasterViT] [CAS-ViT] [TinySaver]
更多相关阅读请参见

DenseNet 重新审视，进行了架构调整、模块重新设计，以及改进的训练方案，以增加模型的宽度并提高内存效率。
最终，形成了RDNet，并最终超过了Swin Transformer、ConvNeXt 和 DeiT-III，并与MogaNet。

概要

RDNet
成果

1. RDNet (一个网络平台)

1.1. 现代训练安排

（在阅读这个故事之前，最好先了解一下[DenseNet]。）

从DenseNet-121 开始，应用了现代的训练设置，如标签平滑(Label Smoothing)、RandAugment、随机擦除、Mixup、CutMix、随机深度(Stochastic Depth)。
以下是用于优化DenseNet的实用细节如下，

1.1.1. 更宽泛更浅显地说来：

通过增加生长率（GR）来扩大网络的结构，同时减少其深度，以实现这一目标。具体来说，这里将GR从32大幅提升至120。
每阶段的块数进行了调整，从（6, 12, 48, 32）减少到一个更小的（3, 3, 12, 3），以进行深度调整。
训练速度和内存分别大约减少了35%和18%。GFLOPs显著增加至11.1，后续元素会对此进行相应的调整。

1.1.2. 升级的功能混合器

使用层归一化（LN）而不是批次归一化（BN）；采用后激活；使用深度卷积；减少归一化和激活的次数；并且使用卷积核大小为7。
这种设计显著提高了准确率（+0.9%），同时略微增加了计算成本。

1.1.3. 更大的中间通道尺寸

较大的输入维度对于深度卷积至关重要。* 块内的中间张量尺寸被扩展，超过了输入维度，（例如，扩展比ER被调整为6）。
GR可以减少到一半，例如：从120到60。
这样不仅实现了21%的更快训练速度，还实现了0.4%p的准确率提升。

1.1.4. 更多过渡部分

过渡层不仅在每个阶段之后使用，而是在每三个步长为1的块之后使用。
这些过渡层更注重维度减少而非下采样。
这种变化通常能提高准确性。

1.1.5. 补丁化模块

使用图像块作为模型初始层的输入。采用的设置是补丁大小为4、步幅为4。
这使得计算速度显著加快，而没有牺牲精度。

1.1.6. 精细过渡层

移除平均池化层，并通过调整卷积核的大小和步长来替代卷积（BN 被 LN 取代了）。

1.1.7. 通道重新调整

由于拼接特征的多样性，需要对通道进行重新缩放。
它带来了微小的+0.2%的提升。

1.2. 重新激活的密集网络 (RDNet)

增强型密集网络（RDNet）

一个RDNet家族成员是由不同的GR和Block（B）组合构建的，如上所示。

2. 结果如下

2.1. ImageNet

ImageNet（一个计算机视觉领域的著名图像数据集）

ImageNet（一个图像识别数据集）

RDNets在准确率上略逊一筹，但在速度上则有显著提升。

例如，RDNet-S 可以与较轻量的模型如 SMT-S 或 MogaNet-S 匹配使用。值得注意的是，RDNets 并不像 RDNet 那样占用大量内存，而是实现了更高的效率和更好的性能。

ImageNet

RDNets 凭借高精度、合理的内存使用和更快的运行速度，超越了竞争对手。

2.2. 零样本图像识别

Imagenet零样本分类 (Zero-Shot)

按照ConvNeXt和OpenCLIP的训练协议进行训练CLIP模型。RDNet的表现更佳。

2.3. 后续任务

ADE20K

RDNet表现出色的性能，这表明它在密集预测任务上的出色表现。

可可

RDNet在COCO上具有强劲的性能。

还有好多没提到的实验，可以直接看论文原文哦。

點(diǎn)擊查看更多內(nèi)容

為 TA 點(diǎn)贊

若覺得本文不錯(cuò)，就分享一下吧！

評論

評論

共同學(xué)習(xí)，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優(yōu)質(zhì)文章

正在加載中

POPMUISE

手記
篇

粉絲

81

獲贊與收藏

428

關(guān)注作者，訂閱最新文章

閱讀免費(fèi)教程

后端通用面試教程

41個(gè)小節(jié) 32194 359

網(wǎng)絡(luò)編程入門教程

20個(gè)小節(jié) 13289 250

Pandas 入門教程

25個(gè)小節(jié) 19886 373

推薦

評論

收藏

共同學(xué)習(xí)，寫下你的評論



感謝您的支持，我會(huì)繼續(xù)努力的～

掃碼打賞，你說多少就多少

贊賞金額會(huì)直接到老師賬戶

支付方式

打開微信掃一掃，即可進(jìn)行掃碼打賞哦

今天注冊有機(jī)會(huì)得

100積分直接送

付費(fèi)專欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與放棄機(jī)會(huì)

點(diǎn)擊
抽獎(jiǎng)

慕課手記新用戶專享福利

恭喜你，你的運(yùn)氣太好了，居然抽中了 100個(gè)積分！

恭喜你，抽中了價(jià)值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標(biāo)、機(jī)械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優(yōu)惠券
在等著你去兌換了噢

作者：

免費(fèi)贈(zèng)送

兌換碼：1111222211 復(fù)制

優(yōu)惠券可用于購買實(shí)戰(zhàn)課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學(xué)習(xí)，選課去


第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

簡要回顧 —— 重塑的DenseNets：超越ResNets和ViTs的新范式

閱讀免費(fèi)教程