Boostcamper's TIL (16)
Segmentation
Recative Fieldのモデルを拡張
1. DeepLab v2
1) DeepLab v2?
ResNet-101を使用すると、
1) DeepLab v2?
ResNet-101を使用すると、
2) Atrous Spatial Pyramid Pooling (ASPP)
複数の
3) Architecture
conv1_block = nn.Sequential(
nn.Conv2d(3, 64, 7, 2, 3),
nn.BatchNorm2d(64),
nn.ReLU()
)
conv2_sub_block = nn.Sequential(
nn.Conv2d(64, 64, 1, 1, 0),
nn.BatchNorm2d(64),
nn.ReLU(),
nn.Conv2d(64, 64, 3, 1, 1),
nn.BatchNorm2d(64),
nn.ReLU(),
nn.Conv2d(64, 256, 1, 1, 0),
nn.BatchNorm2d(256)
) # conv2_sub_block을 3회 반복
identity_block = nn.Sequential(
nn.Conv2d(64, 256, 1, 1, 0),
nn.BatchNorm2d(256)
)
2. PSPNet
1) PSPNet?
不整合関係:周囲の特徴を考慮してexを予測)湖周辺の船をcarと予測する場合がある.
Confusionカテゴリ:カテゴリ間の関係を使用して混乱予測を回避
独立した評価:より小さなオブジェクトがグローバルコンテキスト情報を使用してよりよく予測できるようにする
2) Pyramid Pooling Module
3. DeepLab v3
1) DeepLab v3?
2) Architecture
4. DeepLab v3+
1) DeepLab v3+?
2) Architecture
Encoder
Decoder
3) Xception
Depthwise Convolution
nn.Conv2d(in_channels=128, out_channels=256, kernel_size=3, stride=1, groups=128)
# in_channels와 groups를 같게 (Depthwise Convolution)
Pointwise Convolution
nn.Conv2d(in_channels=256, out_channels=256, kernel_size=1, stride=1
# kernel_size가 1, (Pointwise Convolution)
5. Implementation
6. Reference
Reference
この問題について(Boostcamper's TIL (16)), 我々は、より多くの情報をここで見つけました
https://velog.io/@choihj94/Boostcampers-TIL-16
テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol
Reference
この問題について(Boostcamper's TIL (16)), 我々は、より多くの情報をここで見つけました https://velog.io/@choihj94/Boostcampers-TIL-16テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol