windows编译tensorflow tensorflow单机多卡程序的框架 tensorflow的操作 tensorflow的变量初始化和scope 人体姿态检测 segmentation标注工具 tensorflow模型恢复与inference的模型简化 利用多线程读取数据加快网络训练 tensorflow使用LSTM pytorch examples 利用tensorboard调参 深度学习中的loss函数汇总 纯C++代码实现的faster rcnn tensorflow使用记录 windows下配置caffe_ssd use ubuntu caffe as libs use windows caffe like opencv windows caffe implement caffe model convert to keras model flappyBird DQN Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Neural Networks Fast-style-transfer tensorflow安装 tensorflow DQN Fully Convolutional Models for Semantic Segmentation Transposed Convolution, Fractionally Strided Convolution or Deconvolution 基于tensorflow的分布式部署 用python实现mlp bp算法 用tensorflow和tflearn搭建经典网络结构 Data Augmentation Tensorflow examples Training Faster RCNN with Online Hard Example Mining 使用Tensorflow做Prisma图像风格迁移 RNN(循环神经网络)推导 深度学习中的稀疏编码思想 利用caffe与lmdb读写图像数据 分析voc2007检测数据 用python写caffe网络配置 ssd开发 将KITTI的数据格式转换为VOC Pascal的xml格式 Faster RCNN 源码分析 在Caffe中建立Python layer 在Caffe中建立C++ layer 为什么CNN反向传播计算梯度时需要将权重旋转180度 Caffe使用教程(下) Caffe使用教程(上) CNN反向传播 Softmax回归 Caffe Ubuntu下环境配置

Image Parsing

2019年04月18日

Image Parsing

github

本文的目的是为了复现和分析主流的基于PSPnet和DeepLab系列的图像分割框架。

直接贴结果:实验主要在CityScapes上single scale的测试validation data

首先需要预训练backbone在Imagenet的分类,实验中发现如果train from scartch,将完全无法复现论文的结果而且结果差距会比较大。本文训练了基于不同版本的resnet101作为backbone。

PSPNet backbone 在Imagenet的validation上single test: top1 72.64%, top5 91.16%

Deeplab 在Imagenet的validation上single test: top1 69.38%, top5 88.92%(由于时间问题未充分训练)

PSPNet-GN backbone 在Imagenet的validation上single test: top1 72.09%, top5 90.83%

下面分别展示Imagenet上训练曲线

PSPNet backbone

1

PSPNet-GN backbone

2

Deeplab

3

Deeplab v2 mIoU为 71.16 可见使用element-wise add方式聚合不同感受野尺度的特征混乱了多尺度的特征

Deeplab v3 mIoU为 76.03

PSPNet mIoU为 77.08

PSPNet GN mIoU为 76.11 实验表明利用Group normalization在GPU显存受限时候能得到多卡Synchronous batch normalization接近的结果

看我写的辛苦求打赏啊!!!有学术讨论和指点请加微信manutdzou,注明

20


blog comments powered by Disqus