[f1e01c]: / docs_zh-CN / dataset_prepare.md

Download this file

231 lines (180 with data), 9.8 kB

准备数据集

推荐用软链接,将数据集根目录链接到 $MMSEGMENTATION/data 里。如果您的文件夹结构是不同的,您也许可以试着修改配置文件里对应的路径。

mmsegmentation
├── mmseg
├── tools
├── configs
├── data
   ├── cityscapes
      ├── leftImg8bit
         ├── train
         ├── val
      ├── gtFine
         ├── train
         ├── val
   ├── VOCdevkit
      ├── VOC2012
         ├── JPEGImages
         ├── SegmentationClass
         ├── ImageSets
            ├── Segmentation
      ├── VOC2010
         ├── JPEGImages
         ├── SegmentationClassContext
         ├── ImageSets
            ├── SegmentationContext
               ├── train.txt
               ├── val.txt
         ├── trainval_merged.json
      ├── VOCaug
         ├── dataset
            ├── cls
   ├── ade
      ├── ADEChallengeData2016
         ├── annotations
            ├── training
            ├── validation
         ├── images
            ├── training
            ├── validation
   ├── CHASE_DB1
      ├── images
         ├── training
         ├── validation
      ├── annotations
         ├── training
         ├── validation
   ├── DRIVE
      ├── images
         ├── training
         ├── validation
      ├── annotations
         ├── training
         ├── validation
   ├── HRF
      ├── images
         ├── training
         ├── validation
      ├── annotations
         ├── training
         ├── validation
   ├── STARE
      ├── images
         ├── training
         ├── validation
      ├── annotations
         ├── training
         ├── validation
|   ├── dark_zurich
|      ├── gps
|         ├── val
|         └── val_ref
|      ├── gt
|         └── val
|      ├── LICENSE.txt
|      ├── lists_file_names
|         ├── val_filenames.txt
|         └── val_ref_filenames.txt
|      ├── README.md
|      └── rgb_anon
|      |   ├── val
|      |   └── val_ref
|   ├── NighttimeDrivingTest
|   |   ├── gtCoarse_daytime_trainvaltest
|   |      └── test
|   |          └── night
|   |   └── leftImg8bit
|   |   |   └── test
|   |   |       └── night
   ├── loveDA
      ├── img_dir
         ├── train
         ├── val
         ├── test
      ├── ann_dir
         ├── train
         ├── val

Cityscapes

注册成功后,数据集可以在 这里 下载。

通常情况下,**labelTrainIds.png 被用来训练 cityscapes。
基于 cityscapesscripts,
我们提供了一个 脚本,
去生成 **labelTrainIds.png

# --nproc 8 意味着有 8 个进程用来转换,它也可以被忽略。
python tools/convert_datasets/cityscapes.py data/cityscapes --nproc 8

Pascal VOC

Pascal VOC 2012 可以在 这里 下载。
此外,许多最近在 Pascal VOC 数据集上的工作都会利用增广的数据,它们可以在 这里 找到。

如果您想使用增广后的 VOC 数据集,请运行下面的命令来将数据增广的标注转成正确的格式。

# --nproc 8 意味着有 8 个进程用来转换,它也可以被忽略。
python tools/convert_datasets/voc_aug.py data/VOCdevkit data/VOCdevkit/VOCaug --nproc 8

关于如何拼接数据集 (concatenate) 并一起训练它们,更多细节请参考 拼接连接数据集

ADE20K

ADE20K 的训练集和验证集可以在 这里 下载。
您还可以在 这里 下载验证集。

Pascal Context

Pascal Context 的训练集和验证集可以在 这里 下载。
注册成功后,您还可以在 这里 下载验证集。

为了从原始数据集里切分训练集和验证集, 您可以在 这里
下载 trainval_merged.json。

如果您想使用 Pascal Context 数据集,
请安装 细节 然后再运行如下命令来把标注转换成正确的格式。

python tools/convert_datasets/pascal_context.py data/VOCdevkit data/VOCdevkit/VOC2010/trainval_merged.json

CHASE DB1

CHASE DB1 的训练集和验证集可以在 这里 下载。

为了将 CHASE DB1 数据集转换成 MMSegmentation 的格式,您需要运行如下命令:

python tools/convert_datasets/chase_db1.py /path/to/CHASEDB1.zip

这个脚本将自动生成正确的文件夹结构。

DRIVE

DRIVE 的训练集和验证集可以在 这里 下载。
在此之前,您需要注册一个账号,当前 '1st_manual' 并未被官方提供,因此需要您从其他地方获取。

为了将 DRIVE 数据集转换成 MMSegmentation 格式,您需要运行如下命令:

python tools/convert_datasets/drive.py /path/to/training.zip /path/to/test.zip

这个脚本将自动生成正确的文件夹结构。

HRF

首先,下载 healthy.zip glaucoma.zip, diabetic_retinopathy.zip, healthy_manualsegm.zip, glaucoma_manualsegm.zip 以及 diabetic_retinopathy_manualsegm.zip

为了将 HRF 数据集转换成 MMSegmentation 格式,您需要运行如下命令:

python tools/convert_datasets/hrf.py /path/to/healthy.zip /path/to/healthy_manualsegm.zip /path/to/glaucoma.zip /path/to/glaucoma_manualsegm.zip /path/to/diabetic_retinopathy.zip /path/to/diabetic_retinopathy_manualsegm.zip

这个脚本将自动生成正确的文件夹结构。

STARE

首先,下载 stare-images.tar, labels-ah.tarlabels-vk.tar

为了将 STARE 数据集转换成 MMSegmentation 格式,您需要运行如下命令:

python tools/convert_datasets/stare.py /path/to/stare-images.tar /path/to/labels-ah.tar /path/to/labels-vk.tar

这个脚本将自动生成正确的文件夹结构。

Dark Zurich

因为我们只支持在此数据集上测试模型,所以您只需下载验证集

Nighttime Driving

因为我们只支持在此数据集上测试模型,所以您只需下载测试集

LoveDA

可以从 Google Drive 里下载 LoveDA数据集

或者它还可以从 zenodo 下载, 您需要运行如下命令:

# Download Train.zip
wget https://zenodo.org/record/5706578/files/Train.zip
# Download Val.zip
wget https://zenodo.org/record/5706578/files/Val.zip
# Download Test.zip
wget https://zenodo.org/record/5706578/files/Test.zip

对于 LoveDA 数据集,请运行以下命令下载并重新组织数据集

python tools/convert_datasets/loveda.py /path/to/loveDA

请参照 这里 来使用训练好的模型去预测 LoveDA 测试集并且提交到官网。

关于 LoveDA 的更多细节可以在这里 找到。