【数据集】Cityscapes-流行的语义分割数据集

本文介绍用于智能驾驶场景的语义分割数据集Cityscapes。

在这里插入图片描述

1. Cityscapes数据集简介

  • 在几个月的时间里,在 50 个城市的春季、夏季和秋季,主要是在德国,但也在邻近国家/地区,从移动车辆中获取了数十万帧。它们不是故意在恶劣的天气条件下记录的。
  • 从 27 个城市手动选择 5000 张图像进行密集像素级标注,旨在实现前景物体、背景和整体场景布局的高度多样性。标注信息是在 30 帧视频片段的第 20 帧上完成的,提供完整的视频片段以提供上下文信息。
  • 对于剩余的 23 个城市,每 20 秒或 20 米的行驶距离(以先到者为准)选择一张图像进行粗略标注,总共产生20,000 张图像。
  • 密集标注的图像被分成单独的训练、验证和测试集。
  • 粗略注释的图像仅作为额外的训练数据。
在这里插入图片描述
  • 数据集中包含 19 种常用的类别(详细类别34类)用于分割精度的评估。

分组

类别

flat

road · sidewalk · parking+ · rail track+

human

person* · rider*

vehicle

car* · truck* · bus* · on rails* · motorcycle* · bicycle* · caravan*+ · trailer*+

construction

building · wall · fence · guard rail+ · bridge+ · tunnel+

object

pole · pole group+ · traffic sign · traffic light

nature

vegetation · terrain

void

ground+ · dynamic+ · static+

sky

sky

在这里插入图片描述
在这里插入图片描述

2. 两行命令下载Cityscapes数据集

为了使用 City Scapes 数据集,您需要在他们的网站 (https://www.cityscapes-dataset.com/) 上创建一个帐户,然后登录才能下载数据。这使得很难直接在您的服务器上下载数据,本文提供一种脚本方式下载数据,脚本。

  • 在第一个命令中,输入您的用户名和密码。这将使用您的凭据登录并保留关联的 cookie。
代码语言:javascript
复制
wget --keep-session-cookies --save-cookies=cookies.txt --post-data 'username=myusername&password=mypassword&submit=Login' https://www.cityscapes-dataset.com/login/
  • 在第二个命令中,您需要提供 packageID 参数。
代码语言:javascript
复制
wget --load-cookies cookies.txt --content-disposition https://www.cityscapes-dataset.com/file-handling/?packageID=1
在这里插入图片描述
  • packageID=1 将下载文件 gtFine_trainvaltest.zip 您可以将其更改为下载另一个包。packageIDs 映射如下: 1 -> gtFine_trainvaltest.zip (241MB) 2 -> gtCoarse.zip (1.3GB) 3 -> leftImg8bit_trainvaltest.zip (11GB) 4 -> leftImg8bit_trainvaltest.zip (44GB) 8 -> camera_trainvaltest.zip (2MB) 9 -> camera_trainextra.zip (8MB) 10 -> vehicle_trainvaltest.zip (2MB) 11 -> vehicle_trainextra.zip (7MB) 12 -> leftImg8bit_demoVideo.zip (6.6GB) 28 -> gtBbox_cityPersons_trainval.zip (2.2MB)
  • 下载完毕后根据你的需求进行数据处理,官方的处理脚本地址:https://github.com/mcordts/cityscapesScripts

3. Cityscapes数据上的SOTA

排名

模型

指标(Mean Iou)

年份

1

InternImage-H

86.1%

2022

2

ViT-Adapter-L

85.2%

2022

3

HRNetV2 + OCR +

84.5%

2019

4

EfficientPS

84.21%

2020

5

Panoptic-DeepLab

84.2%

2019