【数据集】Cityscapes-流行的语义分割数据集

本文介绍用于智能驾驶场景的语义分割数据集Cityscapes。

1. Cityscapes数据集简介

在几个月的时间里，在 50 个城市的春季、夏季和秋季，主要是在德国，但也在邻近国家/地区，从移动车辆中获取了数十万帧。它们不是故意在恶劣的天气条件下记录的。
从 27 个城市手动选择 5000 张图像进行密集像素级标注，旨在实现前景物体、背景和整体场景布局的高度多样性。标注信息是在 30 帧视频片段的第 20 帧上完成的，提供完整的视频片段以提供上下文信息。
对于剩余的 23 个城市，每 20 秒或 20 米的行驶距离（以先到者为准）选择一张图像进行粗略标注，总共产生20,000 张图像。
密集标注的图像被分成单独的训练、验证和测试集。
粗略注释的图像仅作为额外的训练数据。

数据集中包含 19 种常用的类别（详细类别34类）用于分割精度的评估。

分组	类别
flat	road · sidewalk · parking+ · rail track+
human	person* · rider*
vehicle	car* · truck* · bus* · on rails* · motorcycle* · bicycle* · caravan+ · trailer+
construction	building · wall · fence · guard rail+ · bridge+ · tunnel+
object	pole · pole group+ · traffic sign · traffic light
nature	vegetation · terrain
void	ground+ · dynamic+ · static+
sky	sky

2. 两行命令下载Cityscapes数据集

为了使用 City Scapes 数据集，您需要在他们的网站 (https://www.cityscapes-dataset.com/) 上创建一个帐户，然后登录才能下载数据。这使得很难直接在您的服务器上下载数据，本文提供一种脚本方式下载数据，脚本。

在第一个命令中，输入您的用户名和密码。这将使用您的凭据登录并保留关联的 cookie。

代码语言：javascript

复制

wget --keep-session-cookies --save-cookies=cookies.txt --post-data 'username=myusername&password=mypassword&submit=Login' https://www.cityscapes-dataset.com/login/

在第二个命令中，您需要提供 packageID 参数。

代码语言：javascript

复制

wget --load-cookies cookies.txt --content-disposition https://www.cityscapes-dataset.com/file-handling/?packageID=1

packageID=1 将下载文件 gtFine_trainvaltest.zip 您可以将其更改为下载另一个包。packageIDs 映射如下： 1 -> gtFine_trainvaltest.zip (241MB) 2 -> gtCoarse.zip (1.3GB) 3 -> leftImg8bit_trainvaltest.zip (11GB) 4 -> leftImg8bit_trainvaltest.zip (44GB) 8 -> camera_trainvaltest.zip (2MB) 9 -> camera_trainextra.zip (8MB) 10 -> vehicle_trainvaltest.zip (2MB) 11 -> vehicle_trainextra.zip (7MB) 12 -> leftImg8bit_demoVideo.zip (6.6GB) 28 -> gtBbox_cityPersons_trainval.zip (2.2MB)
下载完毕后根据你的需求进行数据处理，官方的处理脚本地址：https://github.com/mcordts/cityscapesScripts

3. Cityscapes数据上的SOTA

排名	模型	指标（Mean Iou）	年份
1	InternImage-H	86.1%	2022
2	ViT-Adapter-L	85.2%	2022
3	HRNetV2 + OCR +	84.5%	2019
4	EfficientPS	84.21%	2020
5	Panoptic-DeepLab	84.2%	2019