本文介绍用于智能驾驶场景的语义分割数据集Cityscapes。
1. Cityscapes数据集简介
- 在几个月的时间里,在 50 个城市的春季、夏季和秋季,主要是在德国,但也在邻近国家/地区,从移动车辆中获取了数十万帧。它们不是故意在恶劣的天气条件下记录的。
- 从 27 个城市手动选择 5000 张图像进行密集像素级标注,旨在实现前景物体、背景和整体场景布局的高度多样性。标注信息是在 30 帧视频片段的第 20 帧上完成的,提供完整的视频片段以提供上下文信息。
- 对于剩余的 23 个城市,每 20 秒或 20 米的行驶距离(以先到者为准)选择一张图像进行粗略标注,总共产生20,000 张图像。
- 密集标注的图像被分成单独的训练、验证和测试集。
- 粗略注释的图像仅作为额外的训练数据。
- 数据集中包含 19 种常用的类别(详细类别34类)用于分割精度的评估。
分组 | 类别 |
---|---|
flat | road · sidewalk · parking+ · rail track+ |
human | person* · rider* |
vehicle | car* · truck* · bus* · on rails* · motorcycle* · bicycle* · caravan*+ · trailer*+ |
construction | building · wall · fence · guard rail+ · bridge+ · tunnel+ |
object | pole · pole group+ · traffic sign · traffic light |
nature | vegetation · terrain |
void | ground+ · dynamic+ · static+ |
sky | sky |
2. 两行命令下载Cityscapes数据集
为了使用 City Scapes 数据集,您需要在他们的网站 (https://www.cityscapes-dataset.com/) 上创建一个帐户,然后登录才能下载数据。这使得很难直接在您的服务器上下载数据,本文提供一种脚本方式下载数据,脚本。
- 在第一个命令中,输入您的用户名和密码。这将使用您的凭据登录并保留关联的 cookie。
代码语言:javascript
复制
wget --keep-session-cookies --save-cookies=cookies.txt --post-data 'username=myusername&password=mypassword&submit=Login' https://www.cityscapes-dataset.com/login/
- 在第二个命令中,您需要提供 packageID 参数。
代码语言:javascript
复制
wget --load-cookies cookies.txt --content-disposition https://www.cityscapes-dataset.com/file-handling/?packageID=1
- packageID=1 将下载文件 gtFine_trainvaltest.zip 您可以将其更改为下载另一个包。packageIDs 映射如下: 1 -> gtFine_trainvaltest.zip (241MB) 2 -> gtCoarse.zip (1.3GB) 3 -> leftImg8bit_trainvaltest.zip (11GB) 4 -> leftImg8bit_trainvaltest.zip (44GB) 8 -> camera_trainvaltest.zip (2MB) 9 -> camera_trainextra.zip (8MB) 10 -> vehicle_trainvaltest.zip (2MB) 11 -> vehicle_trainextra.zip (7MB) 12 -> leftImg8bit_demoVideo.zip (6.6GB) 28 -> gtBbox_cityPersons_trainval.zip (2.2MB)
- 下载完毕后根据你的需求进行数据处理,官方的处理脚本地址:https://github.com/mcordts/cityscapesScripts
3. Cityscapes数据上的SOTA
排名 | 模型 | 指标(Mean Iou) | 年份 |
---|---|---|---|
1 | InternImage-H | 86.1% | 2022 |
2 | ViT-Adapter-L | 85.2% | 2022 |
3 | HRNetV2 + OCR + | 84.5% | 2019 |
4 | EfficientPS | 84.21% | 2020 |
5 | Panoptic-DeepLab | 84.2% | 2019 |