力荐!计算机视觉开源工具中的瑞士军刀—Dlib最新高级特性教程

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

OpenCV是计算机视觉开源工具中妇孺皆知的,但Dlib绝对是这几年快速上升的一颗新星,它并不追求大而全,但它实现的每一个模块和特性,都几乎是高质量开源算法的典范。

在刚刚结束的PyImageConf2018会议上,大名鼎鼎的Dlib库的创建者Davis King做了一个关于目标检测的报告,并举办了关于Dlib的含有40个新的开源Demo的各种计算机视觉与机器学习技术演示的WorkShop。展示了Dlib的强大锐利,是学习Dlib使用的绝佳资料,作者已将相关PPT、代码、数据开源,非常值得推荐!

Davis King本尊一直供职于工业界,热衷开源技术分享,最近今年尤其关注于计算机视觉与深度学习工具的构建,Dlib库中无论是其传统的HOG+SVM目标检测、高精度超快速广泛使用的人脸对齐,还是基于CNN的目标检测与人脸验证,Dlib每一次新特性和Demo的添加,几乎都是将学术界state-of-the-art技术实用化,令人印象深刻!

这次题为《Finding things in images How does that work? 》的目标检测报告,作者从滑动窗口讲到HOG检测器及其优化,并介绍了Dlib中基于图像金字塔的CNN目标检测,其速度很快且相比于SSD算法其对小目标检测性能更好,并分享了影响目标检测性能的一些因素,比如训练数据数量和质量及超参数的优化等,详细内容可在文末下载PPT查看。

在关于Dlib使用的WorkShop中,Davis King通过40个新的Python例子代码展示了Dlib解决目标检测问题从数据标注到训练模型到参数优化的方方面面,你会发现原来Python-Dlib这么简单(是的,有些功能只需要几行代码!),作者同时展示了Dlib中其他一些有趣功能和实践示例,每份代码都值得细读并在你的机器上跑一遍。

下面是这40个例子的主要功能:

001——训练HOG检测器;

002——运行HOG检测器;

003——为人脸特征点检测制作人脸图像数据和XML文件;

004——训练人脸特征点检测模型;

005——运行人脸特征点检测模型;

006——匈牙利算法;

007——8像素步长的HOG检测;

008——制作包围盒回归训练数据集;

009——训练目标检测中包围盒回归模型;

010——检测人脸并进行精确的包围盒回归定位;

011——全局最优化方法(这是Davis King强烈安利的新特性!);

012——训练包围盒回归模型并进行超参数搜索;

013——在视频中检测人脸并进行包围盒回归位置提精和卡尔曼滤波;

014——可分离滤波器;

015——训练nuclear norm的HOG检测器;

016——运行nuclear norm的HOG检测器;

017——训练多个HOG检测器;

018——运行多个HOG检测器;

019——训练多个HOG检测器并进行超参数优化;

020——图像哈希;

021-023——使用联通域分析进行斑点检测,并进行速度优化;

024——边缘检测并找直线;

025-026——通过梯度计算亮斑;

027——霍夫变换;

028-034——通过霍夫变换定位图像中的纸张;

035——通过mbd方法定位视频中旋转的指尖陀螺;

036——通过MSER进行文本检测;

037——训练RBF核的SVM的二类问题,自动优化最优参数(Dlib中的AutoML);

038——求和运算的缓存SIMD优化;

039——多线程数据加载;

040——使用CUDA进行矩阵运算加速。

Github地址:

https://github.com/davisking/pyimageconf2018