浙大博士整理的计算机视觉学习路线(含时间建议分配)

AI 显然是最近几年非常火的一个新技术方向,从几年前大家认识到 AI 的能力,到现在产业里已经在普遍的探讨 AI 如何落地了

我们可以预言未来在很多的领域,很多的行业,AI 都会在里边起到重要的作用。

目前在商业中有所应用,而且能够创收的只有搜索推荐和计算机视觉,因此,这两个方向的人力缺口很大。目前入门CV的常用套路就是:

  1. 看吴恩达《机器学习》《深度学习》课程,学一点机器学习的知识。
  2. 读几篇CV模型的文章,了解一下经典的Alexnet、R-CNN系列、YOLO等。
  3. 在github上找几个tensorflow、pytorch实现上述模型的开源代码。
  4. 下载VOC、ImageNet、COCO、kaggle等数据集。
  5. 按照开源代码中的Readme准备一下数据集,跑一下结果。

但好多初学者学了两个月、跑了几次结果后就认为已经入行CV了,其实不然,这里面有一个需要注意的问题:计算机视觉属于图像处理的范畴,而很多人却把它当成机器学习来看待。

然而实际上几乎80%的CV的从业者都没有从头至尾深入的学习图像处理方面的知识。

现在有了深度学习,不需要人为提取特征了,所以很多人不再关注图像底层的信息,而是直接越过这个根基去搭建模型,我觉得这是一个误区。不同领域的图像,例如OCT、MR、遥感、自然图像等等,有着巨大的特征差异,对这些特征差异性都不了解,怎么在搭建模型之后对精度进行提升和改进呢?怎么在原来模型的基础上做一些改变呢?因此,我认为好好学习一下图像预处理、后处理的知识对CV有着至关重要的作用,例如图像去噪、分割、增强、增广等等。

学习心态:日拱一卒,不期速成~早就是优势,早学早受益!

然而网上很多教程也比较碎片,鉴于此,整理一条学习路线,跟着这个路线重新去梳理一下你的学习计划,相信计算机视觉水平一定会有质的提升。

资源已经整理好了,文末附下载方式!以下是详细内容介绍~ 

第一章:机器学习与计算机视觉

计算机视觉简介

技术背景
  • 了解人工智能方向、热点
计算机视觉简介
  • cv简介
  • cv技能树构建
  • 应用领域
机器学习的数学基础
  • 线性与非线性变换
  • 概率学基础
  • kl散度
  • 梯度下降法

计算机视觉与机器学习基础

图像和视频
  • 图像的取样与量化
  • 滤波
  • 直方图
  • 上采样
  • 下采样
  • 卷积
  • 直方图均衡化算法
  • 最近邻差值
  • 单/双线性差值
特征选择与特征提取
  • 特征选择方法
  • filter等
  • 特征提取方法:PCA、LDA、SVD等
边缘提取
  • Canny
  • Roberts
  • Sobel
  • Prewitt
  • Hessian特征
  • Haar特征
相机模型
  • 小孔成像模型
  • 相机模型
  • 镜头畸变
  • 透视变换

计算机视觉与机器学习进阶

聚类算法
  • kmeans
  • 层次聚类
  • 密度聚类
  • 谱聚类
坐标变换与视觉测量
  • 左右手坐标系及转换
  • 万向锁
  • 旋转矩阵
  • 四元数
三维计算机视觉
  • 立体视觉
  • 多视几何
  • SIFT算法
三维计算机视觉与点云模型
  • PCL点云模型
  • spin image
  • 三维重构
  • SFM算法
图像滤波器
  • 直通滤波
  • 体素滤波
  • 双边滤波器
  • 条件滤波
  • 半径滤波
  • 图像增加噪声与降噪

OpenCV详解

OpenCV算法解析
  • 线性拟合
  • 最小二乘法
  • RANSAC算法
  • 哈希算法
  • DCT算法
  • 汉明距离
  • 图像相似度

第二章:深度学习与计算机视觉

神经网络

深度学习与神经网络
  • 深度学习简介
  • 基本的深度学习架构
  • 神经元
  • 激活函数详解(sigmoid、tanh、relu等)
  • 感性认识隐藏层
  • 如何定义网络层
  • 损失函数
推理和训练
  • 神经网络的推理和训练
  • bp算法详解
  • 归一化
  • Batch Normalization详解
  • 解决过拟合
  • dropout
  • softmax
  • 手推神经网络的训练过程
从零开始训练神经网络
  • 使用python从零开始实现神经网络训练
  • 构建神经网络的经验总结
深度学习开源框架
  • pytorch
  • tensorflow
  • caffe
  • mxnet
  • keras
  • 优化器详解(GD,SGD,RMSprop等

该视频出品人是王小天,目前就职于BAT之一,AI算法高级技术专家,法国TOP3高校双硕(计算机科学和数学应用双硕士)毕业。

👇长按下方二维码 2 秒

立即领取

(添加小助理人数较多,请耐心等待)

他在人工智能和芯片领域发表10余篇论文,具有深厚的学术背景和丰富的项目及业务落地经验。工作期间主要负责人工智能业务线CV与NLP相关算法工作,推进人机混合智能、语义分割、机器翻译、虹膜识别等模块的核心算法研究与优化。对图像分类、物体检测、目标跟踪、自动驾驶、计算机体系结构等有深入的研究。

兼具理论与实战落地经验,深知初学者学习痛点。说实话,这样资历的人,很难得。

这份教程是他8年人工领域实战经验的凝练,通过讲解和实战操作,让你能做到独立搭建和设计卷积神经网络(包括主流分类和检测网络),从检测模型教学逐步深入,帮你轻松掌握目标检测,并进行神经网络的训练和推理解决各种CV问题。

他对学习者的建议:计算机视觉的提升不在于搭建模型,而在于不断调优、改进过程中积累的经验。

我们该怎么针对不同领域的图像设置不同的参数?其中包括卷积核大小、网络架构、初始权重等等,不可能拿到一个模型,既适合医学图像,又适合人脸识别,这其中就需要n次从70%的精度调到95%以上中积累出经验。

而很多CV从业者觉得搭建出模型就告一段落,反反复复用不同的方式去搭建模型,先是tensorflow搭建完用pytorch搭,pytorch完事后用mxnet再来一遍,Python搭完用c/c++搭,但是至始至终没在精度和经验方面做出前进。

由于工作需要,这份教程我本人也在学习中,虽然已经从事这个行业多年,再看这份教程的时候,仍然能查漏补缺,收获满满,我相信不管是AI入门,还是已经具备了一定的工作经验,这份学习资料,都值得你去认真学习研究。

所有以上相关的的内容全部都已经打包好了,汇总成了一份百度云的链接,小贴心之处是怕有的兄弟没有买百度云会员的朋友,能用2MB+/S的速度下载,还特地给大家准备了下载工具。