如今有大量的资源可以用来学习计算机视觉技术,那我们如何从众多教程中进行选择呢?哪个值得我们去投入时间呢?如果你也遇到这些问题,那么恭喜你来对地方了。我们通过理解数百种资源来选择值得你花费时间的资源-这就是我们首先推出本文的主要原因之一。去年,我们广泛地专注于两个技术的学习方法——机器学习和深度学习,但是我们的社区需要更细化的学习路径——一个结构化的计算机视觉学习路径。

 

 

这是可以理解的,因为计算机视觉专家的需求和价值在业界遥遥领先。专门研究计算机视觉及其不同方面,你会看到大量招聘人员试图接近你。我记得当我开始自己的计算机视觉之旅时,我同时参考了多种资源——书籍、文章(当时并不多)、YouTube 视频等等。因此,我很高兴有机会为你整理这种结构化的计算机视觉学习路径。在开始学习之前,让我们了解一下为简化你的学习过程而构建的框架。我们的计算机视觉学习路径框架每个月都要有其对应的学习结构,这是我们对每个月需要了解的不同方面进行分类的方式:目标:这个月你会学到什么?关键要点是什么?你的计算机视觉之旅将如何进行?我们会在每个月初提及此问题,以确保你知道该月底的立场以及所处的位置建议时间:你每周平均应在该部分上花费多少时间学习资源:该月你将学习的计算机视觉主题的顶级资源集合,其中包括文章,教程,视频,研究论文和其他类似资源你可以在此处下载该学习路径的相应信息图。https://discuss.analyticsvidhya.com/t/heres-your-learning-path-to-master-computer-vision-in-2020/87785 在数据科学领域寻找其他学习途径?别担心,我们为你提供了:2020 年成为数据科学家和掌握机器学习的学习之路 https://www.analyticsvidhya.com/blog/2020/01/learning-path-data-scientist-machine-learning-20202020 年掌握深度学习的学习道路 https://www.analyticsvidhya.com/blog/2020/01/comprehensive-learning-path-deep-learning-2020 自然语言处理(NLP)学习路径 https://www.analyticsvidhya.com/blog/2020/01/learning-path-nlp-2020 第 1 个月 – 涵盖基础知识:Python 与统计目标:到第一个月末,你将对什么是计算机视觉有基本的了解。你还将对 Python 和 Statistics(计算机视觉之旅中的两个核心主题)有一定的知识储备。

 

 

建议时间:每周 5-6 小时

 

计算机视觉的介绍和动机:SAS 计算机视觉教程:它是什么,它为什么重要:https://www.sas.com/en_in/insights/analytics/computer-vision.html

OpenCV 中文官方教程 v4.1(可选):http://woshicver.com

 

先决条件:

Python:Analytics Vidhya 撰写的 Python 课程 https://courses.analyticsvidhya.com/courses/introduction-to-data-science 统计:可汗学院的描述性统计 https://www.khanacademy.org/math/engageny-alg-1/alg1-2 第 2 个月 – 使用机器学习解决图像分类问题目标:你将对机器学习有基本的了解。你应该熟悉不同的图像预处理技术,并能够使用机器学习模型解决图像分类问题。

 

 

建议时间:每周 5-6 小时

 

机器学习基础:机器学习基础 https://www.analyticsvidhya.com/blog/2015/06/machine-learning-basics/sklearn 中文官方教程 0.22.1(可选):http://sklearn123.com 线性回归 https://www.analyticsvidhya.com/blog/2017/06/a-comprehensive-guide-for-linear-ridge-and-lasso-regression/逻辑回归 https://www.analyticsvidhya.com/blog/2015/10/basics-logistic-regression/斯坦福大学-机器学习的动机与应用 https://see.stanford.edu/Course/CS229/47 斯坦福大学的“过拟合”和“过拟合”的概念 https://see.stanford.edu/Course/CS229/42 图像预处理:从图像中提取特征的 3 种技术 https://www.analyticsvidhya.com/blog/2019/08/3-techniques-extract-features-from-image-data-machine-learning-python/HOG 特征 https://www.analyticsvidhya.com/blog/2019/09/feature-engineering-images-introduction-hog-feature-descriptor/SIFT 特征 https://www.analyticsvidhya.com/blog/2019/10/detailed-guide-powerful-sift-technique-image-matching-python/使用机器学习进行图像分类:使用逻辑回归进行图像分类 https://www.kaggle.com/gulsahdemiryurek/image-classification-with-logistic-regression 使用 Logistic 回归进行图像分类 https://mmlind.github.io/Using_Logistic_Regression_to_solve_MNIST/项目:识别服装 https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-apparels/第三个月 –  Keras 和神经网络简介目标:你将学习最常用的深度学习工具之一-Keras,你还将了解什么是神经网络以及它们如何工作,到三月底,你将能够使用神经网络解决图像分类问题。

 

 

建议时间:每周 4-5 小时

 

学习 Keras:Keras 文档 https://keras.io/使用 Keras 构建神经网络 https://www.analyticsvidhya.com/blog/2016/10/tutorial-optimizing-neural-networks-using-keras-with-image-recognition-case-study/神经网络简介:从零开始的神经网络 https://www.analyticsvidhya.com/blog/2017/05/neural-network-from-scratch-in-python-and-r/斯坦福大学神经网络简介 https://youtu.be/d14TUNcbn1k3Blue1Brown 的神经网络:https://youtu.be/aircAruvnKk 项目:识别服装 https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-apparels/第 4 个月 – 了解卷积神经网络(CNN),迁移学习和参加比赛目标:我想将其称为计算机视觉之旅中的“进阶”月份。随着卷积神经网络(CNNs)的引入,学习也更上一层楼,这些 cnn 是我们最近看到的许多计算机视觉应用的幕后推手,包括目标检测。在你的旅程中,你也应该通过参加比赛来锻炼自己。

 

 

建议时间:每周 6-7 小时

 

卷积神经网络(CNN)简介:卷积神经网络(CNN)简化 https://www.analyticsvidhya.com/blog/2017/06/architecture-of-convolutional-neural-networks-simplified-demystified 斯坦福大学的卷积神经网络:https://youtu.be/bNb2fEVKeEo 迁移学习简介:掌握迁移学习 https://www.analyticsvidhya.com/blog/2017/06/transfer-learning-the-art-of-fine-tuning-a-pre-trained-model 斯坦福大学实践中的 ConvNets:https://youtu.be/dUTzeP_HTZg 项目:识别数字:https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-digits 参加比赛:DataHackhttps://datahack.analyticsvidhya.com/contest/allKagglehttps://www.kaggle.com/competitions 第 5 个月 – 解决对象检测问题目标:对象检测是一种广泛使用的计算机视觉技术(也许是使用最广泛的技术)。这是吸引我使用计算机视觉的原因!这个月就是要熟悉不同的对象检测算法。另外,我强烈建议你撰写到目前为止所学概念的文章。

 

 

建议时间:每周 6-7 小时

 

解决对象检测问题:目标检测技术的分步介绍 https://www.analyticsvidhya.com/blog/2018/10/a-step-by-step-introduction-to-the-basic-object-detection-algorithms-part-1 实现 faster RCNN 用于目标检测 https://www.analyticsvidhya.com/blog/2018/11/implementation-faster-r-cnn-python-object-detection 使用 YOLO 进行物体检测 https://www.analyticsvidhya.com/blog/2018/12/practical-guide-object-detection-yolo-framewor-python 斯坦福大学的物体检测:https://youtu.be/nDPWywWRIRoYOLO 论文 https://arxiv.org/pdf/1506.02640.pdfYOLO 预训练模型 https://pjreddie.com/darknet/yolo/项目:数脸挑战 https://datahack.analyticsvidhya.com/contest/vista-codefest-computer-vision-1COCO 物体检测挑战 http://cocodataset.org/#download 开始撰写文章,与社区互动吧!第 6 个月 – 了解图像分割和注意力模型目标:六月,你将学习如何解决图像分割问题,同时你还将了解什么是注意力模型(无论在理论上还是在实践上)。在这里,你对计算机视觉的深入了解才真正开始获得回报。

 

建议时间:每周 6-7 小时

 

图像分割简介:图像分割技术的分步介绍 https://www.analyticsvidhya.com/blog/2019/04/introduction-image-segmentation-techniques-python 实现 Mask R-CNN 进行图像分割 https://www.analyticsvidhya.com/blog/2019/07/computer-vision-implementing-mask-r-cnn-image-segmentationMask R-CNN 论文 https://arxiv.org/pdf/1703.06870.pdfMask R-CNN GitHub 存储库 https://github.com/matterport/Mask_RCNN 项目:COCO 分割挑战 http://cocodataset.org/#downloadAttention 模型:Sequence-to-Sequence Modeling with Attentionhttps://www.analyticsvidhya.com/blog/2018/03/essentials-of-deep-learning-sequence-to-sequence-modelling-with-attention-part-iSequence-to-Sequence Models by Stanfordhttps://nlp.stanford.edu/~johnhew/public/14-seq2seq.pdf 第 7 个月 – 探索深度学习工具目标:这是一个非常有趣的学习月!到目前为止,我们已经涵盖了许多计算机视觉概念,现在是时候动手使用最先进的深度学习框架了!这取决于你自己的选择,但我们建议你现在使用行业中最常见的两种工具——PyTorch 和 TensorFlow。尝试使用这两种工具中的任何一种来实现你到目前为止所涵盖的所有概念。

 

 

建议时间:每周 6-7 小时

 

PyTorch:PyTorch 教程 https://pytorch.org/tutorials/PyTorch 的初学者友好指南 https://www.analyticsvidhya.com/blog/2019/09/introduction-to-pytorch-from-scratchPyTorch 中文官方教程(可选)http://pytorch123.com

TensorFlow:

TensorFlow 教程 https://www.tensorflow.org/tutorialsTensorFlow 简介 https://www.analyticsvidhya.com/blog/2016/10/an-introduction-to-implementing-neural-networks-using-tensorflow 第 8 个月 – 了解 NLP 和图像字幕的基础目标:这是你专业化的开始。这是将你的深度学习知识与自然语言处理(NLP)概念结合起来来解决图像字幕项目。

 

 

建议时间:每周 6-7 小时

 

自然语言处理(NLP)的基础知识:斯坦福-词嵌入:https://youtu.be/ERibwqs9p38 递归神经网络(RNN)简介:https://youtu.be/UNmqTiOnRfgRNN 教程 http://www.wildml.com/2015/10/recurrent-neural-networks-tutorial-part-3-backpropagation-through-time-and-vanishing-gradients/了解图像字幕自动图像字幕 https://cs.stanford.edu/people/karpathy/sfmltalk.pdf 使用深度学习的图像字幕 https://www.analyticsvidhya.com/blog/2018/04/solving-an-image-captioning-task-using-deep-learning 项目:COCO 字幕挑战赛 http://cocodataset.org/#download 第 9 个月 – 熟悉生成对抗网络(GAN)目标:9 月,你将了解生成对抗网络(GAN)。自从 Ian Goodfellow 于 2014 年正式推出 GAN 以来,GANs 就火爆了起来。目前,GANs 的实际应用很多,包括修复、生成图像等。

 

 

建议时间:每周 6-7 小时

 

了解生成对抗网络(GAN):Ian Goodfellow 的生成对抗网络(GAN):https://youtu.be/HGYYEUSm-0QGAN 论文 https://arxiv.org/pdf/1406.2661.pdf 生成对抗网络的最新进展 https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8667290Keras-GANhttps://github.com/eriklindernoren/Keras-GAN 第 10 个月 – 视频分析简介目标:视频分析是计算机视觉中一个蓬勃发展的应用。到 2020 年(及以后),对这项技能的需求只增不减,因此学习如何使用视频数据集的知识是必要的。

建议时间:每周 5-6 小时

 

视频分析简介:计算视频中演员的放映时间 https://www.analyticsvidhya.com/blog/2018/09/deep-learning-video-classification-python 建立视频分类模型 https://www.analyticsvidhya.com/blog/2019/09/step-by-step-deep-learning-tutorial-video-classification-python 通过视频进行人脸检测 https://www.analyticsvidhya.com/blog/2018/12/introduction-face-detection-video-deep-learning-python 第 11 个月和第 12 个月 – 解决项目并参加竞赛目标:最后两个月都是关于参加多个项目和竞赛来获得实践经验的。到目前为止,我们除了学习概念外,还涵盖了多个项目——现在是时候在真实的数据集上检验你的学习成果了。

 

 

建议时间:每周 5-6 小时

 

数字识别器 https://www.kaggle.com/c/digit-recognizerImageNet 对象定位挑战 https://www.kaggle.com/c/imagenet-object-localization-challenge 年龄检测 https://datahack.analyticsvidhya.com/contest/practice-problem-age-detection 空中仙人掌鉴定 https://www.kaggle.com/c/aerial-cactus-identification 超声神经分割 https://www.kaggle.com/c/ultrasound-nerve-segmentation 对抗性攻击防御 https://www.kaggle.com/c/nips-2017-defense-against-adversarial-attack/overview 信息图– 2020 年计算机视觉学习之路学习新事物时跟踪进度是结构化学习过程的关键。为了方便在深入研究领域时勾选所有事项。还有什么比一个有插图的清单更好的呢?它逐月列出了计算机视觉学习的路径,请看下图:

 

 

参考链接:https://www.analyticsvidhya.com/blog/2020/01/computer-vision-learning-path-2020/