根据视觉的应用场景不同 , 计算机视觉分为了传统视觉和与深度学习结合的计算机视觉 , 两个分支要求你学习的内容也不同 。
传统计算机视觉
传统计算机视觉的应用主要在制造针对特定对象的检测器 , 如边缘检测 , 霍夫变换 , 斑点检测 , 角点检测 。其优势体现在精准度和计算复杂性等方面 。
对此 , 你需要学习在一些具体的应用层面的知识 。
【一文读懂AI计算机视觉技术】1、ROS
ROS(robotics operating system)机器人操作系统 , 目前能够应用的是机器人领域 , 主要是机器人的建模、感知、导航、规划等 。
文章插图
而ROS与计算机视觉的交织领域是机器视觉 , 目前 , 机器视觉解决方案尚面临着9大挑战:照明、变形或铰接、职位和方向、背景、闭塞、比例、照相机放置、运动、期望 。
因此 , 解决机器人在环境中的视觉 , 任务设置和工作场所等问题 , 需要在计算机视觉领域的更多投入 。
2、自动驾驶
计算机视觉在无人车上的使用有一些比较直观的例子 , 比如交通标志和信号灯的识别(google)、高速公路车道的检测定位(特斯拉) 。现在基于LiDAR信息实现的一些功能模块 , 其实也可以用摄像头基于计算机视觉来实现 。
从计算机视觉的角度 , 无人驾驶可能是一次难得的机遇 , 数据的极大丰富和算法的迭代提高相辅相成 , 会推动计算机视觉研究前进 , 并使之在无人驾驶中起到更加不可或缺的作用 。
与深度学习结合的计算机视觉
与深度学习结合 , 作为传统计算机视觉的一个补充 , 它的应用领域主要在一些能允许一定错误率的行业 , 比如图像搜索、监视、自动化零售等 , 其最大的优势就是自动创建特性、具有实时决策功能 。
1、深度学习
深度学习(Deep Learning)的概念是Hinton等人于2006年提出的 , 最早最成功的应用领域就是计算机视觉 , 经典的卷积神经网络就是为专门处理图片数据而生 。
目前深度学习已经广泛应用在计算机视觉、语音识别、自然语言处理、智能推荐等领域 。关于深度学习的方法 , 大致分为三种:
◆ 深度监督学习
监督学习应用在当数据标记、分类器分类或数值预测的情况 。
◆ 深度无监督学习
当输入数据没有标记时 , 可应用无监督学习方法从数据中提取特征并对其进行分类或标记 。
◆ 深度强化学习
强化学习使用奖惩系统预测学习模型的下一步 。这主要用于游戏和机器人 , 解决平常的决策问题 。
2、CNN
计算机视觉里经常使卷积神经网络 , 即CNN , 是一种对人脑比较精准的模拟 。
什么是卷积?卷积就是两个函数之间的相互关系 , 然后得出一个新的值 , 他是在连续空间做积分计算 , 然后在离散空间内求和的过程 。实际上在计算机视觉里面 , 可以把卷积当做一个抽象的过程 , 就是把小区域内的信息统计抽象出来 。
那为什么时隔20年 , 卷积神经网络能卷土重来、占领主流?原因有二:
◆ 深度的卷积神经网络需要大量数据进行训练 , 否则机器学习中的过拟合将不可避免 。而2006及2007年开始 , 正好是互联网开始大量产生各种各样的图片数据的时候 。
◆ 随着GPU计算能力的增长 , 运算能力的提升 , 使卷积神经网络结合大数据的训练才成为可能 。
深度学习已经成为计算机视觉系统的重要组成部分 , 但是传统的计算机视觉依然保持着强势劲头 。
所以 , 你要做得就是选择自己感兴趣的计算机视觉应用方向 , 在掌握一定基础的情况下 , 深入学习某个领域需要的知识即可 。
3 入门计算机视觉的秘籍目前计算机视觉领域来说有着两极分化——基础理论扎实 , 实践能力强的人 , 是真的非常好找工作 。相反 , 只是学会基础 , 运行一下网上公开模型 , 这种人想找份好工作可能就无望了 。
对于初学者来说 , 要想扎实的学习计算机视觉技术 , 就要先掌握计算机视觉的开发工具——OpenCV , 并在实践中学习 。
推荐阅读
- kb是什么意思啊?
- 计算机端口详解
- ?k8s极简史,一文看懂k8s如何力战群雄,坐上容器编排老大
- MySQL进阶之MySQL中的锁
- 计算机辅助设计的英文缩写是什么?
- 一文知晓HTTP的长连接和短连接
- 带你读懂信息安全中的恶意代码、病毒、木马、蠕虫......
- 一文搞懂 Spring JPA
- 一文理清,竞价推广的核心操作和优化思路
- 一分钟读懂web开发