加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_丽江站长网 (http://www.0888zz.com/)- 科技、建站、数据工具、云上网络、机器学习!
当前位置: 首页 > 综合聚焦 > 创业热点 > 点评 > 正文

产品讲技术 | 带你看懂什么是计算机视觉(一)

发布时间:2020-02-22 00:33:55 所属栏目:点评 来源:做站长
导读:副标题#e# 做为一名5岁的AI产品汪,刚好利用春节(疫情)假期在家整理了一些CV的文章,发现网上的资料质量参差不齐,内容缺斤少两,小白很难甄别/读懂,想对CV有一个系统的认识很难,就自己做了一个系统总结(小白可以当教材看)。 本人并非CV领域专业人士
副标题[/!--empirenews.page--]

做为一名5岁的AI产品汪,刚好利用春节(疫情)假期在家整理了一些CV的文章,发现网上的资料质量参差不齐,内容缺斤少两,小白很难甄别/读懂,想对CV有一个系统的认识很难,就自己做了一个系统总结(小白可以当教材看)。

本人并非CV领域专业人士(产品经理),但希望可以帮助小白对CV全流程和原理有一个系统的认识,也欢迎各位大牛帮忙纠正。

产品讲技术 | 带你看懂什么是计算机视觉(一)

适读人群:

  • 对AI感兴趣的同学
  • 对AI产品经理感兴趣的同学
  • 互联网产品经理想转AI产品经理的同学
  • 对CV或者图像处理有一定基础,想再系统复习的同学

读完收获:

  • 对CV全流程有一个了解,明白从一个图像识别需求到输出结果,CV都需要做些什么
  • AI产品经理需要掌握的CV常识和专业名词,终于知道算法工程师在说什么了
  • 熟悉CV的全流程,在数据收集、产品设计时就可以尽量规避问题,提高图像识别准确率
  • 收藏了本文章,可以经常拿出来复习,再方便不过啦

首先我把CV的处理流程分为4个阶段:1图像采集->2图像编码->3图像预处理->4特征工程

  1. 图像采集:是CV处理的数据输入来源,根据需要识别的业务需求,对图像的背景光线、噪音、距离、遮挡物等会有相关的要求。
  2. 图像编码:做为计算机视觉处理的前提,通过把图像的二进制数据进行交换,转换为OpenVC等算法模型可用的图片编码格式,常用的方法有模拟处理、脉冲调制、数字编码、预测码等方式。
  3. 图像预处理:是为特征工程扫除障碍和无效信息,提高图像识别准备率的核心主力了,因为在实际的业务场景中收集到的图像数据是非常复杂多样的,会有图像质量太差、大量无效数据、图像变形、失真等情况,而这种图像如果直接由特征工程去处理,输出的结果可想而知。
  4. 特征工程:就是大家常说的AI模型,但可能运用的不只一种模型,根据业务的需求选择对应的算法模型,提前针对需要的输出结果,进行特征提取、特征选择、PCA降维等工作,再用大量已标注好的高质量数据进行训练,输出可以满足此阶段业务识别需求的特征工程。

下图是我对CV处理流程的理解:

产品讲技术 | 带你看懂什么是计算机视觉(一)

接下来会对CV处理流程中图像预处理和特征工程部分进行重点介绍。

文章大纲:(粗体部分是本篇文章分享的内容)

一、什么是图像预处理?

1.1灰度化是什么?

1.1.彩色图像实现灰度化的常用方法

1.2什么是图像几何转换?

1.2.1图像的平移转换

1.2.2图像的镜面变换

1.2.3图像的转置变换

1.2.4图像的旋转

1.2.5图像的缩放

1.2.6什么是灰度插值算法?

1.3什么是图像增强?

1.3.1图像去噪

1.3.2锐化

1.3.3低照度增强

1.3.4去雾

1.3.5去运动模糊

1.3.6超分辨率重建

1.4什么是图像恢复?

1.4.1图像增强和图像恢复的区别

1.4.2图像恢复的处理流程

1.5什么是图像分割/边缘检测

二、什么是特征工程?

2.1算法和模型的区别

2.2特征使用方案

2.3特征获取方案

2.4特征处理

2.4.1特征清洗

2.4.2特征预处理

2.5特征监控

三、参考文献

一、图像预处理是什么?

图像预处理主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性、最大限度地简化数据,从而改进特征提取、图像分割、匹配和识别的可靠性。

一般的预处理流程为:1灰度化->2几何变换->3图像增强

1.1 灰度化是什么?

现在大部分的彩色图像都是采用 RGB颜色模式,在进行图像处理时,我们往往需要对RGB三个分量通道依次进行处理,花费时间和计算成本会相对较高。但实际上RGB并不能反映图像的形态特征,只是从光学的原理上进行颜色的调配。

所以我们经常要把彩色图像弄成8位的灰度值图像直接进行处理,可以通过直方图,灰度变化,还有正交变换之类的进行处理,减少所需处理的数据量,从而达到提高整个应用系统的处理速度的目的。

目的:为了减小图像原始数据量,提升计算效率,因为图像处理中不一定需要对彩色图像的RGB三个分量都进行处理。

科普环节,大牛请跳过:

R:Red 红色

G:Green 绿色

B:Blue 蓝色

RGB图像就是我日常见到的大多数彩色图像,它只使用R、G、B三种颜色,每种颜色有0~255范围内的强度值。如果按照不同的比例混合可以组合成约1677万种颜色,几乎包含了人类视力所能感知的所有颜色,而每幅彩色图像是由RGB三幅灰度图像组合而成。

二值图像(Binary Image):图像中每个像素的灰度值仅可取0或1,即不是取黑,就是取白,二值图像可理解为黑白图像

灰度图像(Gray Scale Image):图像中每个像素可以由0-255的灰度值表示,具体表现为从全黑到全白中间有255个介于中间的灰色值可以取

下面用一张图来感受一下灰度图与彩色图像之间的联系与差别

产品讲技术 | 带你看懂什么是计算机视觉(一)

1.1.1 彩色图像实现灰度化的常用方法

1)分量法:将彩色图像中的三分量RGB的亮度作为三个灰度图像的灰度值,可根据应用需要选取三种中的一种灰度图像。

产品讲技术 | 带你看懂什么是计算机视觉(一)

产品讲技术 | 带你看懂什么是计算机视觉(一)

2)最大值法:将彩色图像中的三分量亮度的最大值作为灰度图的灰度值。

3)平均值法:将彩色图像中的三分量亮度求平均得到一个灰度图。

(编辑:应用网_丽江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读