人类对外界的认知主要来源于五种感官,即视觉、听觉、嗅觉、味觉和触觉五感。因此,当前业界在赋予机器以类人的知觉时,也主要据此分成五个分支。无论是虚拟机器还是实体机器,只要是往类人的方向发展,则都绕不开对这五类感官的模仿。只不过根据定位与功能的不同,而在感官种类与感知程度上有所差异。
深度学习能力是反映机器智能化程度的重要标志,因而也是当前各大科技公司研发的重点。通过研究和模拟人类神经网络的结构及运转方式,并将科研成果逐步应用于设计实践,机器的深度学习能力不断增强,智力日益提高,“思维”变得越来越像人。不过,要让机器能真正像人一样思考,不仅需要为其配备类人的“大脑”,与人相近的认知外界的方式也是不可或缺的。
那么,什么是“与人相近的认知外界的方式”呢?机器视觉!
机器视觉是人工智能正在快速发展的一个分支。简单说来,机器视觉就是用机器代替人眼来做测量和判断。机器视觉基于仿生的角度发展而来,比如模拟眼睛是通过视觉传感器进行图像采集,并在获取之后由图像处理系统进行图像处理和识别。
从字面意思来理解, “视”是将外界信息通过成像来显示成数字信号反馈给计算机,需要依靠一整套的硬件解决方案,包括光源、相机、图像采集卡、视觉传感器等。“觉”则是计算机对数字信号进行处理和分析,主要是软件算法。
因此,机器视觉系统架构主要分为硬件设备和软件算法两部分,其中硬件设备主要包括光源系统、镜头、摄像机、图像采集卡和视觉处理器;软件包中核心算法主要包括传统的数字图像处理算法和基于深度学习的图像处理算法,例如“DLIA工业缺陷检测”就是一个基于深度学习的图像处理软件。
在某些特殊工业环境中,比如一些不适于人工作业的危险工作环境(如焊接、火药制造)人工视觉可能会对操作工的人身安全造成威胁,而机器视觉从某种程度上有效地规避了这些风险;或者人工视觉难以满足要求(机械缝隙零件检测)的场合,常用机器视觉来替代人工视觉。随着人工智能应用的爆发,作为代表技术之一的机器视觉,有望迎来更大发展,在智能工厂、无人商店、自动驾驶、机器人等领域掀起新的风暴!