智慧农业中机器视觉技术

秦柳钱 2025-03-01 22:46:37

智慧农业中机器视觉技术

“在工业化、城镇化深入发展中同步推进农业现代化”是国家“十二五”规划的重点之一,随着规划的实施,农业自动化技术的研究和应用得到了广泛关注和高度重视。机器视觉技术是促进农业生产周期管理自动化、智能化水平提高的一种高效手段,该技术在国内外农业领域的种子品质检测、田间杂草识别、植物生长信息监测、病虫害监测等环节取得了较大的突破。我国是农业大国,现代化建设是进一步优化我国经济发展的重要环节,农业生产效率和农业自动化生产水平是农业现代化的决定性指标,而机器视觉技术能够在农业成本控制、降低人力配比率、带动产业升级、实现农业智能化等方面产生巨大的推动作用。

当然,相对于机器视觉技术在工业自动化中的应用环境,农业生产中复杂多变的室外环境显然更为恶劣。这就要求农业机器视觉技术的软硬件设备能够拥有更强的适应能力,同时相关的视觉传感器系统也需要进行针对性的设计,以便收集最有价值的信息。在未来农业的智能化发展中,机器视觉技术将扮演非常重要的辅助角色,也将面临很多技术上的挑战。

1 机器视觉发展现状

①.机器视觉发展简介

机器视觉是建立在计算机视觉理论工程化基础上的一门学科,涉及光学成像、视觉信息处理、人工智能以及机电一体化等相关技术,经历了从二维到三维的演化过程。机器视觉发展于20世纪50年代对二维图像识别与理解的研究,包括字符识别、工件表面缺陷检测、航空图像解译等。

20世纪60年代,美国麻省理工学院Roberts提出了利用物体的二维图像来恢复出诸如立方体等物体的三维模型(如弹簧模型与广义圆柱体模型等),并且建立空间关系描述,开辟了面向三维场景理解的立体视觉研究。

20世纪70年代,美国麻省理工学院Marr等学者创立系统化的视觉信息处理理论,指出人类视觉从三维场景中提取对观测者有用信息的过程需要经过多层次的处理,并且这种处理过程可以用计算的方式重现,奠定了计算机视觉理论化和模式化的基础。

此后,计算机视觉技术在20世纪80年代进入了最蓬勃发展的时期,主动视觉等新的概念、方法与理论不断涌现。与此同时,随着CCD图像传感器、CPU与DSP等硬件与图像处理技术的飞速发展,计算机视觉逐步从实验室理论研究转向工业领域的相关技术应用,从而产生了机器视觉。由于具有实时性好、定位精度与智能化程度高等特点,机器视觉已经在智能汽车、电子、医药、食品、农业等领域得到了广泛的应用,如占机器视觉市场需求40%~50%的半导体制造行业,从上游的晶圆加工切割到高精度PCB定位,从SMT元件放置到表面缺陷检测等都依赖高精度的机器视觉引导与定位。

②.国外机器视觉发展

机器视觉早期发展于欧美国家和日本,并诞生了许多著名的机器视觉产业公司,包括光源供应商日本茉丽特(Moritex),镜头厂家美国Navitar、德国施耐德(Schneider)、德国蔡斯(Zeiss)、日本Computar等,工业相机厂家德国AVT、美国DALSA、日本JAI、德国Basler、瑞士AOS、德国Optronis,视觉分析软件厂家德国MVTec、美国康耐视(Cognex)、加拿大Adept等,以及传感器厂家日本松下(Panasonic)与基恩士(Keyence)、德国西门子(Siemens)、欧姆龙(Omron)、迈思肯(Microscan)等。

尽管近十年来全球产业向中国转移,但欧美等发达国家在机器视觉相关技术上仍处于统治地位,其中美国康耐视与日本基恩士几乎垄断了全球50%以上的市场份额,全球机器视觉行业呈现两强对峙状态。在诸如德国工业4.0战略、美国再工业化和工业互联网战略、日本机器人新战略、欧盟“火花”计划等战略与计划以及相关政策的支持下,发达国家与地区的机器视觉技术创新势头高昂,进一步扩大了国际机器视觉市场的规模。

如图1所示,至2018年,机器视觉系统的全球市场规模接近80亿美元,年均增长率超过15.0%。世界最大的机器视觉市场——德国市场,其规模为27.1亿美元,占比超过全球总量的1/3。

图1 2008-2018年全球机器视觉行业规模情况(来源于前瞻产业研究院)

③.国内机器视觉发展

相比于发达国家,我国直到90年代初才有少数的视觉技术公司成立相关视觉产品主要包括多媒体处理、表面缺陷检测以及车牌识别等,但市场需求量不大,同时,产品本身存在软硬件功能单一、可靠性较差等问题。直到1998年,我国机器视觉才逐步发展起来。国内机器视觉发展经历了启蒙、发展初期、发展中期和高速发展等阶段。

(1)机器视觉启蒙阶段。自1998年起,大量电子企业投资建厂,迫切需要得到大量机器视觉相关技术的支持。一些自动化公司开始依托国外视觉软硬件产品搭建简单专用的视觉应用系统,并不断地引导和加强中国客户对机器视觉技术和产品的理解和认知,让更多相关产业人员了解视觉技术带给自动化产业的独特价值和广泛应用前景,从而逐步带动机器视觉在电子、特种印刷等行业的应用。

(2)机器视觉发展初期阶段。从2002年到2007年,越来越多的企业开始针对各自的需求寻找基于机器视觉的解决方案,以及探索与研发具有自主知识产权的机器视觉软硬件设备,在USB2.0接口的相机和采集卡等器件方面,逐渐占据了入门级市场,同时,在诸如检测与定位、计数、表面缺陷检测等应用与系统集成方面取得了关键性突破。随着国外生产线向国内转移以及人民日益增长的产品品质需求,国内很多传统产业,如棉纺、农作物分级、焊接等行业,开始尝试用视觉技术取代人工来提升产品质量和工作效率。

(3)机器视觉发展中期阶段。从2008年到2012年,出现了许多从事工业相机、镜头、光源、图像处理软件等核心产品研发的厂商,大量中国创造的产品进入市场。相关企业的机器视觉产品设计、开发与应用能力,在不断实践中得到了提升。同时,机器视觉在农业、制药、烟草等多行业得到深度应用,培养了大批系统级技术人员。

(4)机器视觉高速发展阶段。近年来,我国先后出台了促进智能制造、备能机器人视觉系统以及智能检测发展的政策文件:《中国制造2025》提出实施制造强国,推动中国到2025年基本实现工业化,迈入制造强国行列:《高端智能再制造行动计划(2018-2020年)》提出中国智能检测技术在2020年要达到国际先进水平。得益于相关政策的扶持和引导,我国机器视觉行业的投入与产出显著增长,市场规模快速扩大。据高工机器人产业研究所统计,2018年中国机器视觉市场规模达到120亿元,同比增速超过84%,高于其他细分领域增速,如图2所示。我国已有机器视觉正逐渐向多领域、多行业、多层次应用延伸。目前,我国已有机器视觉企业100余家,如凌华科技、大恒图像、商汤、旷视科技、云从科技等,机器视觉相关产品代理商200余家,如广州嘉铭工业、微视图像等,系统集成商50余家,如大恒图像、凌云光子等。产品涵盖从成像到视觉处理与控制整个产业链,总体上视觉应用呈现百花齐放的状态。

图2 2008-2018年中国机器视觉行业规模情况

尽管目前我国机器视觉产业已取得飞速发展,但总体来说,大型跨国公司仍占据行业价值链的顶端,拥有较为稳定的市场份额和利润水平。我国机器视觉公司规模较小,与机器视觉大企业相比,许多基础技术和器件,如图像传感器芯片、高端镜头等,仍依赖进口。国内企业主要以产品代理、系统集成、设备制造,以及上层二次应用开发为主,底层开发商较少,产品创新性不强,处于中低端市场,相对来说企业利润水平偏低。

2 机器视觉组成与关键技术

一般来说,机器视觉包括照明系统、成像系统、视觉信息处理系统等关键组成部分。下面对机器视觉系统主要组成部分相关技术进行分析与总结。

①.机器视觉照明系统

照明系统的作用主要是将外部光以合适的方式照射到被测目标物体以突出图像的特定特征,并抑制外部干扰等,从而实现图像中目标与背景的最佳分离,提高系统检测精度与运行效率,影响照明系统的因素复杂多变,目前没有普适的机器视觉照明方案,往往需要针对具体的应用环境,并考虑待检测目标与背景的光反射与传输特性区别、距离等因素,选择合适的光源类型、照射方式及光源颜色来设计具体的照明方案,以达到目标与背景的最佳分割效果。

按光源类型划分,机器视觉光源主要包括卤素灯、荧光灯、氯灯、LED、激光、红外、X射线等。

其中,卤素灯和氯灯具有宽的频谱范围和高能量,但属于热辐射光源,发热多,功耗相对较高;荧光灯属于气体放电光源,发热相对较少,调色范围较宽:红外光源与X射线光源应用领域较为单一:LED发光是半导体内部的电子迁移产生的光,属于固态电光源,发光过程不产生热,具有功耗低、寿命长、发热少、易做成不同外形等优点。现如今,LED光源已成为机器视觉的首选光源。各种光源性能对比如表1所示。

表1 几种常用光源性能对比表

按光源形状划分,照明光源可分为条形、弯形、环形、同轴以及定制等光源。

按光源照射方式划分,照明系统可分为明场照明、暗场照明、前向照明侧向照明、背向照明、结构光照明、多角度照射与频闪照明等,明场照明光源位置较高,大部分光线反射后进入相机;暗场照明采用低角度照射方式,光线反射后不能进入相机,可提高对表面凹凸的表现能力,暗场照明常用于光滑面板,如手机壳、玻璃基片等表面划痕检查;背向照明是被测物置于光源和相机之间以获取较高对比度的图像,常用于分析物体的轮廓或透明物体内的异物:多角度照射则采用不同角度光照方式,以提取三维信息,如电路板焊接缺陷检测往往采用多角度照射的AOI光源来提高成像质量:结构光照明是将激光或投影仪产生的光栅投射到被测物表面,然后根据投影图案产生的畸变程度来重建物体的三维信息。

此外,光源颜色会对图像对比度产生显著影响,一般来说,波长越短,穿透性就越强,反之则扩散性越好,因此,光源选择需要考虑光源波长特性。

②.机器视觉成像系统

红色光源多用于半透明等物体检测,可提供不获取被观测目标的高质量图像,并传送到专用图像处理系统进行处理。

镜头相当于人眼睛的晶状体,其作用是将来自目标的光辐射聚焦在相机芯片的光敏面阵上。镜头按照等效焦距可分为广角镜头、中焦距镜头、长焦距镜头;按功能可分为变焦距镜头、定焦距镜头、定光圈镜头等。镜头的质量直接影响所获取图像的清晰度、畸变程度等,若成像系统获取的图像信息存在严重损失,则往往在后面的环节中难以恢复,因此,合理选择镜头是机器视觉中成像光路设计的重要环节。

同时,光源旋转需要考虑光源与物体的色相性,通过选择互补色环图(图3)上相对应的互补颜色来提高目标与背景间的颜色对比度。因此,在实际应用中,需考虑光源与物体颜色的相关性,选择合适的光源来过滤掉干扰,如对于某特定颜色的背景,常采用与背景颜色相近的光源来提高背景的亮度,以改善图像对比度。

图3 互补色环图

成像系统是机器人视觉感知系统中的“视”部分,采用镜头,工业相机与图像采集卡等相关设备。其中,放大倍数=传感器尺寸/视场大小,受镜头表面镀膜的干涉与吸收特性影响,选择镜头时需要考虑镜头最高分辨率的光线应与光源波长、相机光敏面阵接受波长相匹配,以保证光学镜头对光线具有较高的透过率。

工业相机是将光辐射转变成模拟/数字信号的设备,通常包括光电转换、外围电路、图像输出接口等部件。按数据传送的方式不同,相机可以分为CCD相机与CMOS相机两类,其中,CCD成像质量好,但制造工艺相对复杂,成本较高,而CMOS电源消耗量低,数据读取快。按照传感器的结构特性不同,工业相机可分为面阵式工业相机与线阵式工业相机两大类。面阵式相机可以一次获得整幅图像,测量图像直观,其应用面较广,但由于生产技术的制约,单个面阵相机很难满足工业连续成像的要求。线阵式相机每次成像只能获得一行图像信息,因此需要保证被拍摄物体相对相机直线移动,逐次扫描获得完整的图像。线阵式相机具有分辨率高等特点,常用于条状、简状,如布匹、钢板、纸张等的检测。由于逐次扫描需要进行相对直线移动,因此,成像系统复杂性和成本有所增加。

相机选择需要考虑光电转换器件模式、响应速度、视野范围、系统精度等因素。此外,由于工业设计的需求,当使用工业模拟相机时必须采用图像采集卡将采集的信号转换为数字图像进行传输存储。因此,图像采集卡需要与相机协调工作来实时完成图像数据的高速采集与读取等任务。针对不同类型的相机,有USB、PCI、PC164、ISA等不同总线形式的图像采集卡。

③.机器视觉信息处理系统

视觉信息处理充当了机器视觉的“大脑”部分,对相机采集的图像进行处理分析实现对特定目标的检测、分析与识别,并作出相应决策,是机器视觉系统的“觉”部分。视觉信息处理一般包括图像预处理、图像定位与分割、图像特征提取、模式分类和图像语义理解等层次。

(1)图像预处理。

图像预处理主要借助相机标定、去噪、增强、配准与拼接、融合等操作来提高图像质量、降低后续处理难度。相机标定旨在求解相机的内参(焦距,畸变系数)和外参(旋转矩阵和平移向量),以提供物体表面某点的三维几何位置与其在图像中对应点之间的精确坐标关系,标定精度的高低直接影响机器视觉定位的精度。常用标定方法有张正友标定法、自标定法等。同时,受各种电磁等干扰,获取的图像常含有椒盐、高斯等多种噪声,对比度低,并存在运动模糊等现象,因此需要对图像去噪或结构增强以提高图像质量。其中,去噪方法一般可分为空间域去噪与变换域去噪两大类,而主流的图像增强方法包含直方图均衡化、图像锐化、视觉模型增强、运动模糊去除等方法。同时,由于视野范围限制、成像模式不同,需要对生产线上不同位置获取的多模或同模态图像进行配准,再实现多幅图像拼接或融合处理。

图像配准一般分为基于图像灰度的配准方法与基于图像特征的配准方法。基于图像灰度的配准方法直接采用归一化的互相关、互信息等相似性度量函数来计算图像灰度值之间的相似性,并确定图像间的配准参数。此类方法简单、配准精度高,但对图像灰度变化、旋转、变形以及遮挡比较敏感,计算复杂度高,往往需要采用各种优化策略。基于特征的配准方法首先从图像提取各种点、线、区域等特征,然后进行空间约束或不变特征匹配得到特征间的匹配关系,进而估计出图像之间的变换关系。此类方法计算速度快,但依赖特征的提取。由于在配准过程中需要搜索多维空间,机器视觉系统常采用金字塔、小波方法以及各种优化策略来减小配准计算量。在图像配准的基础上,有些工业生产线需对多源图像进行融合,保证可以尽量提取有用信息,去除元余或干扰信息,在较少的计算代价下高效利用图像资源,并改善计算机的解译精度和可靠性。根据图像表征层次的不同,图像融合可分为像素级融合、特征级融合和决策级融合三个层次的融合。通过融合技术可以提高视觉目标检测的识别与抗干扰能力。

(2)图像定位与分割。

图像定位与分割主要利用目标边界、几何形状等先验特征或知识确定待检测目标的位置或从图像中分割出目标,是确定目标位置、大小、方向等信息的重要手段图像定位利用图像灰度或特征信息来确定图像中被检测物体的位置、大小及旋转角度等,主要采用模板匹配方法实现,即通过计算模板图像(通常是被检测物体图像)和待搜索图像的相似性度量,寻找相似性度量值最大或最小对应的匹配位置,即目标位置,模板匹配具有速度快、定位精度高、简单等优点,在视觉定位与引导中得到了广泛应用。由于需要给定待检测物体的图像,因此模板匹配定位方法只适用于背景简单、特征固定的物体,难以用于不规则形状物体的定位图像分割是根据目标及背景特性将图像划分为多个具有独特属性的非重叠区域,进而确定目标位置、区域大小。图像分割一般有以下5种方法。

①阀值分割方法:首先对图像像素灰度分布特性进行分析,然后采用先验知识或Otsu等方法确定最优灰度阔值将图像分割为两个或多个局部区域。该方法简单高效,适用于待检测目标与背景具有明显差异的情况。

②区域分割方法:利用区域内图像特征(如颜色、纹理等)具有均匀性或相似性将像素集合起来实现图像分割,包括区域生长、分裂合并、分水岭等算法。此类方法能够处理较为复杂的图像,但计算量大,而且种子点的选取与选代终止条件的设定容易影响分割结果,甚至可能会破坏区域边界。

③基于边缘的分割方法:该方法利用不同图像区域在边界处有明显灰度跳变或不连续性,找到目标区域的边缘来实现图像分割。由于不连续性常通过求导数来实现,因此该类方法适用于噪声比较小的图像,尤其是二阶微分算子对噪声十分敏感。

④基于图论的分割方法:借助于图论的思想,将待分割图像转换为带权无向图,其中,每一个像素即为图中的一个节点,将图像分割问题转化为图顶点的标注问题,再利用最小优化准则,如图割、随机游走等,实现图像的最佳分割。该方法可以较好地分割图像,但计算复杂度高。

⑤基于神经网络的语义分割方法:模拟人类感知过程,采用如脉冲精合神经网络等方法来处理复杂的非线性问题。近年来,人们在图像语义分割领域深入研究了深度学习技术,提出了FCN、DeepLab、MaskR-CNN、U-Net等分割算法,并将其应用在自动驾驶、影像诊断等领域。该类方法适应性较强,能够对被分割区域分配不同的标签,但存在学习过程复杂,计算量大等缺点。

(3)图像特征提取。

图像识别是先提取形状、面积、灰度、纹理等特征,然后借助于模式识别等方法如模式匹配、支持向量机、深度学习等来实现目标分类、缺陷检测等功能,满足工业机器视觉不同的应用需求。因此,图像特征提取在很大程度上影响图像识别结果。

图像特征提取可视为从图像中提取关键有用的低维特征信息的过程,使获取的低维特征向量能够有效地描述目标,并保证同类目标具有较小的类距,而不同类目标具有较大的类间距。高效的特征提取可提高后续目标识别的精度与鲁棒性,降低计算复杂度。常用的二维图像特征包括纹理特征、形状特征和颜色特征等。

①纹理特征:描述物体表面结构排列以及重复出现的局部模式,即物体表面的同质性,不依赖于颜色或亮度,具有局部性与全局性,对旋转与噪声不敏感。纹理特征提取方法包括统计法,如灰度共生矩阵、局部二值模式(localbinary patterns,LBP);基于变换的方法,如Gabor滤波器、小波变换等。

②形状特征:根据仅提取轮廓或整个形状区域的不同,形状特征可细分为轮廓形状特征与区域形状特征两类。

·轮廓形状特征对目标区域的包围边界进行描述,其描述方法包括有边界特征法、简单几何特征、基于变换域(如傅里叶描述子、小波描述子)、曲率尺度空间(curvature scale space,CSS)、霍夫变换等方法。轮廓特征描述量小,但包含信息较多,能有效地减少计算量;但轮廓特征对于噪声和形变敏感,常难以提取完整的轮廓信息。

·区域形状特征对目标轮廓所包围的区域中的所有像素灰度值或对应的梯度进行描述,主要有几何特征(如面积、质心、分散度等)、拓扑结构特征(如欧拉数)、矩特征(如Hu不变矩、Zernike矩)、梯度分布特征(如HOG、SIFT等)。

③颜色特征:用于描述图像所对应景物的外观属性,是人类感知和区分不同物体的基本视觉特征之一,其颜色对图像平移、旋转与尺度变化具有较强的鲁棒性。颜色空间模型主要有HSV、RGB、HSI、CHL、LAB、CMY等。常用的颜色特征的表征方法包括颜色直方图、颜色相关图、颜色矩、颜色聚合向量等。

(4)模式分类。

模式分类通过构造一个多分类器,将从数据集中提取的图像特征映射到某一个给定的类别中,从而实现目标分类与识别,分类器的构造性能直接景响其识别的整体效率,也是模式识别的研究核心。模式分类可分为统计模式识别、结构模式识别、神经网络和深度学习等主要方法。

①统计模式识别。统计模式识别结合了统计概率的员叶斯决策理论以对模式进行统计分类,其主要方法有贝叶斯、Fisher分类器、支持向量机、Boosting等。统计模式识别理论完善,并取得了不少应用成果,但很少利用模式本身的结构关系。

②结构模式识别。结构模式识别(又称句法模式识别)首先将一个模式分解为多个较简单的子模式,分别识别子模式,最终利用模式与子模式分层结构的树状信息完成最终识别工作。结构模式识别理论最早用于汉字识别,能有效区分相似汉字,对字体变化的适应性强,但抗干扰能力差。因此,往往将其同时结合统计模式识别和句法模式识别来解决具体问题。

③神经网络。神经网络是一种模仿动物神经网络进行分布式并行信息处理机理的数学模型,它通过调整内部大量节点之间的相互连接关系来实现信息并行处理。目前神经网络又可进一步分为BP神经网络、Hopfield网络与ART网络等。神经网络具有很强的非自线性拟合、记忆以及自学习能力,学习规则简单,便于计算机实现,因此得到了广泛的应用。但神经网络具有学习速度慢、容易陷入局部极值以及求解时会遇到梯度消失或者梯度爆炸等缺点。

④深度学习。2006年,Hinton等人提出一种基于无监督的深度置信网络,解决了深度神经网络训练的难题,掀起了深度学习的浪潮,自此,先后涌现了包括稀疏自编码器、受限玻尔慈曼机、卷积神经网络、循环神经网络、深度生成式对抗网络等模型。与传统的机器学习相比,深度学习提倡采用端到端的方式来解决问题,即直接将图像特征提取与模式分类集合在一起,然后根据具体的模式分类目标损失函数(如交叉肩损失、Hinge损失函数等)从数据中自动地学习有效的特征并实现模式分类,学习能力强。因此深度学习在计算机视觉、语音识别、字符识别、交通、农业、表面缺陷检测等领域取得了巨大成功。深度学习存在缺少完善的理论支持、模型正确性验证复杂且麻烦、需要大量训练样本、计算量大等问题。但相信随着深度学习研究的不断深入.深度学习将为机器视觉带来更广阔的发展空间

(5)图像语义理解。

图像语义理解在图像感知(如前述的预处理、分割检测、分类识别)的基础上,从行为认知及语义等多个角度挖掘视觉数据内涵的特征与模式,并图像中目标或群体行为、目标关系等进行理解与表达。它是机器理解视觉世界的终极目标,涉及信号处理、计算机视觉、模式识别和认知科学等多个交叉学科,近年来已经成为计算机科学领域的研究热点。

图像语义理解一般可分为自底向上的数据驱动方法和自顶向下的知识驱动方法。

①自底向上的数字驱动方法。自底向上的数据驱动方法首先对图像颜色、纹理、形状等特征进行分析,采用多层逐步提取有用的语义信息,最终实现更接近于人类的抽象思维的图像表示,并利用语义网、逻辑表达、数学形态学等知识表达工具引入知识信息,消除图像解释的模构性,实现图像语义理解。

②自顶向下的数字驱动方法。自顶向下的知识驱动方法通常建立抽象知识库的符号化和形式化表示,并构建基于先验知识的规则库,利用推理逻辑自动地对图像进行分类,这类方法尝试模拟人类的逻辑推理能力,具有较高抽象水平,属于高级的认知过程。然而,由于图像语义理解依赖于对象的存在、属性及其与其他对象的关系,无论是低层特征的表征,还是上层的语义句法描述,都难以支撑跨越图像低层特征与高层场景语义之间的“语义鸿沟”,而图像场景语义理解必须解决低层视觉特征和高层场景语义之间的映射关系。

近几年来,随着深度学习的快速发展,图像语义理解问题也从传统经典算法过渡到基于深度神经网络训练的图像理解算法,希望通过深度学习将机器可以识别的图像低层特征与图像相匹配的文本、语音等语义数据进行联合训练,从而消除语义鸿沟,完成对图像高层语义的理解。目前语义理解研究工作主要集中在场景语义分割与分类、场景评注以及自然语言生成等方面。

尽管视觉处理算法研究取得了巨大的进步,但面对检测对象多样、几何结构精密复杂、高速运动状态以及复杂多变的应用环境,现有的视觉处理算法仍然面临极大的挑战。

总体而言,机器视觉技术综合了光学、机电一体化、图像处理、人工智能等方面的技术,其性能并不仅仅取决于某一个部件的性能,还需要综合考系统中各部件间的协同能力。因此,系统分析、设计以及集成与优化是机器视觉系统开发的难点和基础,也是国内厂商有待加强的部分。

3.机器视觉技术应用

正如在工业环境中一样,机器视觉在农业中最关键的好处之一是它能够自动完成耗时长、劳动密集型的任务,随着传感器系统和执行器的进一步完善,机器视觉系统将逐渐应用于水果采摘管理、作物的控制和收获,以及一系列其他任务。农业工作者的作用主要体现在监督能力上,以帮助进一步优化机器视觉系统。

①.种子和果实分级检测

农作物种子的质量是决定农作物最终产量的重要因素,因此,类型识别以及播种前的精选,对于提高农作物产量具有重要意义。传统的人工分选与检测耗时耗力、工作量大。20世纪70年代,国外研究者开始利用机器视觉技术对获取的种子图像进行基本的几何测量,获得形状、长宽比、面积等参数,进而区分种子的类别。

利用机器视觉技术进行种子质量检验的步骤一般包括:图像采集、特征提取和分类器设计,一些研究者在此基础上开发了机械分选装置,并且建立了种子在线检测系统,陈兵旗等设计了一种基于机器视觉的水稻种子精选装置。该装置主要包括传送带、光电触发图像采集系统和图像处理与分析系统,可以检测出几何参数不合格及霉变的种子。在种子精选过程中,以扫描线上的像素突变次数来判断种子是否破裂,利用不同的阀值提取稻种的面积差,判断稻种是否霉变或者破损。

机器视觉技术具有准确、客观、无损等优点,在农产品的品质检测和分级方面有很多研究和应用。通过提取农产品静态图像中的形态、颜色等基本特征信息,确定农产品的品质,最后依据分级标准进行分级操作。

对农作物种子的形态、色泽、纹理等性状进行特征信息的提取与分析,称为考种。由于考种工作量大且烦琐、主观性较强、测量效率低,因此一些研究者对不同种类的种子特性进行分析,开发了基于机器视觉技术的考种系统。

其中,玉米考种系统是目前工作中常用的仪器。它可以快速、准确地提取玉米种子外形轮廓,进而对果稳长度、稳行数、每行粒数、种穗饱满度等形态特征进行提取,中国也有很多果稳性状无损测量相关的研究,王侨等设计了一种玉米种德精选传输装置,可以实现玉米种稳性状动态测量。根据种德图像中种稳的外形特征、黄色籽粒区域与整个种德的面积比、端面矩形度等参数判断合格种德,可以提高大批量种糖分选的效率,刘长青等提出了一种基于机器视觉的玉米果穗参数图像测量方法,使用摄像头连续图像,经过图像处理,获得玉米果穗的糖长和穗宽、每一穗行的德粒数和德行宽度、穗行数。使用该方法的参数测量准确率较高、处理时间较短。该成果可应用于玉米千粒质量检测、产量预测育种和品质分析等场合,获得了发明专利授权。还有学者提出利用机器视觉获取玉米粒行数并统计籽粒数,该方法效率较高,并且成本低。

②.农作物信息采集与病害检测

农作物在生长过程中极易遵受病虫侵害,从而影响最终产量。传统的大面积施药不仅浪费资源,而且容易对环境造成污染和破坏。因此,对作物病虫害区域进行检测和识别,控制喷药机械精准喷洒,是当前机器视觉在农业应用领域的研究热点。陈兵旗等研究了小麦病害图像诊断算法,首先利用小波变换结合病害纹理特征分析进行病害部位的强调,然后通过模态法自动进行阀值分割,获得二值图像,并对其执行膨胀与腐蚀处理,获得病害部位较完整的修复图像,最后将修复图像病害部位的二值图像与原图像进行匹配,获得结果图像原图像及检测结果图像,获得检测图像之后,将病害部位特征数据与小麦病害种类数据库比对,进行病害类型的判断。韩瑞珍等设计了害虫远程自动识别系统,实现了大田害虫的快速实时识别。害虫图像经过分割后,寻找最大连通区域进行去噪处理得到最后的害虫图像,提取特征值并保存特征值矩阵,利用得到的特征值矩阵对支持向量机分类器进行训练,最后,利用分类器对害虫识别请求进行自动分类,该系统可以通过3G无线网络将害虫照片传输到主控平台实现远程自动识别作物外部生长信息包括植物的叶面积、株高、叶片颜色等,通过对作物生长信息的监测,可以及时调整作物培养方案,为作物提供适宜的生长环境,满足精细化农业生产管理的要求。机器视觉技术对作物的生长检测主要是采集作物二维图像或合成三维图像,进行定量分析,判断作物生长状况,果蔬的采摘工作耗时耗力且人工成本较高,由于机器视觉可以完成形状和颜色识别相关工作,因此,结合机器视觉的自动采摘设备具有很广阔的发展前景。自然环境下桃子果实的自动识别算法过程为:首先以色差R-G的平均值作为阀值提取桃子红色区域,然后进行匹配扩展以识别整个区域,通过轮廓上线的垂直平分线的交点,得到拟合圆的潜在中心点,最后,通过计算潜在中心点的统计参数,得到拟合圆的中心点和半径。该算法的环境适应性较高,可以识别单个果实、彼此接触的果实、被遮挡的果实,且识别准确率高。

③.重型农机设备自动化

机器视觉可以大大增强现有农业设备的工作效率,并可广泛应用于一些重型农用机械设备的自动化升级中,机器视觉技术的采用有助于创造新一代的农机设备,如在满芭生产前期,装备视觉系统的除草机能够区分健康的葛芦幼苗和入侵植物,并应用适当的化学或人工方法来提高幼苗的生存能力目前,我国茶叶采摘和用工的矛盾已经成为茶产业发展的瓶颈,加快发展茶叶采摘机械化势在必行,采用机械化作业替代人工,不仅可以降低成本,而且能够提高采茶质量和生产效率。机器视觉在茶陀识别与采茶机导航中的应用,给茶产业带来了新的春天。利用计算机视觉系统识别茶树嫩芽并实现定位采摘的方法,不仅可以保证叶片的完整性,还能使整个采摘过程完全自动化,节省了大量人力物力,当然,机器视觉的识别效率还有提升的空间。

农业车辆自动导航是农业智能化研究的热点,基于机器视觉的导航路线检测算法是自动导航系统的核心。首先,以图像中的颜色分布来判断稻谷之间的空间作为行进路线,然后通过对水平线轮廓线的分析,检测出其运动方向的候选点,最后,通过对已知的点进行Hough变换检测移动方向线。该算法检测速度快、适应性强,对于复杂水田也可以有效提取导航路线。

在农用车辆自动驾驶的研究中,农田障碍物的检测也是很重要的研究内容。机器视觉系统检测到障碍物后控制执行机构进行制动或者警告,对于实现无人驾驶或者车辆辅助驾驶都具有非常重要的意义。这些研究均具有一定的可行性,为实现农用车辆无人驾驶提供了参考依据。

④.植保无人机

由于现代视觉系统具有高度的精确性,目前的植保无人机已经可以用来监测宏观水平的农作物状况。这使专业人员有机会迅速采取行动,防止疾病、害虫或不利环境条件的意外爆发。例如,在棉花种植过程中,在脱叶期到来之前给它喷洒脱叶剂,就是影响最后收成的关键环节,脱叶剂喷酒得好,不仅可以促进棉花均匀成熟,还可以减少采摘的棉花上残留的叶渣等杂质,从而提高棉花的品质。传统手段通常通过把拖拉机开进棉花田里,通过车上连着的喷杆来进行撒药。但这种做法不仅会碳压破坏大片的棉花,增大无谓的损耗,而且棉花长势过高处车无法进入。此时,只能用人工进行喷药、浇水、防虫、顶芽摘尖、脱叶、采摘等工作。棉花生长过程中任何一个环节出现的意外如果没有被及时处理,造成的损失都几乎无法挽回,而装载机器视觉识别系统的植保无人机就能实现对棉花等农作物的高效低公害施药,空中施药不仅可以避免碳压破坏棉花,机器视觉系统还能识别不同田地的地形和农作物分布,自动设置最佳的喷水洒药用量和运作轨迹。原本每667m2需要30L的药水喷酒,现在每667m2只需要1L药水喷洒,一台植保无人机每小时可以完成2万~10万m2农田的作业,而一个工作人员能控制2~5台无人机。在大幅度节省人力和药水成本,提高效率的同时,效果甚至比费时耗力的人工和传统粗暴的机械作业要好上不少。

与公路导航相比,农田导航目标的识别更复杂,但是农田导航不需要特别关注周围环境,所以农用视觉导航系统更容易推广使用。国内外很多研究者都将视觉导航系统和控制系统、机械装置结合,设计了无人机系统。无人机进行农药的喷酒等大规模作业,可以大幅度提高工作质量,节约劳动力最受欢迎的精准农业应用之一就是使用无人机进行喷酒作业。喷洒在作物上的农业化学品旨在提高作物产量并减少可能的植物病虫害。然而,农业化学品的过度以及不平衡使用会对环境和人类健康产生负面影响,导致癌症和神经系统疾病。与快速且不平衡的喷雾器相比,无人机可以减少农药的使用,并最大限度地提高植物健康和产量。将化学农药喷洒在植物上,通常使用安装在无人机上的喷酒系统,通过图像处理和人工智能等技术,可以预测土壤或植物的状况,并相应地进行喷酒。

就用水量而言,敏感的灌溉应用系统是全世界关注的焦点。全世界消耗的水中有70%用于灌激作物,这一事实突出了精确灌激的重要性,配备光谱和热像仪的无人机可以识别缺水的区域,并智能地向这些地区输送水进行灌溉。具有不同成像技术的图像处理和人工智能算法可确保在所需位置有足够的使用水。无人机获得的土壤形态使这些应用成为可能,并防止了水的浪费。灌溉应用系统类似于喷洒应用系统,只是装载的是水而不是杀虫剂在未来的智能农业应用中,预计将实施与无人机、无人地面车辆(unmannedground vehicle,UGV)或畜群机器人的协作灌溉系统。

杂草检测也是精准农业的应用之一。田间的杂草会对主要作物的生长产生不利影响,并导致作物产量和生长的损失。为了防止这种情况发生,应检测杂草,并防止其生长。然而,由于杂草的分布不是规则的(异质的),因此需要精确地检测。在这种情况下,基于深度学习的方法得到了非常积极的成果,可成功检测,更好地帮助人类使用除草剂实现杂草控制。传统方法过度使用除草剂,导致作物产量下降,而在无人机检测到的杂草上喷洒足量的除草剂在成本、环境污染和产量方面更有利。为了精确喷洒除草剂,需要在无人机图像上标记杂草区域。

4 面临的挑战

尽管机器视觉取得了巨大的进展,并得到广泛的应用,但还有许多问题有待解决。

机器视觉技术对测量条件和环境要求较高,但是农业生产环境复杂,应用场合多变,针对不同的研究对象和生产环境需要开发不同的处理算法,使得机器视觉测量的环境适应性和可靠性较差。由于农作物具有多样性特征,机器视觉在农作物信息检测和特征提取方面还存在一些不足。对于一些颜色或形状特征不明显作物的检测还需要研究更高精度的检测算法。为此,需要研究与选择性能最优的图像特征来抑制噪声的干扰,增强图像处理算法的普适性,同时又不增加图像处理的难度。

图像和视频具有数据量庞大、冗余信息多等特点,图像处理速度是影响视觉系统应用的主要瓶颈之一。因此要求视觉处理算法必须具有较快的计算速度,否则长时间的图像处理会导致系统出现明显的时潜,难以提高工业生产效率。因此,期待高速的并行处理单元与图像处理算法的新突破来提高图像处理速度。

目前,包含未端执行机构的机器视觉系统还不成熟,未能进行大规模的农业生产应用。并且,由于机械控制系统存在局限性,机器视觉产品的通用性和智能性不够好,导致机器视觉在某些实时性要求较高的场合往往需要结合实际需求选择配套的专用硬件和软件,从而导致布局新的机器视觉系统开发成本过大、时间过长,这也为机器视觉技术在中小企业的应用带来一定的困难,因此加强设备的通用性至关重要。

由于受到使用视野范围与成像模式的限制,单一视觉传感器往往无法获取高效的图像数据。多传感器融合可以有效地解决这个问题,通过融合不同传感器采集到的信息可以消除单传感器数据不确定性的问题,获得更加可靠、准确的结果。但实际应用场景存在数据海量、元余信息多、特征空间维;高与问题对象复杂等问题,需要提高信息融合的速度,解决多传感器信息融合的问题。

当前,基于机器视觉的农业装备集成化和智能化程度不高,操作复杂。很多对于农业生产的机器视觉应用研究仍处于试验阶段,农业智能装备的大规模应用还需要克服很多实际问题。

5.发展态势

由于问题存在复杂性和长期性,因此机器视觉系统在农业领域的应用还要经历一段很长的发展阶段。随着机器人技术、计算机算力与图像处理等的不断发展,机器视觉将会在农业领域发挥日益重要的作用,与此同时,也将呈现出一些新的发展态势。

①3D工业视觉将成为发展趋势

二维机器视觉系统将客观存在的3D空间压缩至二维空间,其性能容易受到环境光、零件颜色等因素的干扰,其可靠性逐渐无法满足现代农业应用的需求。随着3D传感器技术的成熟,3D机器视觉已逐步成为制造行业的未来发展趋势之一。未来,机器人可以通过3D视觉系统从任意放置的物体堆中识别物体的位置、方向及场景深度等信息,并能自主地调整方向来拾取物体,以提高生产效率并减少此过程中的人机交互需求,使产品瑕疵检测及机器人视觉引导工作更加顺畅。

②.嵌入式片上视觉系统将成为主流形态

嵌入式视觉系统具有简便灵活、低成本、可靠、易于集成等特点,小型化、集成化产品将成为实现“芯片上视觉系统”的重要方向,机器视觉行业将充分利用更精致小巧的处理器,如DSP、FPGA等,来建立微型的视觉系统。小型化、集成化产品成为实现“芯片上视觉系统”的重要方向,这些系统几乎可以植入任何地方,不再限于生产车间内。随着嵌入式微处理器功能增强,存

储器集成度增加与成本降低,将由低端的应用覆盖到PC机架构应用领域,将有更多的嵌入式系统与机器视觉整合,嵌入式视觉系统前景广阔。

③.模块化、标准化将成为架构特征

机器视觉所集成的大量软硬件部件,是自动化生产过程的核心子系统。为降低开发周期与成本,要求机器视觉相关产品尽可能采用标准化或模块化技术,以便用户根据应用需求实现快速二次开发。但现有机器视觉系统大多是专业系统,教硬件标准化已经成为企业所追求的解决方案。视觉供应商应很快便能逐步提出模块化、标准化的系统集成方案。

④.人工智能深度应用将成为主流路径

视觉系统能产生海量的图像数据,随着深度学习、智能优化等相关人工智能(artificial intelligence,AI)技术的兴起,以及高性能图像处理芯片的出现,机器视觉融合AI成为未来的一大趋势,AI技术将使机器视觉具有超越现有解决方案的能力,可像人类一样自主感知环境与思考,从大量信息中找到关键特征,快速作出判断,如视觉引导机器人可根据环境自主决策运动路径、拾取姿态等以胜任更具有挑战性的应用。因此,人工智能的深度应用将成为主流路径。

6.总结

机器视觉系统较为复杂,涉及光学成像、图像处理、分析与识别、执行等多个组成部分,每个组成部分均有大量的方案与方法,它们各有其优缺点和适应范围。因此,如何选择合适的方案来保证系统在准确性、实时性和鲁棒性等方面性能最佳一直是研究者与应用企业努力与关注的方向。

除此之外,机器视觉技术在农业生产中的应用研究范围很广,涉及农业生产的各个环节。在农作物种子的精选和质量检验、作物病虫害的监视、植物生长信息的监测、果蔬的检测、水果分级、粮食的无损检测及农业机械化等方面都起着很重要的作用。机器视觉技术以其自有的优势,对实现农业的高度自动化和智能化有重要推动意义。目前,中国的机器视觉农机装备相比于国外仍有一些差距,精度及自动化水平较低,实际应用也存在可靠性问题,中国的农业智能化发展还有很长的一段路要走。

除此之外,机器视觉技术本身的局限性和农业应用的复杂性也限制了机器视觉装备的大规模推广和使用。随着人工智能技术的爆发与机器视觉的介入,自动化设备将朝着更智能、更快速的方向发展,现阶段的很多问题也会得到解决,同时机器视觉系统将更加可靠、高效地在各个领域中发挥作用。

0 阅读:0
秦柳钱

秦柳钱

感谢大家的关注