金融界2024年12月5日消息,国家知识产权局信息显示,中国长江三峡集团有限公司申请一项名为“施工场景对象识别方法、装置、设备和介质”的专利,公开号CN119068408A,申请日期为2024年7月。
专利摘要显示,本申请实施例提供了一种施工场景对象识别方法、装置、设备和介质,其中的方法具体包括:根据目标检测模型,对施工图像进行识别,得到识别结果;目标检测模型包括:依次连接的主干网络、颈部网络和检测网络;颈部网络包括:多级特征融合模块和多级注意力模块;主干网络确定施工图像对应的多种第一图像特征;颈部网络中的多级特征融合模块,根据多种第一图像特征,进行特征融合处理,以得到多种融合图像特征;颈部网络中的多级注意力模块分别对多种融合图像特征进行多头自注意力处理,以得到多种多头自注意力图像特征;检测网络根据多种多头自注意力图像特征,确定识别结果。本申请实施例能够提升施工场景对象的识别精度。
本文源自:金融界