金融界2024年12月25日消息,国家知识产权局信息显示,广州视源电子科技股份有限公司申请一项名为“空间三维结构信息恢复方法、模型训练方法以及装置”的专利,公开号CN119169178A,申请日期为2023年6月。
专利摘要显示,本申请涉及计算机视觉技术领域,提供一种空间三维结构信息恢复方法、模型训练方法以及装置,空间三维结构恢复模型包括编码器、解码器以及反投影层,模型训练方法包括:通过编码器对彩色相机拍摄得到的待训练目标场景图像进行特征提取;通过解码器从提取的所述特征中估计得到由有尺度深度图以及实例分割图关联得到的关联图,通过反投影层将关联图反投影到点云空间得到预测的空间三维结构信息;获取作为监督信号的空间三维结构信息;基于预测的空间三维结构信息和作为监督信号的空间三维结构信息确定空间三维结构恢复模型的损失函数的值并以此更新模型参数。本申请实现了输入一张彩色图像到模型便能恢复其三维空间结构信息,成本低。
本文源自:金融界