金融界2025年3月29日消息,国家知识产权局信息显示,中电信无人科技(江苏)有限公司申请一项名为“基于视觉大模型的全场景地物分割的处理方法及系统”的专利,公开号CN119693823A,申请日期为2024年11月。
专利摘要显示,本发明公开了基于视觉大模型的全场景地物分割的处理方法及系统,属于计算机视觉技术领域。包括以下步骤:获取无人机拍摄的视频数据,对视频中图像数据进行预处理;通过预设信息,使用GroundingDINO检测图像数据中的类别,使用SAM分割模型获取检测到的框的实例分段掩码;使用CLIPSeg获取类别的一次分割掩码;在一次割掩码中确定采样点,并将采样点输入至SAM分割模型以获得类别的二次分割掩码;将一次分割掩码与二次分割掩码结合,得到全景分割结果。相较于现有技术,本发明的有益之处在于,解决了传统SAM分割模型不具备物体之间文本识别和语义分析能力,实现了根据提示词进行无人机视角图片的全场景分割。
天眼查资料显示,中电信无人科技(江苏)有限公司,成立于2024年,位于南京市,是一家以从事电信、广播电视和卫星传输服务为主的企业。企业注册资本5000万人民币。通过天眼查大数据分析,中电信无人科技(江苏)有限公司共对外投资了1家企业,参与招投标项目12次,专利信息25条,此外企业还拥有行政许可1个。
本文源自:金融界