速度更快、成本更低的3D机器视觉只使用单个像素

知新了了 2024-06-25 16:28:56

自动驾驶汽车依赖于由大量计算能力支持的复杂传感器。由中国清华大学领导的一项研究工作,通过一种只需要一个像素就能完成工作的跟踪系统,减少了对计算的需求。

当人们第一次想到自动驾驶汽车和智能安全系统时,支持它们所需的计算机视觉系统似乎很简单。把摄像头和处理器连在一起,再加上一些算法,就万事大吉了。毕竟,人类只需要一个生物相机和一些湿软件就可以毫不费力地处理图像。能有多难呢?

事实证明,这非常困难。人类的眼睛可能在光学上更简单(虽然不是那么简单),但其背后的处理过程却令人难以置信地复杂。再加上人类如何使用这些信息,并通过纯粹的反射对其做出反应,模仿这种能力几乎是不可能完成的任务。

清华大学团队的进步包括开发一种3D方法,以前所未有的速度跟踪快速移动的物体,同时还降低了计算要求。聪明之处在于,不是用完整的图像,而是依靠单个像素。

“我们的方法不需要重建物体的图像来计算它的位置,这大大减少了数据存储和计算成本,”研究小组负责人耿子涵说。“具体来说,获取3D坐标只需要6字节的存储空间和2.4微秒的计算时间。通过降低计算成本和提高效率,它可以降低高速跟踪所需设备的成本,使该技术更容易获得,并实现新的应用。”

根据该团队的说法,他们的技术可以用一个探测器跟踪一个物体,比传统的基于视频的方法快200倍,没有任何先验信息,计算能力也很低。它通过在物体上投射几何光模式并测量单个像素的强度来做到这一点。通过一些极其复杂的数学运算,可以计算出物体的位置和轨迹。

最初,该团队依靠模拟,但很快就开始使用激光和数字微镜设备(DMD)照射沿着弯曲螺旋线向下移动的金属球体。一个像素中的信息使系统能够进行必要的计算。

到目前为止,这项技术被用于跟踪单个对象,下一步将转向多个对象。

研究人员说:“这项技术可以增强自动驾驶汽车等技术的感知能力,改善安全监控系统,为工业检查提供更有效的监控和质量控制。此外,这种高速定位技术可用于科学研究,例如昆虫飞行轨迹研究。”

这项研究发表在《光学快报》上。

如果朋友们喜欢,敬请关注“知新了了”!

0 阅读:20

知新了了

简介:专注于新知、科普及趣闻的传播,日耕不辍,天天新鲜。