通过单相机的三维重建来获得高质量的三维场景模型的方法详解
[摘要]

近年来,随着计算机硬件的不断快速更新,计算机的处理能力也不断变强。同时场景三维模型的获取技术越来越成熟,我们获得场景的三维模型数据的方式更多也更加方便了。而目前在基于单目和双目的三维重建技术中,单目技术较双目操作简单、而且取材方面更有利于推向市场。本文主要讲述基于单相机的三维重建,然后通过基于累积图的快速NCC匹配的种子扩张算法来进行高精度的三维场景重建。本章对经典的NCC相似度量函数进行优化,以此减少计算时间。而种子像素扩张算法即先选择初始的种子像素,利用视差图进行窗口比较从而获得高置信度的种子像素,因此大大降低了视差图的误匹配点。试验表明,该方法能够得到高质量的三维场景模型。

 

近几年来,随着计算机领域的各个方面的快速发展,人类的生产生活中处处可见计算机的影子,尤其是3D 打印技术的发展促使三维重建技术快速发展,这使得三维重建技术逐渐成为计算机领域的一个研究热点。不同领域的研究人员都致力于研究解决如何快速且便捷地获取三维信息。三维信息也被广泛应用于不同的领域,比如,机器人领域的自动导航以及计算机视觉中的自动识别物体,这两者都需要获取目标物体的精准的三维数据;建筑学中需要通过高精度的三维重建来实现预知建成效果;考古学中需要通过三维重建来实现对文物的保护以及维修工作。来自多个领域的大量需求要求三维重建需要有较高的精度。

 

依据使用的传感器的不同可以将三维重建的方法进行分类。第一类利用主动距离传感器,比如激光扫描仪,激光扫描仪通过激光扫描目标物体能够获得精准的三维信息从而构建出高精度的三维模型,但是该设备比较笨重而且价格昂贵,因而主要应用于科研领域。结构光法也能够构建高精度三维模型,但是需要借助投影仪的帮忙,而且在室外高亮度环境下难以工作,从而使得其只能局限于室内环境的应用。另一类方法用到被动距离传感器——摄像机。近年来,立体视觉被广泛地运用。不过该类方法一般需要固定相对位置且拍摄同步的两台摄像机来构成整个系统,同样使用较为复杂且价格不菲。相比之下研究仅利用一台手持式数码摄像机实现基于立体视觉技术的三维重建的方法,具有设备简易、使用方便以及成本低廉等长处,并且非常容易在其他领域得到推广应用。

 

自多视觉几何被提出以来,基于视觉的三维重建发展快速。Pollefeys 等人的三维重建系统使用自带的单目摄像机绕着目标拍摄一系列的连续图像,通过处理这些图像来重建出三维模型,获取的图片越多重建出效果就越真实。但是该算法比较复杂,耗时较长。Snavely 等人提出了一种基于无序互联网图像序列的视觉重建方法,但是其并不能获得一个致密的三维重建结果。A Geiger 等人发明了一种基于双目立体视觉的实时三维重建方法,从而获得致密的三维重建结果,但是立体视觉系统结构比较复杂。中国科学院自动化研究所机器视觉课题组致力于视觉重建的发展和研究,他们利用多视角的高分辨率的建筑物图像就可以自动获取建筑物三维模型,并将该技术应用在建筑保护方面。微软研究院(MicrosoftResearch)在2013 年推出了Kinect Fusion 项目,Kinect Fusion 利用Kinect 传感器(深度相机)可以直接得到目标场景的深度图像数据,将传感器绕着目标物体或场景移动就可以获得不同角度下的多组深度图像数据并实时地构建场景三维模型。但是一开始传感器获取的数据会有很大的误差从而导致开头的重建模型很不精确。

 

本章针对现有三维重建算法的运算时间和精度两大研究热点提出了基于累积图和种子像素提取算法的高精度的三维重建系统。通过基于累积图快速NCC 匹配算法来降低图像匹配的算法复杂度,从而大大降低了运算时间。利用种子像素提取算法获得的高置信度的种子像素,有效地减少了误配点,使得重建结果更加精准和真实。

资源类型:pdf
资源大小:2.07MB
所属分类:
上传时间:2019/01/07