2.1 研究背景
随着全球导航卫星系统技术的成熟和发展,相关的GIS 和ITS 产业更是得到了前所未有的发展。中国的GIS 已经开始了某种程度的应用[18-31]。
近年来,我国在ITS 方面开展了大量的研究与应用工作,为我国ITS 的发展奠定了一定基础[32]。ITS 是一项系统工程,需要各有关政府部门、产业界及科研单位的协调行动和共同努力,为了更好地协调开展我国的ITS 规划和建设工作,2000 年科技部牵头会同国家计委、经贸委、公安部、铁道部、交通部等十多个相关部委联合成立了发展ITS 的政府协调领导机构--全国智能交通系统协调指导小组及办公室,共同推动中国交通系统的智能化发展[33]。国家智能交通系统工程技术研究中心(National Intelligent Transport Systems Center of Engineering and Technology-ITSC)是国家科学技术部1999 年11 月批准建立的,以国民经济、交通运输行业和市场的需求为导向,针对智能交通系统发展中存在的重大技术问题,对有市场价值的重要应用科技成果进行共性技术、关键技术的后继工程化、产业化以及系统集成的高新技术研发实体[34]。
交通是国民经济发展的两大支柱之一。交通问题具有明显的地域特征,是地理信息科学的一个主要研究发展。此外,交通技术的发展与电子技术、通讯技术、计算机技术等高新技术的发展息息相关,而这些高新技术同时也是实施“数字地球”战略必须着重发展的技术。可以毫不夸张的说,交通将是“数字地球”战略发展的最大受益者之一,同时也是实施“数字地球”战略的一个重要组成部分。
城市交通网络在城市发展中占有至关重要的地位。它不仅是城市的一个重要组成部分,同时也决定了城市中居民的生活方式。长期以来,交通问题已成为困扰城市发展的重要问题。世界各国都面临这日益严重的城市交通问题,如交通拥挤、车辆行驶缓慢、交通事故频繁及其由于交通堵塞造成的大量空气污染等问题。很多发达国家逐渐认识到,欲有效解决这些问题,仅仅依靠道路建设,扩大路网规模是远远不够的,交通问题的解决必须依赖现代信息技术与管理技术的有机结合。
2.2 研究意义
为了适应未来数字地理信息和智能交通发展的需要,对于地图的研究早已提上日程。通常我们所看到的地图是以纸张、布或其他可见真实大小的物体为载体的,地图内容是绘制或印制在这些载体上的,比如现在人们最常用的就是纸质交通地图。
电子地图是存储在计算机的硬盘、软盘、光盘或磁带等介质上的,地图内容是通过数字来表示的,需要通过专用的计算机软件对这些数字进行显示、读取、检索、分析。电子地图按其数据存储方式可分为矢量地图和栅格地图(又称点阵地图)两种。栅格地图采用基于栅格的数据结构,将地图离散化成一个象素阵列,其优点是结构简单,操作方便,缺点是精度低,数据存储量大,难以操作单个目标,叠加动态目标后,影响显示效果。矢量地图采用基于矢量的数据结构,用点、线、面来描述地图,记录存储的内容是所描述对象的关键点,同时带有关键点的属性描述,在显示时,用软件读取相应数据按一定规则变换后送显。矢量地图的优点是数据存储量小,图形精度高,易于操作变换,缺点是数据结构复杂,计算量大。
正是由于矢量地图较之于栅格地图有很多非常符合未来地理信息系统和智能交通系统的发展需要的优点,政府及民间组织对于矢量地图越来越重视。当前,对于矢量地图的研究非常的广泛,国家处于战略考虑正在加紧建设自己的矢量地图库,而很多公司出于商业利益考虑,也纷纷建设自己的矢量地图库。
目前,对于矢量地图的制作,大多是通过卫星图片或者是航拍的地图作为资源库来制作各个城市或重要地区的矢量地图的。众所周知,卫星图片或者是航拍的图片对于纯商业的公司来说是非常昂贵的,而且这些图片并不能很容易能买到的,特别是涉及到一些重要的敏感的区域或战略性的城市的时候。一方面,中小城市在建设“数字城市”的过程中没有财力为矢量地图的制作支付巨额款项,一些公司同样很少能够购买到卫星或者航拍的图片用于矢量地图的制作。
据说,上海市某国内著名的GIS 公司现在仍然用手工的方法制作矢量地图,这样既浪费人力、物力、财力,更重要的是浪费时间。当然,我们相信现在有很多公司有能力进行自动或半自动地提取地图中的道路信息,因为中国科学技术大学GPS 实验室经过对地图矢量化的长期研究,已经可以自动地提取栅格地图中的道路信息。只是这种自动地提取只是初步的,很多地方还需要加入人工的修正,才能够用于工程项目。
所以说,当前如何利用飞速发展的计算机技术,从一幅栅格城市交通地图中将各种有用信息准确完整地提取出来,将其转化为矢量地图,以及如何才能够实现完全自动化的(也就是我们实验室内部所谓的闭环反馈方法)提取,成为我们实验室研究的重点、焦点。
2.3 研究现状
2.3.1 国外研究现状
通过大量查阅外国相关文献,此处列举几种比较典型的方法,当然需要说明的由于外国地图上印的是外国的文字,中国的汉字与其有很大的区别,所以说有很多多外国地图很有效的方法,也许并不适用于中国的地图。
有的学者提出“边界跟踪算法”(parallel vector tracer, abbr. PVT)[35], 目的在于提取矢量地图, 但是只要原始地图中出现道路被文字或是路标等噪声个体切断,那么跟踪器会在割断处停下,上述算法就完全失效。
针对以上问题,有的学者做了详细研究并提出了解决的办法。文中选取的是二值图像,首先使用设定阈值T1 消除孤立的黑色像素连接区域,再消除字符,主要满足轮廓线长度在T2 和T3 之间、水平垂直方向的长度小于T4 并且转折点数大于T5,那么这个字符即被消除。对上面进行预处理过的图像进行特征点提取,处理交点处的向量,删除前面所选出的重复向量,判断交点处的向量如何连接,消除选出的噪声向量,最后连接与道路或是桥梁交叉向量。当然地图经过这样的处理后,依旧会产生错误,文中最后也做了后续处理,其一是校正交叉路口的扭曲形状,其二是对由字符割断的向量连接中有误判的情况进行纠正。行文中对N×N 的图像分别做水平方向和垂直方向的扫描线,设定规则函数来连接出现在扫描线上的相邻点,由此构成水平向量和垂直向量;再根据所设定的连接条件来合并细小向量,最后形成矢量地图[36]。
有的学者提出了一种从纸质地图中自动提取道路网络的方法,强调从地区纸质地图中提取拓扑道路网络。该文的理论依据是依靠提取和连接道路的中心线从而形成道路网络。在道路网络构建的过程中,重点是要解决合并和连接问题,因为地图中不可避免的出现粘连字符、分裂道路段等问题。主要方案是用扫描仪将纸质地图转换为灰度图像,经滤波去除噪声像素,然后二值化;再使用分离字符的方法解决中心线连接时会出现的字符割断中心线的问题;将这样处理过的图像转换成矢量图,利用感知器分类算法解决大量分裂道路段的问题;最后进行中心线提取,解决前面没有完全处理的粘连字符的难题。该文的实验结果良好并且给出修正过的示例,但是这篇文章的图源中所包含的字符为英文字符,字符均处在道路的内部,且道路线宽度一致,噪声量非常少,区域块形状明显,如图2-1 所示。该文使用CCA(Connected omponent analysis)算法[38]提取粘连字符,使每个粘连部分都被一个矩形包围;用尺寸过滤的方法,选出尺寸出现频率较高的矩形,并将这样的矩形框去除,也即去掉了大量的字符,因为在该图源中字符大小一致,所以字符大小的矩形出现频率最高。因而可以滤出大部分字符。此外它还避开了彩色地图的颜色问题,只是针对二值图像进行处理。

图2-1 二值化后的新加坡街道图
有的学者给出了一种从彩色地图中提取道路的方法,这是所查文献中为数不多的提及图源是彩色地图的提取算法。该方法使用了颜色分割,道路图像修复和提取骨架等处理。关键是提出了一个基于条件膨胀的道路恢复算法确保道路信息的精度,消除和减少了图像中的道路变形。它的图源是韩国某地区的地形图,如图2-2 所示。该文指出了人眼看来无变化的颜色块而实际上是多种颜色的混合体,从而对于图源中不同类点分别选取了它们的聚类中心点,计算同一类的像素点。将原图像分成多层,其中红色聚类的是图像上的道路层。如果仅仅是不断重复膨胀算法,那么整个图像中的道路将无限制的增长,故必须限制其不断增长的趋势。鉴于切断道路的都是黑色字符层,故将其设为约束性条件。上面我们已经得到分层的二值图像集,定义A={A0,A1,……An}, A0 为黑色字符层,其他A1,…,An 分别作为从原图中分离出来的区域。那么只要当A0 不为空集,那么就对Ai 进行膨胀运算,直至A0 被膨胀完毕。经过开运算消除轮廓线,用闭运算消除内部噪声,最后得到较好矢量化结果[39]。

图2-2 左为韩国某地区的地形图,右为左图的部分放大
以上是目前国外相关研究状况中比较有代表性的三类,当然还有一些其他的提取地图中道路网络的不同算法[40-43],此处不必赘述。
2.3.2 国内研究现状
栅格交通地图中道路识别一直都是地图模式识别的重点和难点。在国内,这方面的研究已经成为一个非常活跃的研究领域,目前为止已经提出了不少各式各样的方法。主要问题还是集中在有关中文字符噪声的处理上,这些处理方法可以归纳为两大类:(1)第一类方法[44-45]:根据文字要素在栅格地图上的孤立性、连通性及尺寸大小特征,采用8 邻域方法计算所有连通成分,求得每个连通成分的外接矩形框的大小,采用面积、宽高比和密度等数字特征进行滤波实现图文分离。但是由于栅格地图上线划要素的比例较大,线划要素本身多数都是连通的,因此这类方法计算量大、处理时间长、效率低;同时这类方法对文字的尺寸比较敏感,特别是多尺寸文字混排的情况;它识别英文的效果比较好,由于汉字的复杂性造成单个汉字并不一定连通,因此误判率较高。(2)第二类方法[46]:对于栅格地图,不管地图上的要素类别,都一起进行细化、跟踪矢量化处理,在矢量图形上依据线划的长短提取和分离文字要素。这种方法对细化和矢量化算法的要求很高,细化、矢量化过程中文字和线划会发生畸变,尤其是文字和线划要素本身模糊不清时,这种畸变更为严重,使得分离出来的文字和线划有变形,给下一步的识别和理解带来了困难。
中国科学技术大学GPS 实验室长期从事栅格交通地图矢量化研究,并且取得了可喜的成果,叶家鸣同学应用传统的数字图像处理的方法结合已有的地图道路提取方法第一个实现了地图中道路信息的自动识别[47-48];刘丽萍同学通过对前人成果的深入分析研究总结,提出了“基于标签分类的道路提取算法”[49]。
栅格交通地图的矢量化是如此的重要,关系到未来GIS 和ITS 的发展,以至于国家投入了大量的人力、物力、财力。“改进栅格交通地图道路识别过程的研究”就是国家自然基金资助项目,我们应该在大量参阅前人工作的基础上,深入研究,不断创新,寻找新的更可靠的方法。
2.4 城市交通地图特征分析
本文采用的图源是地质出版社地图编辑室所编制的中国公路交通图册[50]。
经过长期深入研究,发现这些栅格城市交通电子地图对于区域、道路及字符噪声分别有其不同的颜色特征:
区域包括:河流、湖泊、公园、绿地、商业区、住宅区及未开发区域等;河流和湖泊是用蓝色表示的,但是这些蓝色并不是相同的,从河流、湖泊的一边到另一边是渐变的;公园和绿化带是用绿色表示的;商业区和住宅区是用一种棕色表示的;未开发区域是用一种可以称之为绿灰色的颜色表示的。
道路包括:普通道路和特殊道路;普通道路是用白色表示的;特殊道路,如为了表示其为非机动车行驶道或步行街等,用其他如腊黄、水红、黄绿、浅绿等颜色表示。
噪声可以总称为字符噪声,包括标明道路名称的黑色文字噪声;标明区域名称的绿色文字噪声,这种绿色由于和表示公园、绿地的绿色相近,所以经常会发现地图上的用色错误,造成误识别;标明政府部门的红色文字及红色五角星符号;标明医院、交警队、电信局、铁路、城墙等特殊机构的彩色特殊符号。总之,噪声部分特别的复杂,是地图信息识别过程中的难点、重点。


