基于图像处理的方法在地图噪声去除方面的研究工作已经很多,对栅格地图道路网络的自动识别[37]也取得了很大进展。不少专门用于栅格地图道路图层识别的方法[47, 96-97]已取得了很有效的结果,但是处理结果尚未令人十分满意,如有些情况下出现部分噪声不能完全去除或少数噪声被处理成区域等现象。通过分析字符等噪声点的某种外延特征,本文探索出一种新方法,该方法原理简单、实现方便,不仅可以完全去除地图中的噪声,而且可使区域和道路的识别效果更好。
本文算法主要是为了实现中国公路交通图册(光盘版)[50] (地质出版社地图编辑室所编制)中的城市栅格地图道路网络自动识别提取,并以其中的山东省青岛市区地图作为示范来说明噪声的特征和新方法的处理效果,使用的处理工具是MATLAB[85-90] 。
7.1 噪声特征分析
对于栅格地图的处理,以往总是按照不同的颜色对地图的像素进行分类,这样在一幅地图中就只包括3 种像素类:道路像素类R、区域像素类A、噪声像素类N。本文就是要通过某种方法将噪声像素进行聚类,使一部分并入道路像素类,一部分并入区域像素类。如何去探索一种方法能有效地对噪声像素进行聚类,首先就要研究噪声像素的存在形式和特征。
7.1.1 噪声的存在形式
一般交通地图中字符噪声以下面3 种形式存在:
⑴ 噪声块全部位于区域内,如图7-1(a)中的“动物园”,“中山公园”等,其特征就是噪声块被区域完全包围;
⑵ 噪声块全部位于道路内,这种情况是存在的,但是很少见,因为位于道路上的噪声块一般是文字噪声块,文字噪声块一般以第3 种形式存在;
⑶ 噪声块位于道路上,同时延伸到区域上,如图7-1(b)中的“福州北路”,这种情况比较复杂,是地图中噪声块最常见的存在形式。

图7-1 交通图上两种不同存在形式的文字噪声
7.1.2 噪声的外延特征
为了便于研究地图中噪声块的基本特征,此处选取城市地图中的一部分,若放大5 倍观察(如图7-2 所示),则可以清晰地看见每个像素点。

图7-2 放大5 倍的地图
地图上的道路看起来是弯曲的,但是单个噪声块所在的道路段的边缘线基本上是平行的(如图7-1(b)、图7-2 所示);同时,单个噪声块在道路上并没有把表示道路的像素完全覆盖,如图7-2中的“安”字,这是由以文字形式出现的噪声块的自身特征决定的。
在图7-2 中包括了噪声块的如下3 种不同的存在形式:箭头1 所指的像素块完全位于道路内;箭头2 所指的像素块完全位于区域内;图7-2 中的“安”字便是噪声像素块存在的第3 种形式。如图7-2 所示,选择3 个噪声像素块中的6 个像素点(分别用1,2,3,4,5,6 指示,而且 可以看到,此6 点周围分别有8 条射线射向8 个方向)来研究它们的外延特征。
首先,先人为地观察这6 个噪声像素,分析一下这些像素应该被聚类到道路像素类,还是聚类到区域像素类?显然,像素1 应该聚类到道路像素类;像素2 应该聚类到区域像素类;像素3 位于道路和区域的边界上,可以保持不变;像素4 应该聚类到道路像素类;像素5 应该聚类到区域像素类;像素6 位于道路和区域的边界上,可以保持不变。
然后,以所考察噪声像素为中心,建立一个极坐标,以便对0º、45º、90º、135º、180º、225º、270º、315º等8 个方向上的像素进行搜索,并穿过其他的噪声像素,直到发现区域像素、道路像素或边界为止。再统计8 个方向上最终所发现的道路像素、区域像素或边界像素的个数,并分别记为r、a 和e。本文将r、a 和e 称为噪声像素的外延特征参数;参数r 和a 的大小关系,称为噪声像素的外延特征。例如,考察图7-2 中噪声像素6 时,首先设定它的特征参数初始值均为0,那么在0º方向上首先发现了道路像素、在45º方向上也首先发现了道路像素、在90º方向上穿过3 个噪声像素之后首先发现了道路像素、在135º方向上穿过1 个噪声像素首先发现了区域像素、在180º方向上穿过3 个噪声像素首先发现了区域像素、在225º方向上首先发现区域像素、在270º方向上穿过1 个噪声像素到达边界、在315º方向上穿过1 个噪声像素到达边界。经统计,首先发现道路像素的方向有3 个、首先发现区域像素的方向有3 个、没有发现道路像素或区域像素就已经到达边界的方向有2 个。可见得到此噪声像素的外延特征参数为:r=3、a=3、e=2。
因为整幅地图的所有像素被分为道路像素类R、区域像素类A 和噪声像素类N 共3 类,所以任何一个噪声像素的外延特征参数都是固定的,统计结果只有一个。这样统计6 个像素的特征参数,就可得到各自的外延特征,并可与人为聚类结果相比较,如表1 所示:

表7-1 统计6 个像素的外延特征与人为聚类结果相比较
从表7-1 可以看出,人为聚类结果与噪声的外延特征具有以下对应关系:当噪声的外延特征为r>a 时,人为聚类结果是将噪声聚类到道路像素类R;当噪声的外延特征为r<a 时,人为聚类结果是将噪声聚类到区域像素类A;当噪声的外延特征为r=a 时,人为聚类结果是因噪声像素位于道路和区域的边界,暂不聚类。
所以,可以通过提取噪声像素的外延特征和设定某种或某几种判定准则来将地图中原有的噪声像素类聚类到区域像素类A 或道路像素类R。本文将这种通过提取噪声像素的外延特征,利用某种或某几种判定准则来对噪声像素进行聚类的方法称为去除噪声像素的外延特征法。
7.2 算法步骤
7.2.1 道路的一致化
道路的归一化就是指将所有代表道路的像素,均划归道路像素类R。
7.2.2 道路的初始聚类
设代表道路的颜色值为R,G,B,然后将地图中每个像素的颜色值r,g,b 均与道路颜色值R,G,B 进行比较,并计算此像素与道路像素之间的接近程度d,即
。 预先设置一个道路聚类阈值DRoad(比较小的正数),如果
,则将此像素聚类到道路像素类R。
7.2.3 区域的一致化
区域的归一化就是指将所有代表区域的像素,均划归区域像素类A。
7.2.4 区域的初始聚类
设代表区域的颜色值为R,G,B,然后将地图中每个像素的颜色值r,g,b 均与区域颜色值R,G,B 进行比较,并计算此像素与区域像素之间的接近程度d,即
。
预先设置一个区域聚类阈值DArea(比较小的正数),如果d <DArea,则将此像素聚类到区域像素类A。
7.2.5 噪声外延特征的提取

图7-3 提取噪声像素外延特征示意图
如图7-3 所示,中间N 表示程序正在提取其外延特征的噪声像素。特征提取时先以此噪声像素N 为坐标原点建立极坐标,并以形式i,j(i=1~8,j=1~K,K 由地图的大小决定)表示噪声N 的8方向上的像素的位置,这个极坐标与一般极坐标不同的是i 表示方向,j 表示半径;然后从像素N出发,分别向8 个方向进行不断的搜索,同时计算噪声像素的外延特征参数,并提取噪声的外延特征。
7.2.6 “无偏”聚类
7.2.6.1 “无偏”聚类准则
根据噪声外延特征对噪声像素进行聚类:
如果r>a,则将此噪声像素聚类到道路像素类R;
如果r<a,则将此噪声像素聚类到区域像素类A;
如果r=a,则此噪声像素仍属于噪声像素类N,暂不聚类。
本文将这种聚类准则,称为“无偏”聚类准则。
7.2.6.2 “无偏”聚类过程
“无偏”聚类时,首先,对整幅地图的每个噪声像素的外延特征参数进行提取;然后,利用“无偏”聚类准则对每个噪声像素进行聚类;再将聚类后的图与聚类前的图进行比较,如果发现聚类后的图与聚类前的图相同,则“无偏”聚类中止,如果不相同,则将聚类后的地图重新进行“无偏”聚类。
7.2.7 “有偏”聚类
7.2.7.1 “有偏”聚类准则
该准则是,首先设置一个比较参数p,再将其与噪声像素的外延特征参数之差r-a 进行比较:
如果r-a>p,则将此噪声像素聚类到道路像素类R;
如果r-a<p,则将此噪声像素聚类到区域像素类A;
如果r-a=p,则此噪声像素仍属于噪声像素类N,暂不聚类。
显然,如果此时p 的取值为0,此聚类准则就是“无偏”聚类准则。一般情况下,比较参数p 可以选取1 或-1,相对于p=0 时的“无偏”聚类准则,可以将此聚类准则定义为“有偏”聚类准则。当p=-1 时,此“有偏”聚类准则称为偏道路“有偏”聚类准则,当p=1 时,此“有偏”聚类准则称为偏区域“有偏”聚类准则。
7.2.7.2 “有偏”聚类过程
“有偏”聚类时,首先,对整幅地图的每个噪声像素的外延特征参数进行提取;然后,利用“有偏”聚类准则对每个噪声像素进行聚类。
7.3 算法分析
7.3.1 道路和区域的一致化及初始聚类的必要性说明

图7-4 交通地图中特殊道路和区域示例
如图7-4 所示,在中国城市交通地图中,城市道路基本是用白色表示,但是在有些特殊的道路上,比如为了特别注明此路为“步行街”、“非机动车道”等,则使用其他颜色。为了便于处理,还必须进行道路的归一化。对于区域,同样要进行归一化,也就是说,要将代表湖泊、公园等特殊场所的特殊颜色(如绿色、蓝色等)统一为代表区域的同一种颜色。虽然代表区域的颜色种类特别的复杂、繁多,但是本文所介绍的方法只需要将所占面积比较大的少数几种颜色(比如表示公园或风景区的绿色、代表湖泊的深蓝色等)进行归一化就可以了。
如图7-2 所示的“安”字中,虽然肉眼可以看出此字中还有好多像素是“白色”的,但是事实上,这种“白色”并非真正与表示道路的白色是相同的颜色,它们只是一种与白色相近的颜色。这是由于地图印刷时颜色的应用误差和颜色的互相影响所引起的,如果不把这些颜色做一个初始聚类,那么这些近似的“白色”就会被归为噪声像素类N,而这些仅有的“白色”,却决定了噪声最重要的外延特征。另外对于区域也要同样进行初始聚类,原因是相同的。
7.3.2 “无偏”聚类准则的准确性分析
如图7-5(a)所示,外围大的矩形框表示区域边界,内部小的矩形框表示全部位于区域内的噪声像素块,显然此噪声像素块中的任何一个噪声像素的外延特征参数均为r=0,a=8,e=0;由于利用“无偏”聚类准则,这个噪声像素块中的所有噪声像素均可被聚类到区域像素类,这与实际情况相符,所以“无偏”聚类准则适用于这种噪声像素存在形式,不会发生误聚类现象。

图7-5 几种不同类型噪声“无偏”准则处理示例
如图7-5(b)所示,两条平行线表示道路的边界,内部小的矩形框表示全部位于道路内的噪声像素块,显然此噪声像素块中的任何一个噪声像素的外延特征参数均为r=8,a=0,e=0;由于利用“无偏”聚类准则,这个噪声像素块中的所有噪声像素均可被聚类到道路类,这与实际情况相符, 所以“无偏”聚类准则也适用于这种噪声像素存在形式,不会发生误聚类现象。
如图7-5(c)、图7-5(d)所示,中间两条长的平行线代表理想的道路,两图中的两个正方形框代表文字噪声像素块。
在图7-5(c)中,选取文字噪声像素块中位于区域上的一个噪声像素,同时以此噪声像素为中心引出8 条射线。显然,在8 个方向上至少有1、2、3、4、5 等共5 个方向上最终必然搜索到区域像素,这时此噪声像素的外延特征一定为r<a。按照“无偏”聚类准则,这个噪声最终聚类到区域像素类,这也与实际情况相符。
在图7-5(d)中,选取文字噪声像素块中位于道路上的一个噪声像素,当分析它的外延特征参数时,可能会误以为r=2,a=6,但是,如果考虑一下中国文字的自身特点,就会发现这个正方形内并不全是噪声像素。大家知道中国汉字是由笔画构成,不仅每个笔画之间都有一定距离,而且每个笔画的宽度与道路的宽度相比显然很小,本文所研究的噪声至少与道路的一个边缘之间存在多个笔画,而这些笔画间隙中的像素,在理想的情况下应该是道路像素。这样,由于至少有3 个方向会发现道路像素,在理想的情况下r=2+3=5,a=6-3=3,所以噪声的外延特征为r>a,且此噪声可被“无偏”聚类准则聚类到道路像素类,这也与实际情况相符。
所以说,在理想的情况下,由于文字的笔画之间存在间隙,并且这些间隙由道路像素组成,因此利用“无偏”聚类准则,就完全可以正确聚类。
7.3.3 “有偏”聚类准则的必要性分析
在利用“无偏”聚类准则对噪声像素进行聚类时,显然,若噪声像素位于道路和区域的边界,则这些边界噪声像素的外延特征为r=a。根据“无偏”聚类准则,由于这些噪声像素将不进行聚类,仍然归为噪声像素类N,所以,仅仅利用“无偏”聚类准则不可能将所有噪声进行聚类,这是由“无偏”聚类准则自身决定的。因此必须引入“有偏”聚类准则才能将残留的边界噪声像素完全聚类到道路像素类或区域像素类。
实践证明,“有偏”聚类准则的应用可以有效并快速地对残留的边界噪声进行聚类。根据所使用的“有偏”聚类准则的不同,这些边界噪声将被聚类到不同的像素类。显然,如果使用偏区域“有偏”聚类准则,则边界噪声像素将被聚类到区域像素类;如果使用偏道路“有偏”聚类准则,则边界噪声像素将被聚类到道路像素类。
7.3.4 “有偏”聚类准则的收敛性分析
由于利用“无偏”聚类准则进行聚类之后,剩余的边界噪声的外延特征必为r=a,因此需再利用“有偏”聚类准则进行聚类,假如使用偏道路“有偏”聚类准则,那么任何边界噪声的外延特征参数必然满足r+1 >a 的要求,这样所有边界噪声像素将被聚类到道路像素类;假如使用偏区域“有偏”聚类准则,那么任何边界噪声的外延特征参数必然满足r<a+1 的要求,这样所有边界噪声像素将被聚类到区域像素类;由此可见,“有偏”聚类准则具有收敛性。
7.3.5 实验结果
为了解本文算法效果,对一幅城市交通地图进行了去除字符噪声的处理,图7-6(a)为将要去除噪声的源图,经过道路的初始聚类、道路的归一化、区域的初始聚类和区域的归一化4 个步骤,其处理结果见图7-6(b);然后提取图7-6(b)中噪声像素的外延特征,并利用“无偏”聚类准则对图7-6(b)的噪声像素进行聚类,聚类后的道路图如图7-6(c)所示;最后利用偏区域“有偏”聚类准则对图7-6(c)中残留的位于道路和区域边界部分的噪声进行聚类,其实验最终处理结果见图7-6(d)。





图7-6 本文方法去除地图噪声处理结果
7.3.6 结论
由最终处理结果(图7-6(d))和源图(图7-6(a))的比较可见,显然,噪声已被完全去除,同时道路和区域的边界没有受到大的破坏。如果再用矢量化软件对图7-6(d)进行矢量化,会得到很好的效果。
本文分析了栅格城市交通地图中噪声的基本特征,并探索出一种行之有效的噪声去除方法,它不仅为栅格地图的噪声去除提供了一个简单、快速、有效的模块,而且对栅格地图的矢量化所必需的地图道路的提取具有重要的意义。
应用此基于外延特征的噪声去除方法,基本上可以对地质出版社地图编辑室所编制的中国公路交通图册中的所有城市地图进行噪声去除处理,但是,由于极少数城市地图(如上海)会偶尔出现道路比较窄,而标明道路名称的文字噪声相对又很大的特殊情况,由于这种情况与理想情况相去甚远,因此在这些地方文字噪声会被误识别为区域。
当然,随着城市交通地图制作技术的不断进步,文字的笔画宽度将会减小,代表文字噪声的像素块的面积相对于道路会越来越小,实际情况会越来越接近于理想情况,这种新的去除噪声的方法存在的问题将会逐渐消失。


