江西地名研究
关注我们,获取更多地名资讯
关注
摘要:地名查询方式多种多样,但它们都没有考虑地名语义类型因素,而语义类型恰恰是地名信息中相当重要的一部分。以地名语义分类为基础,构建了地名语义类型本体模型,并以郑州市为例进行了地名组配查询实验。结果表明,该方式对于检索地名的相关信息具有较好的辅助作用,为地名查询与检索作了有益的补充。
关键词:地名;通名;专名;地名本体;语义类型本体;地名组配查询
地理上,定义一个地方的方法有:①用一个或多个地名进行定义(常用的地名);②用一个或多个地方类型定义(分类模式);③用零、一个或多个地理空间footprint定义(地理参考的几何定位);④用零、一个或多个时间footprint定义(地方合法的时间间隔)。地名是地图空间认知的“定位符”。在GIS中,地名的查询可以分为2大类。第1大类包括3种方式:基于图形图像的地名查询方式、基于属性信息的地名查询方式和基于名称信息的地名查询方式。第2大类包括绝对方式和相对方式2种,绝对方式即通过地名地理坐标来进行查询和定位,而相对方式是借助地理对象的相对位置进行查询和定位,主要包括交点法和门牌号法。但是,上述2大类方法都没有考虑地名语义类型,而语义类型恰恰是地名信息中相当重要的一部分。地名分为通名和专名,两者皆有语义类型。本文以地名的语义分类为基础,构建语义类型本体,并基于地名语义类型本体进行了地名相关信息的组配查询,为地名信息查询方式作了有益的补充。
1
地名本体模型
本体有很多定义,较权威的是1998年德国的Studer在总结Gruber和Borst的定义基础上提出的:“本体是共享概念模型的明确的形式化的规范说明。”本定义包含4层含义:①本体是客观世界的抽象模型,表示的含义独立于具体的环境状态;②概念及概念间关系都有明确的定义;③形式化,本体是可以被计算机理解和处理的;④共享,本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集。
本文基于地名的实体属性、语义类型及空间关系属性3个方面构建地名本体模型,由地名实体本体、语义类型本体及空间关系本体组成,如图1所示。
2
语义类型本体模型
地名语义类型是基于统计学方法确定的,本文主要借鉴文献中的地名语义类型分类方式。地名语义类型本体由自然地理及人文地理2个大类组成,大类又详细划分为多个子类,如因水为名、因山为名、地形地名、数字地名、动物地名、植物地名、物产地名、天文地名、气候地名、矿物地名、颜色地名、土壤地名及人物地名、姓氏地名、方位地名、史迹地名、对称地名、形象化地名、移民地名、词义地名、故国地名、年号地名、宗教地名、神话传说地名、语讹地名、复合地名、简化地名、避讳地名、少数民族地名、美愿地名等,如图2所示。
3
实验研究
地名组配查询是基于地名语义类型本体的地名查询方式。本文以地名语义类型为查询条件,综合运用“单”类型、“交”类型及“并”类型约束条件进行查询。以郑州市为例进行地名组配查询,查询条件如图3所示,图中下方的单选按钮为3类约束查询条件。“单”表示进行单一类型查询,为默认约束;“交”约束可以同时选择2类同时进行查询,查询结果为所选类型的交集;“并”约束为多个类型同时进行查询,可选出所选类型的所有地名。选择多种组配条件进行综合查询,常用于不太确定的地名查询。有些地名并不只有一种语义类型,如八陵、八面神,它们分别是数字地名、史迹地名和数字地名、神话传说地名,这类地名进行多语义类型查询均可查到。有的地名不止有2个语义类型,如白马寺镇蕴含动物、颜色、史迹及宗教地名。为方便起见,本文只取2个特征较突出的语义类型,分别对应地名专名及通名语义类型。如果需要更加深入地研究地名的语义类型及其他信息,可以更加详细地对地名进行语义分类,这里不再赘述。“单”、“交”查询举例分别如图3、4所示。
除可以进行区域范围信息查询外,还可以进行单点查询。单点查询针对单地物兴趣点进行信息查询,与区域范围信息查询相互补充。单点地名组配查询界面如图5所示,与区域范围查询相比较,单点地名组配查询增添了语义类型、所属区划及坐标信息。以二七区为例进行查询,如图6所示。
4
结语
地名分为通名和专名,两者皆有语义类型,且专名语义类型较通名更加多样化。地名语义类型是地名信息中的重要组成部分,在进行地名信息查询与检索时将地名语义类型考虑在内,查询结果才会更加完善。地名语义类型研究下一步要做的工作主要包括:地名语义类型的细化、特殊地名语义类型的界定和地名语义类型库的构建等。
作者:陈健 张斌 梁汝鹏
来源:《地理空间信息》2013年第3期
选稿:宋柄燃
编辑:朱 琪
校对:汪鸿琴
审订:计梦菲
责编:黎淑琪
(由于版面内容有限,文章注释内容请参照原文)
欢迎来稿!欢迎交流!
转载请注明来源:“江西地名研究”微信公众号