中南大学学报(自然科学版)

智能交通系统本体数据集成

李文雄1,闫茂德2,王建伟1

(1. 长安大学 经济与管理学院,陕西 西安,710064;

2. 长安大学 电子与控制工程学院,陕西 西安,710064)

摘 要:

输行业普遍存在的多源异构交通数据难以充分共享的问题,提出一种基于本体的智能交通系统ITS数据集成框架。该框架以工具开发的OWL本体作为ITS共享数据语义的标准化定义,使用D2RQ引擎实现了遗留交通数据向本体形式数据片段的映射功能,通过JENA本体中间件将多源本体数据片段集成为一个统一的数据语义视图,从而实现面向主题的ITS信息数据服务组件的数据共享与互操作。为验证框架的正确性和可行性,以国内区域高速公路网交通地理信息数据集成为例,从共享本体开发、本体数据映射文件设计和本体中间件开发等方面完成了ITS数据集成系统的实现。系统示范应用表明,该成果可用于ITS系统对多源异构交通数据的一致理解和充分共享,在我国交通运输行业的信息化建设中具有应用价值。

关键词:

智能交通系统数据集成本体本体中间件高速公路网

中图分类号:U491.5          文献标志码:A         文章编号:1672-7207(2013)07-3038-08

Ontology-based data integration for intelligent transport systems

LI Wenxiong1, YAN Maode2, WANG Jianwei1

(1. School of Economics and Management, Chang’an University, Xi’an 710064, China;

2. School of Electronic and Control Engineering, Chang’an University, Xi’an 710064, China)

Abstract: Regarding the well-known problems of inadequate sharing of multi-sourced, heterogeneous transportation data in Chinese traffic and transportation industry, a data integration framework for intelligent transport systems (ITS) was proposed. This framework adapted a kit of ontology technology which became mature and popular in recent years. In detail, it utilized -developed OWL ontology as standard definition of shared ITS data, incorporated D2RQ engines to map multi-sourced legacy data into fragments of well-formed ontology data, and introduced JENA-based ontology middleware to integrate multiple fragments of ontology data into a integral view of data semantics. Therefore, it provided better data-sharing abilities and more intelligent data manipulating methods for topic-oriented ITS business components in its upper layers. Taking the geographic and transportation data integration of Chinese regional expressway networks as application scenario, this framework was implemented in such aspects as shared ontology development, ontology data mapping file design and ontology middleware development. Sample application shows that the research results are applicable in ITS research and development in Chinese traffic and transportation industry, and can promote the common understanding and sharing of multi-sourced, heterogeneous transportation data among ITS subsystems. Therefore, it can play an important role in the informatization process of Chinese traffic and transportation industry.

Key words: intelligent transport system (ITS); data integration; ontology; ontology middleware; expressway network

随着我国交通基础设施建设的不断推进,以智能交通系统(intelligent transport systems,ITS)为代表的交通信息化和智能化建设成为关注热点[1-2]。由于我国前期建设中普遍存在条块分割、重硬轻软、重建设轻管理等问题,导致交通数据在表达上往往相互异构,众多的公共数据无法充分共享而形成了“信息孤岛”[3]。如何通过数据集成手段,提高多源异构交通数据的共享能力,从而将交通运营管理从局部提升到全局层次,是目前我国ITS研发与推广应用所面临的迫切任务。本体(Ontology)是近年来出现的一种新的业务数据描述规范,可以准确地描述数据语义,并能推理隐含的数据语义关系[4]。相比于传统的自底向上萃取知识的数据集成,本体数据集成具有自顶向下的特征,利用本体建模共享数据的语义视图,并将不同数据源的异构数据映射为规范化的本体实例数据,能最大程度地减小甚至消除分布式业务系统内部对共享数据的二义性理解,是一种更为先进的数据集成方式[5]。在智能交通领域,Wu等[6]基于语义网格建立了ITS框架,较早考虑了交通数据的语义建模问题;Samper等[7]根据出行者信息服务需求,建立了道路交通本体,提出了交通数据集成的语义Web服务框架;Mnasser等[8]利用工具开发了出行者信息服务本体,分析了本体推理的相关性和一致性;黄坷萍等[9]建立了城市公交系统本体,提出了基于本体的交通知识推理与数据查询方法;曹妍等[10]针对城市ITS异构数据集成,研究了本体与关系数据模式的多策略映射方法;郭军杰等[11]针对我国高速公路网的多源异构交通数据,建立了包含抽象拓扑、几何构件、线性参照、附加设施与动态数据等模块的本体模型。但是,上述研究仍集中于交通领域本体建模,或仅提出了ITS数据集成平台的框架结构,缺乏开发实现方面的深入研究。目前,以RDF,OWL和SPARQL等规范及JENA,D2RQ和等开发工具为代表的本体技术体系迅速发展,成为本体数据集成的技术基础。因此,本文作者设计了一种基于本体的ITS数据集成框架,针对区域高速公路网开发了一款ITS数据集成系统,并从基于的OWL共享本体开发、基于D2RQ语言的映射文件设计、基于JENA的本体中间件开发三方面总结了系统实现细节。

1  ITS本体数据集成框架

本体是对共享概念明确的、形式化的规范说明[4]。随着本体应用的普及,本体相关技术迅速涌现并渐成体系。例如,本体描述规范经过长期的发展和演变,最终固定为资源描述框架RDF和Web本体语言OWL 2种规范,RDF定义了“主体-属性-客体”三元组形式的知识表示结构,OWL为RDF引入了owl:Thing,owl:Class,owl:Property等词汇使知识描述更加便捷[12];SPARQL是RDF三元组数据查询规范,其语法与关系数据库数据查询语言SQL相似[13]是由斯坦福大学开发的开源本体开发工具,具有丰富的插件支持[14];JENA是Apache公司开发的开源本体数据引擎工具包,封装了本体数据的标识、查询、推理、持久存储等功能,其作用类似于关系数据库引擎JDBC[15];关系数据库是本体数据集成中遗留数据源的主要形式,D2RQ开源工具支持本体查询语言SPARQL与数据库查询语言SQL的相互转换,因此通过定义一定的数据映射规则,可以将关系数据库数据映射为RDF三元组形式的本体数据,或将RDF三元组数据储存到关系数据库当中[16]

以上述本体技术体系为支撑,设计适用于我国交通信息化建设的ITS数据集成框架如图1所示。该框架自底向上由数据层、中间层、业务层3个层次组成,不同层次分别向上提供不同的数据呈现方式及数据操作接口。数据层通过对遗留交通数据进行封装,形成RDF三元组形式的本体数据片断,允许上层利用SPARQL语言进行数据查询。中间层基于共享本体所定义的交通数据语义视图,对下层所提供的、相互分散的本体数据片断进行集成,向上提供统一的数据查询、推理等操作接口。业务层面向信息发布、交通监控、出行辅助等不同业务,利用业务组件封装业务逻辑,向上提供面向主题的ITS信息服务接口。

共享本体、本体中间件和D2RQ引擎等模块是整个框架的核心。共享本体是ITS数据语义的标准化定义,由1个或多个OWL本体文件组成,均使用工具开发,可以通过HTTP等互联网协议访问。本体中间件基于JENA开发,是上层ITS信息服务与下层封装数据源之间通信的桥梁,利用JENA提供的本体查询与推理功能将上、下2层无缝地关联起来,向上提供面向业务的操作接口,向下则以RDF三元组形式访问本体数据。D2RQ引擎主要用于关系模式数据源的封装,通过建立映射文件,实现了关系模式数据向RDF三元组形式本体数据的转换。

2  实例系统开发

近年来,我国高速公路建设迅速发展,通车里程不断增加,高速公路布局也发生了由通道型向网络型的根本性转化[2]。以我国区域高速公路网的交通地理信息展示为上层示例应用,构造异构的交通地理信息数据源,基于上述框架开发ITS数据集成系统(下文简称系统),如图2所示。

图1  基于本体的ITS数据集成框架

Fig.1  Ontology-based data integration framework for ITS

图2中,系统所需的交通业务数据分别存储于2个相互独立的关系数据库中。路网数据库dbNet按照“路段-节点”模式存储了区域高速公路网的拓扑特征数据,交通地理数据库dbGis存储了路网要素(如节点或路段)的地理位置数据。通过分析这些遗留数据语义,利用工具开发了OWL格式共享本体(存储为expressway.owl文件),并开发了2个映射文件mapping-net.ttl及mapping-gis.ttl,用来定义关系数据库数据向本体数据转换的映射规则。D2RQ引擎封装为d2rq.jar程序包文件,提供了数据映射功能;本体中间件封装为ewMidware.jar程序包文件,通过定义一系列JENA模型(如数据映射模型mnet和mgis、元数据模型schema及推理模型inf),提供了基于本体的数据集成功能;上层业务逻辑封装为Java组件(对应于ewBean.jar程序包文件),使用Java动态网页技术JSP开发系统门户网站,以网页形式向用户展示区域高速公路网的交通地理信息数据。共享本体开发、映射文件设计、本体中间件开发是整个系统开发的关键,共同实现了基于本体的异构交通数据集成功能,下面详细总结其实现要点。

2.1  基于的OWL共享本体开发

本体数据集成所采用的共享本体有单本体、多本体和混合本体等多种形式,分别适用于不同的数据集成场合[5]。本系统所需数据分别存储于dbNet和dbGis 2个独立的关系数据库中,表1所示为二者所含的关键数据表模式。根据2个数据源中的数据语义,本系统适合于单本体形式。利用工具开发面向多源异构数据的全局性共享本体,其OWL格式文件命名为expressway.owl,其核心结构如图3所示。

图3中,方框代表类,是对有意义事物的形式化描述;实线表示类继承关系,虚线表示类属性,是对事物性质与关联的形式化描述;各元素的短前缀代表其所属本体,如“rdf:”表示对应元素引用自RDF元数据本体,“ew:”表示对应元素定义于expressway.owl文件。例如,图3中rdf:seq表示有序序列,rdf:li属性表示有序序列对于有序元素的包含关系,二者均来自RDF文件。本体属性可附加传递性、对称性、函数性、全局性、存在性、基数等约束条件。例如,图3中ew:hasSegment属性表示道路对路段的包含关系,其客体均来源于路段类ew:Segment且至少有一个实例,所以该属性同时有全局性和存在性约束;ew:locateAt属性表示节点所在位置,其客体来源于地理坐标类ew:GeoCoord且唯一,因此其基数等于1。属性还可用于关联类与基本数据,如交通要素类ew:Feature的实例都具有ew:hasName属性,其数据为字符串;地理坐标类ew:GeoCoord的实例均具有ew:hasLongitude和ew:hasLatidude属性,其数据为浮点型;等等。

图2  区域高速公路网ITS数据集成系统实现

Fig.2  Implementation of ITS data integration system for regional expressway networks

表1  遗留关系数据库的关键数据表模式

Table 1  Schema of key data tables in legacy relational DBs

图3  共享本体的核心片段

Fig.3  Core fragment of shared ontology

2.2  基于D2RQ的映射文件设计

D2RQ映射文件(后缀名*.ttl)由一系列映射规则组成,D2RQ引擎通过解释这些映射规则,将关系数据库数据转换为RDF三元组形式的本体数据[16]。应用D2RQ映射规则语言,针对关系数据库dbNet和dbGis分别开发其D2RQ映射文件。以dbNet数据库的映射文件mapping-net.ttl为例,其部分D2RQ映射规则如图4所示,表2给出了图4中典型映射规则的具体代码。其中,前缀“d2rq:”表明对应资源或关系来自D2RQ映射规则语言,前缀“ew:”表明对应资源或关系来自共享本体。

图4中包含3类实体:(1) 最左列实体代表类映射规则。以规则Route_ClassMap为例,其详细定义如表2第1行所示,表示将关系数据库dbNet中道路表dtRoute的每个元组映射为共享本体中道路类ew:Route的一个实例;(2) 中间列实体代表属性映射规则。例如,表2第2行给出了规则Route_hasName的定义,对应属性为ew:hasName,属性主体由Route_ClassMap规则生成,属性客体为dtRoute表中当前元组的name字段值;表2第3行给出了规则Route_hasSegment的定义代码,对应于属性ew:hasSegment,属性主体由Route_ClassMap规则生成,属性客体由规则Segment_ClassMap生成,属性的主体和客体之间的匹配关系与数据库dbNet中关联表dtRS_Relation所表示的多对多关系一致;(3) 最右列实体代表映射目标,如类ew:Route、属性ew:hasName等均来自共享本体文件expressway.owl。

图4  D2RQ映射文件片断图例

Fig.4  Sample fragment of D2RQ mapping file

表2  D2RQ映射规则示例

Table 2  Sample D2RQ Mapping Rules

2.3  JENA本体中间件开发

JENA模型(命名为Model)是对RDF三元组形式本体数据片段的封装,对外提供统一的本体数据操作接口。为了方便不同应用目的下的本体操作,JENA工具还对Model接口进行了多种扩展。例如,OntModel进一步封装了符合OWL规范的本体操作,适用于对OWL本体文件进行操作;InfModel封装了本体数据的推理功能,支持多种不同层次的推理方式;为了与JENA无缝集成,D2RQ工具包还为JENA引入了D2RQModel,用于从JENA程序中访问D2RQ数据映射引擎[15-16]

表3所示为本体中间件开发中的JENA模型操作关键代码。该段代码首先定义了2个D2RQModel实例mnet和mgis,分别对应于2个独立数据源通过D2RQ引擎映射所产生的本体数据片段。为了将相互独立的本体数据进行集成,该段代码又定义了共享本体所对应的OntModel实例schema,并利用OntModel所提供的add()方法将schema与mnet、mgis进行叠加,形成统一的交通数据语义视图。进而,以schema为参数定义了InfModel实例inf,向上提供智能化的本体数据查询与推理功能。

表4给出了JENA本体中间件中数据查询与推理操作示例。其中,字符串参数sparql对应于一个SPARQL查询语句,用于查询交通要素类ew:Feature的所有实例及其名称。根据图3所示的共享本体定义,查询结果应同时包括节点类ew:Joint、路段类ew:Segment及道路类ew:Route的所有实例。该段代码中使用了InfModel实例inf,支持本体推理功能,因此可以得到正确的查询结果。若换作OntModel实例schema,虽然针对的是相同的本体数据,但反馈结果为空,因为本体数据中没有类ew:Feature的直接实例。

表3  JENA模型操作关键代码

Table 3  Key codes for manipulating JENA models

表4  数据查询推理示例代码

Table 4  Sample codes for data query and inference

3  系统示范应用

西安是我国中西部两个经济区域的交通枢纽城市,具有承东启西、连接南北的重要交通地位,目前已形成米字型的区域高速公路网主骨架。将本文系统应用西安市区域高速公路网,其门户网站首页如图5所示。图5中,左侧为地图展示区域,使用Web地图插件展示区域高速公路网的交通地理信息;右侧列表展示了西安市周边高速公路的名称及编号,用户可以通过列表选择操作,在左侧地图中浏览对应的路段、节点信息。例如,图5中展示了西安绕城高速公路(G3001)所包含的路段与节点信息,共8个互通式立交、5个出入口立交和13条路段。用户还可以进一步浏览这些节点、路段的详细信息。

通过反复实验发现,该系统读取遗留关系数据库的所有数据耗时约420 ms。与之相对的、直接操纵关系数据库的系统实现下,对应耗时约为90 ms,约为本文系统耗时的1/4。由于网络延迟,加载网站页面及Web地图插件耗时约为1 700 ms。相对于网络耗时,由于本体数据映射、推理等所造成的操作耗时相对可忽略,由此验证了本文框架及系统在实际工程实践中的可行性。

图5  区域高速路网交通地理数据集成系统首页

Fig. 5  Home page of geographic and transportation data integration system for regional expressway network

4  结论

(1) 针对我国交通运输行业多源异构交通数据集成需求,基于本体技术体系,提出了ITS本体数据集成框架。该框架具有自顶向下的层次化结构特征,可以将分布于不同数据源的异构数据映射为具有统一语义描述的本体数据,最大程度地减小甚至消除ITS内部对共享数据的二义性理解,实现ITS共享数据的有效集成。

(2) 以我国区域高速公路网为对象,开发了路网交通地理数据集成系统。从基于的OWL共享本体开发、基于D2RQ的映射文件设计、基于JENA本体中间件开发3个方面,详细总结了系统实现要点。系统示范应用表明,本文成果在实际ITS研发中具有应用价值。

(3) 本文工作仍存在一些不足之处。例如,仅支持关系数据库数据集成,其他形式的遗留数据有待进一步考虑;实例系统仅实现了遗留数据的读取与展示,暂时没有通过SPARQL和D2RQ对遗留数据进行的修改或增删操作,也需要进一步完善。

参考文献:

[1] Farooq U, Siddiqui M A, Gao L, et al. Intelligent transportation systems: An impact analysis for Michigan[J]. Journal of Advanced Transportation, 2012, 46(1): 12-25.

[2] 《中国公路学报》编辑部. 中国公路交通学术研究综述: 2012[J]. 中国公路学报, 2012, 25(3): 2-50.

Editorial Department of China Highway and Transport. An academic research summary on China highway and transport: 2012[J]. China Journal of Highway and Transport, 2012, 25(3): 2-50.

[3] 谢军, 张生瑞, 胡长水. 交通信息化发展评价[J]. 长安大学学报: 自然科学版, 2007, 27(6): 76-79.

XIE Jun, ZHANG Shengrui, HU Changshui. Evaluation of transport information development[J]. Journal of Chang’an University: Natural Science Edition, 2007, 27(6): 76-79.

[4] Dietz J L G. Enterprise ontology: Theory and methodology[M]. Berlin: Springer, 2010: 35-80.

[5] Dnyanesh R, Rahul C. A generic ontology development framework for data integration and decision support in a distributed environment[J]. International Journal of Computer Integrated Manufacturing, 2011, 24(2): 154-170.

[6] Wu Z, Deng S, Wu J, et al. DartGrid Ⅱ: A semantic grid platform for ITS[J]. IEEE Transactions on Intelligent Systems, 2005, 20(3): 12-15.

[7] Samper J J, Tomás V R, Martinez J J, et al. An ontological infrastructure for traveler information systems[C]//Proceedings of the 9th IEEE Conference on Intelligent Transportation Systems. Toronto: IEEE, 2006: 1197-1202.

[8] Mnasser H, Maha K, Kathia O, et al. A public transportation ontology to support user travel planning[C]//Proceedings of the 4th International Conference on Research Challenges in Information Science (RCIS-2010). Nice: IEEE, 2010: 127-136.

[9] 黄坷萍, 蒋昌俊. 基于本体的城市交通的知识分析和推理[J]. 计算机科学, 2007, 34(3): 192-196.

HUANG Keping, JIANG Changjun. Analyzing and reasoning knowledge of urban transportation: based on ontology[J]. Computer Science, 2007, 34(3): 192-196.

[10] 曹妍. 本体理论在城市智能交通系统语义集成中的应用研究[D]. 大连: 大连海事大学交通运输管理学院, 2010: 37-114, 157-172.

CAO Yan. Application research on semantic integration of city ITS based on ontology theory[D]. Dalian: Dalian Maritime University. College of Transportation Management, 2010: 37-114, 157-172.

[11] 郭军杰, 闫茂德, 陈荫三. 高速公路网异构GIS-T信息共享的本体模型[J]. 交通运输工程学报, 2011, 11(1): 24-29.

GUO Junjie, YAN Maode, CHEN Yinsan. Ontology model of information sharing for heterogeneous GIS-T in freeway network[J]. Journal of Traffic and Transportation Engineering, 2011, 11(1): 24-29.

[12] Pan J Z. RDFS(FA): Connecting RDF(S) and OWL DL[J]. IEEE Transactions on Knowledge and Data Engineering, 2007, 19(2): 192-206.

[13] SPARQL Query Language for RDF[R/OL]. [2010-03-21]. http://www.w3.org/TR / Spargl11-overview.

[14] Horridge M. A practical guide to building OWL ontologies using 4 and CO-ODL tools[R/OL]. [2011-03-24]. http://owl.cs.manchester. ac.uk/tutorials/protegeowltutorial/.

[15] Hilera J R. Comparation of owl ontologies reasoners: Testing cases with Pellet and Jena[C]//Proceedings of the 6th International Conference on Software and Database Technologies. Seville: INSTICC Press, 2011: 419-422.

[16] Eisenberg V, Kanza Y. D2RQ/Update: updating relational data via virtual RDF[C]//Proceedings of the 2012 International Conference on World Wide Web. Lyon: ACM, 2012: 221-222.

(编辑  赵俊)

收稿日期:2012-10-14;修回日期:2013-01-30

基金项目:交通运输部应用基础研究项目(2011319812400);中央高校基本科研业务费专项资金(CHD2012JC008)

通信作者:李文雄(1977-),男,陕西榆林人,博士研究生,从事交通安全与智能交通、交通信息集成等相关研究工作;电话:029-82334032;E-mail: wxli@chd.edu.cn

摘要:针对国内交通运输行业普遍存在的多源异构交通数据难以充分共享的问题,提出一种基于本体的智能交通系统ITS数据集成框架。该框架以工具开发的OWL本体作为ITS共享数据语义的标准化定义,使用D2RQ引擎实现了遗留交通数据向本体形式数据片段的映射功能,通过JENA本体中间件将多源本体数据片段集成为一个统一的数据语义视图,从而实现面向主题的ITS信息数据服务组件的数据共享与互操作。为验证框架的正确性和可行性,以国内区域高速公路网交通地理信息数据集成为例,从共享本体开发、本体数据映射文件设计和本体中间件开发等方面完成了ITS数据集成系统的实现。系统示范应用表明,该成果可用于ITS系统对多源异构交通数据的一致理解和充分共享,在我国交通运输行业的信息化建设中具有应用价值。

[1] Farooq U, Siddiqui M A, Gao L, et al. Intelligent transportation systems: An impact analysis for Michigan[J]. Journal of Advanced Transportation, 2012, 46(1): 12-25.

[2] 《中国公路学报》编辑部. 中国公路交通学术研究综述: 2012[J]. 中国公路学报, 2012, 25(3): 2-50.

[3] 谢军, 张生瑞, 胡长水. 交通信息化发展评价[J]. 长安大学学报: 自然科学版, 2007, 27(6): 76-79.

[4] Dietz J L G. Enterprise ontology: Theory and methodology[M]. Berlin: Springer, 2010: 35-80.

[5] Dnyanesh R, Rahul C. A generic ontology development framework for data integration and decision support in a distributed environment[J]. International Journal of Computer Integrated Manufacturing, 2011, 24(2): 154-170.

[6] Wu Z, Deng S, Wu J, et al. DartGrid Ⅱ: A semantic grid platform for ITS[J]. IEEE Transactions on Intelligent Systems, 2005, 20(3): 12-15.

[7] Samper J J, Tomás V R, Martinez J J, et al. An ontological infrastructure for traveler information systems[C]//Proceedings of the 9th IEEE Conference on Intelligent Transportation Systems. Toronto: IEEE, 2006: 1197-1202.

[8] Mnasser H, Maha K, Kathia O, et al. A public transportation ontology to support user travel planning[C]//Proceedings of the 4th International Conference on Research Challenges in Information Science (RCIS-2010). Nice: IEEE, 2010: 127-136.

[9] 黄坷萍, 蒋昌俊. 基于本体的城市交通的知识分析和推理[J]. 计算机科学, 2007, 34(3): 192-196.

[10] 曹妍. 本体理论在城市智能交通系统语义集成中的应用研究[D]. 大连: 大连海事大学交通运输管理学院, 2010: 37-114, 157-172.

[11] 郭军杰, 闫茂德, 陈荫三. 高速公路网异构GIS-T信息共享的本体模型[J]. 交通运输工程学报, 2011, 11(1): 24-29.

[12] Pan J Z. RDFS(FA): Connecting RDF(S) and OWL DL[J]. IEEE Transactions on Knowledge and Data Engineering, 2007, 19(2): 192-206.

[13] SPARQL Query Language for RDF[R/OL]. [2010-03-21]. http://www.w3.org/TR / Spargl11-overview.

4 and CO-ODL tools[R/OL]. [2011-03-24]. http://owl.cs.manchester. ac.uk/tutorials/protegeowltutorial/." target="blank">[14] Horridge M. A practical guide to building OWL ontologies using 4 and CO-ODL tools[R/OL]. [2011-03-24]. http://owl.cs.manchester. ac.uk/tutorials/protegeowltutorial/.

[15] Hilera J R. Comparation of owl ontologies reasoners: Testing cases with Pellet and Jena[C]//Proceedings of the 6th International Conference on Software and Database Technologies. Seville: INSTICC Press, 2011: 419-422.

[16] Eisenberg V, Kanza Y. D2RQ/Update: updating relational data via virtual RDF[C]//Proceedings of the 2012 International Conference on World Wide Web. Lyon: ACM, 2012: 221-222.