您好,欢迎来到飒榕旅游知识分享网。
搜索
您的当前位置:首页基于信息链的跨部门政府信息共享架构研究

基于信息链的跨部门政府信息共享架构研究

来源:飒榕旅游知识分享网
第32卷第11期 2013年11月 情报杂志 JOURNAL OF INTELLIGENCE Vo1.32 No.11 NOV. 20l3 基于信息链的跨部门政府信息共享架构研究术 陈 氢 (湖北工业大学管理学院摘要武汉430068) 跨部门政府信息共享是电子政务建设的关键内容,是一个复杂的过程,构建基于信息链的跨部门政府信息 共享架构有助于实现结构化和非结构化信息的共享。文章界定了电子政务信息链的概念,剖析了跨部门政府信息 共享架构的组件,即信息定义组件、信息存储组件和信息检索组件,阐述了其中存在的数据级冲突和架构级冲突;探 讨了信息共享方法,包括自由文本法、数据库模式法和XML存储库法,并对三种方法进行了比较。 关键词电子政务跨部门信息共享信息链 中图分类号G350 文献标识码A 文章编号1002—1965(2013)1 l一0164—05 A Framework for E-Government Inter-agency Information Sharing Based on Information Chain Chen Qing (School of Management,Hubei University of Technology,Wuhan 430068) Abstract E—government inter—agency information sharing is a key element of e-government construction and a complex process as wel1. A framework for e—government inter—agency information sharing based on information chain helps to achieve structured and unstructured information sharing.This paper defines the concept of e—government information chain,analyzes the components of inter—agency data services infrastructure in e-government,namely information definition component,information storage component nd ianformation retriev— al component,and discusses the presence of data—level conflicts and schema-level conflicts.On this basis,the paper explores the data service methods,including free text method。database schema method and XML repositories method,and makes comparisons of these three methods finally. Key words e-government inter-agency information sharing information chain 信息数字化已从根本上改变了政府部门开展工作 和提供服务的环境。实现政府跨部门数字化信息共享 能提高信息安全性,降低成本,有效地进行政府信息资 源管理,为公众提供高质量的政府服务。目前,对政府 跨部门信息共享的研究大都集中在异构数据源的结构 化信息共享中,而政府部门需要共享的信息具有不同 的结构化程度,范围涉及从自由文本文件到关系型数 据,其中,非结构化信息占信息总量的80%以上。构 建基于信息链的跨部门政府信息共享架构有助于实现 结构化和非结构化信息的共享。 “链”,一个是服务链,另一个是随之产生的信息链。 服务链是政府服务活动的主体,其是否畅通在很大程 度上决定着政府服务活动的效率。为了使政府服务活 动达到最优效果,就必须对服务链加以科学地计划、组 织和调节,使其按照一定的规律运行,而服务链畅通的 前提条件是信息链的畅通 。 电子政务信息链是指以政府有关部门输入各种信 息和公众需求为起点到政府有关部门最终处理有关信 息并创造出让公众满意的服务为终点的连续的有机节 点形成的链条,包括政府内部各部门之间的信息交流 链和政府与外界公众的信息互动链两大部分。其中, 政府各部门之间的信息共享是电子政务信息链畅通的 关键。 l 信息链与跨部门政府信息共享 1.1 电子政务信息链收稿日期:2013—09—02 在电子政府中贯穿着两个 修回日期:2013—09—29 基金项目:教育部人文社会科学研究规划基金项目“服务型政府中的电子政务信息链及其管理模型研究”(编号:11YJA870002);湖北省教育 厅人文社会科学研究重点项目“电子政府中的信息链及其管理模型构建研究”(编号:201ljyte031)研究成果。 作者简介:陈氢(1968一),女,博士,教授,研究方向:政府信息资源管理研究。 第11期 陈氢:基于信息链的跨部门政府信息共享架构研究 ・165・ 1.2跨部门政府信息共享 依据《中华人民共和 现信息共享。因此,应当采用适当的方法使政府部门 在各种结构化程度上灵活地组织信息,例如,某些结构 化信息(如姓名和地址等)可以作为关系数据库的字 段来组织,而其他的非结构化信息(如叙述性文件、条 例和规章等)应保留自由文本。下面将构建一个基于 信息链的跨部门政府信息共享架构来实现各种结构化 信息的共享。 国政府信息公开条例》第2条,政府信息是指行政机关 在履行职责过程中制作或者获取的,以一定形式记录、 保存的信息。与普通信息相比,政府信息具有显著的 特征:a.权威性,政府信息反映的是领导意图、社情民 意,在开发利用过程中有特定的要求;b.可靠性,政府 信息来源正规,开发利用一般要经过严格审核;c.保密 性,有些政务信息涉及到党和国家的秘密或公民的个 人隐私,是不宜公开的;d.稀缺性,当前政务信息不易 2信息共享架构的组件 获得,开发利用需要付出相当成本。 与普通信息一样,政府信息天生也具有共享的倾 向,作为政府工作的重要内容和对象,政府信息在政府 部门之间、政府与外界之间都存在着频繁的信息传递 与交互。但是,政府信息的严格保密体系却限制了其 共享范围和共享方式。一方面,政府信息的共享性要 求信息公开;另一方面,政府信息的保密性却把共享限 定在特定的范围之内,既共享又保密,成为了政府信息 所具有的一对矛盾。 随着电子政务不断向纵深发展,政府部门之间的 信息共享引起了人们越来越多的重视。跨部门政府信 息共享,即政府部门将自己采集到的信息,或者是在业 务办理过程中生成的信息与不存在隶属关系和业务指 导关系的其他部门进行共享,以避免信息的重复采集, 提高政府的办事效率,同时提高信息的可靠性、一致性 和完整性。但是,由于“部门私有化”等问题,不同部 门提供的信息可能来自不同的途径,其信息内容、信息 格式和信息质量千差万别,给跨部门信息共享带来了 很多困难。目前,我国电子政务在信息建设方面存在 不少问题,如:信息内容不齐全、信息质量不高、信息共 享程度不高、信息自动化采集率不高、信息管理力度不 够等。从电子政务信息链的视角来看待跨部门政府信 息共享有助于解决上述问题。 1.3结构化信息和非结构化信息通常我们按照 信息存储形式的不同,将信息系统中的信息分为结构 化信息和非结构化信息。 1.3.1 结构化信息。能够用统一的结构加以表 示的信息称之为结构化信息。通常是指可以用二维表 结构来逻辑表达实现的信息,如目前管理信息系统中 最常使用的关系型数据库就属于结构化信息。 1.3.2非结构化信息。通常是相对于结构化信 息而言,不方便用二维表结构来表现的信息,包括以 WORD、PDF、EXCEL等格式组成的各类办公文档、报 表凭证,以及图像、音频、视频等数据文件均为非结构 化信息。 大部分政府部门之间的信息共享往往是非结构化 的,结构化的信息集成方法不足以让政府部门之间实 在构建跨部门政府信息共享架构时有三个组件需 要考虑,即:信息定义组件、信息存储组件及信息检索 组件。 2.1信息定义基于信息链的跨部门政府信息共 享要求各政府部门在其职责范围内确立相应的信息 源,一次性从源头采集信息,其他部门不得擅自采集, 从而保证政府信息的权威性和可靠性,避免重复性劳 动;同时,由于政府信息具有保密性,政府部门中的信 息通常比较敏感,那些需要共享的政府信息实际上是 由不同部门分别来界定的。因此,需要实现信息定义 的标准化、规范化。 政府部门之间信息共享可以通过几种途径来实 现,以下是三个通用的标准。第一标准最明显的是自 由文本文件,文件名及关键词等字段是结构化信息。 这个标准包括纯文本标记语言,如HTML,自由文本文 件适合存储以WORD、PDF、EXCEL等格式组成的会 议记录、规则、条例或备忘录,政府信息的很大一部分 是这种格式。 第二个标准是使用关系数据库结构,它用关系的 形式来存储信息,其中每个表都有属性和包含实际数 据的数组。使用数据标准化的概念,关系模型通过公 认的规则消除数据冗余。大多数商业数据库管理系统 (DBMS)支持这个标准。 第三个标准是使用XML文档类型定义(Docu. ment Type Definition,DTD)。XML DTD是用于描述、 约束XML文档结构的一种方法,能使非结构化信息 结构化,它使用标签来区分元素和属性,这类似于关系 模型中的表和列。DTD除了可以声明元素和属性外, 还可以声明实体,如图像、音频、视频等多媒体信息都 可以作为实体,以便在XML文档中引用。XML使网 络变得更具语义性,因此软件代理能够获取信息并理 解其含义。XML的主要优点是:它是一个独立的标准 平台,其中的数据不需要通过专用的产品来读取;它允 许信息有可变的结构,某些部分可以是非结构化的自 由文本,而其他部分可以是结构化的信息。 2.2数据和架构冲突解决策略创建跨部门的文 档类型定义,从不同部门的数据库中收集数据形成实 ・166・ 情报杂志 第32卷 际的XML页面,必须解决不同数据库中数据和数据 定义之间存在的冲突。冲突分为两个主要类型:数据 级冲突和架构级冲突。 2.2.1数据级冲突。a.数值冲突,相同的数值在 不同的语境中有不同的含义,就产生了数值冲突。b. 表示冲突,同样的真实事物用不同的数据类型或格式 描述,就产生了表示冲突。C.单位冲突,在表示相同的 对于以WORD、PDF、EXCEL等格式组成的自由 文本形式存储的信息,搜索引擎(如谷歌)提供了一种 信息获取方法,这类似于在互联网上进行搜索,区别在 于前者搜索的不是众多的网站,而是自由文本库或 HTML文件库。第二种方法是使用基于搜索引擎(如 雅虎)的目录。如果在信息存储时使用了第三方应用 程序,那么搜索功能是由该应用程序提供的工具的功 能决定的。最后,如果信息存储时使用的是对象一关系 数据库管理系统,那么信息获取的便捷性取决于该数据 库管理系统支持的结构化查询语言(SQL)的功能。 数据库管理系统可用于存储关系数据库中的结构 化信息,并允许多个用户并发访问。对于大多数应用 程序,数据库管理系统提供了良好的吞吐量、可获得性 数据时用不同的计量单位,就产生了单位冲突。d.精 度冲突,数据用不同的尺度或粒度表示,就产生了精度 冲突。 2.2.2架构级冲突。a.命名冲突。命名冲突产 生于不同的数据库对属性、实体集、关系集等不同标签 的命名。同一个词在不同的数据库中会出现不同的含 义,这是同形异义词冲突;两个或多个词在不同的数据 库中用来描述相同的概念,这是同义异形词冲突。b. 主键冲突。当同一个对象的不同属性分别出现在不同 的数据库中时就会产生主键冲突。C.泛化冲突。当不 同的数据库对同一个实体集选用不同的划分标准时就 会产生泛化冲突。d.结构冲突。当不同的数据库用不 同的方法来表示相同的信息时就会产生结构冲突。换 句话说,基于不同的数据库结构设计,相同的信息在不 同的数据库中有不同的结构。 上述这些不同类型的冲突需要在信息定义阶段得 到解决,解决方案有两个: 方案一,目前已有自动化冲突解决方案可自动解 决大部分冲突 。方案二,先人工理解不同数据库之 和可靠性。利用结构化查询语言标准可以方便地获取 信息。查询结果可以利用ASP或JSP等技术通过互 联网提供。 如果信息是XML结构,其存储方法与自由文本 类似,可以采用文件系统、第三方应用程序和对象关系 型数据库管理系统。但是在访问信息时,自由文本和 XML文件之间有一个很重要的差异,那就是对于 XML文件,无法使用传统的搜索引擎通过关键词进行 搜索,同样,基于搜索引擎的目录也不能对XML页面 进行查询和检索。 为了解决这些问题,W3C提出了搜索XML文件 的两个标准,即XPath标准和XQuery标准,这两个标 准都在不断发展中。目前,这些标准能够对单一的 XML页面进行查询,而不是一个XML存储库中的页 间存在的冲突,然后编写翻译程序,使数据库遵循信息 定义阶段确定的DTD要求以XML页面的形式传递 信息。 2.3信息存储在基于信息链的跨部门政府信息 共享中,通过建立“物理分散、逻辑集中”的信息存储 平台,面向各政府部门提供信息存储服务,对各部门一 次性从源头采集的信息,建立面向各类业务的政府信 息资源目录和政府信息资源库,通过数据统建或共建, 最大限度实现信息共享,解决政府信息的稀缺性问题。 信息存储可以通过三种方法来实现。第一种方法 是对于以WORD、PDF、EXCEL等格式组成的自由文 面。为了创建一个XML存储库,首先要从本地数据 库或文档库中创建XML页面,然后创建XML存储库 来存储这些XML页面。这个XML存储库是一个通 过IP地址与HTML(和/或XML页面)相互关联的目 录结构。最后,通过程序的执行定期传递存储库中的 页面,并将这些页面从存储库中清除。表1总结了信 息存储格式及其适用的搜索机制。 表1 信息格式及其适用搜索机制 本或HTML文件形式存在的信息可以存储在文件服 务器上(通常是操作系统的一个组件);第二种方法是 对于文本、图像、音频、视频等非结构化信息选用第三 方文件管理工具,以帮助创建和管理这些页面,大多数 第三方文件管理系统使用现有的文件系统来存储应用 2.4信息检索基于信息链的跨部门政府信息共 享是实现各部门协同办公、提供“一站式”服务的基 程序,同时存储指向文件的链接或路径等信息以方便 检索文件;第三种方法是对于结构化信息利用目前的 商业数据库管理系统的对象一关系特性来存储和检索 文件 。 础,而对跨部门政府信息的检索是信息共享的具体体 现,也是解决政府信息稀缺性问题的有效措施,因此, 要应用技术手段对结构化信息和非结构化信息进行高 效的检索。 第11期 陈氢:基于信息链的跨部门政府信息共享架构研究 ・167・ 自由文本文档可以通过文本搜索引擎进行信息检 索,存储在关系数据库中的信息可以使用SQL进行检 索。XPath/XQuery和SQL的区别在于,XPath/ XQuery用于XML而SQL用于关系数据。但现在它 们之间的区别日渐模糊,因为很多关系数据库开始增 加XML支持,允许将XML数据存储到关系数据库当 中。XPath/XQuery不可能代替SQL在关系数据库中 查询结构化数据的作用。这两类查询语言将同时存 在,并用于不同的数据查询当中,XPath/XQuery用于 存储库方法相比,数据库模式方法需较少的执行工作。 综上所述,自由文本方法提供了最简单的数据定 义,而数据库模式方法提供了最简单的信息存储。 3.2信息访问的便捷性信息检索方法包括布尔 搜索方法、向量空间方法、概率论方法、聚类方法。所 有这些方法旨在发现与特定查询相关的文档。在评价 检索系统时,查全率和查准率是最常用的指标,响应时 间也被认为是一个有用的指标 。 3.2.1查全率。对于自由文本方法而言,查全率 WORD、PDF、EXCEL、图像、音频、视频等非结构化数 据查询和基于XML的应用程序,SQL继续用于结构 化的关系数据。对于XML文档库,XML搜索代理 (XML Search Agent for Information Retrieval,XSAR) 可以检索XML存储库中的信息。XSAR可以动态地 查询大型XML文档库。它独立于DTD,所以同样的 代理可以用来查询由多个DTD组成的文档。XSAR 还是一个动态代理,因为它不使用基础数据库或页面 信息目录。相反,它代表用户动态地查询XML库。 XML库网站不需要任何特殊的软件或硬件,只是假设 它包含了HTML和XML页面。 XSAR不要求用户知道相关的DTD,只要知道用 户需要搜索哪些字段。从本质上讲,XSAR用XQL重 新表达查询,然后启动采集软件遍历整个XML库,并 且对库中发现的每一个XML页面执行XQL查询。 3信息共享方法的比较 3.1信息定义和信息存储的便捷性 自由文本方 法可以识别和共享非结构化信息,但不能定义可以共 享的具体的结构化信息。由于大多数部门拥有大量文 档,信息定义通常是最简单的步骤,并对可共享的文档 进行识别,不需要对部门的实际数据元进行深入的研 究 。 在数据库模式方法中,每个政府部门的数据必须 先定义好,然后不同数据项可以被识别及共享。 XML存储库方法与上述过程类似,数据元需要先 定义,然后再创建一个DTD。因此,数据库模式方法 和XML存储库方法需要对部门使用的实际数据元进 行检查。 从存储的角度来看,自由文本方法要求页面被存 储在服务器的文件系统上,需要一个适当的协同机制, 使组织内部资料库文件的变化即时反映到共享资源库 中。数据库模式的方法,不需要另外存储数据,因为数 据可从每个组织内部的基础数据库中动态地获得。 XML存储库方法的存储类似于自由文本方法,通过协 同机制确保页面定期更新,并即时反映内部数据库的 结构化信息。因此,在存储方面,与自由文本和XML 是检索出的相关信息量与相关信息总量之比,这种比 例显然是依赖于用于执行匹配的算法,目前大多数算 法使用的是加权指数算法。一般而言,其比例将会小 于1。另外,由于网页的总数增加了,所以在其他条件 不变的情况下,查全率在下降。 对于数据库模式方法而言,查全率取决于基础数 据库查询语言(通常是SQL)的准确性,如果查询转换 准确,且对基础数据库的检索全面,那么查全率就是1。 对于XSAR这样的XML存储库代理,查全率依 赖于将用户查询翻译成基础XML查询语言的准确 性,以及从特定起始点通往XML存储库所有XML页 面的现存路径,对于一个构造良好的XML存储库,如 果从一个起始节点可以获得每一个页面,那么查全率 就是1。 综上所述,自由文本方法的查全率要比其他两种 方法低一些。 3.2.2查准率。对于自由文本方法,查准率取决 于以下几点:a.为了达到查询所需精确程度而提供给 用户的功能(如:连接字符串、通配符、布尔运算符); b.为了保证响应时间而牺牲的精确程度;C.搜索引擎 在基础数据库网页中捕捉信息的程度。 在其他条件不变的情况下,搜索引擎提供更多的 搜索选择,查准率将提高。在第三种情况下,搜索引擎 只捕获每个页面的标题,与同时捕获每一页的标题和 META标签相比,查准率低一些。由于网页的总数增 加了,所以在其他条件不变的情况下,查准率在下降。 当使用数据库模式方法时,使用基础数据库的信 息库的查准率取决于以下几点:a.用户查询界面提供 的功能;b.数据库基本查询语言所允许的最大精度,如 果使用关系数据库和基础查询语言SQL,那么能得到 很高的查准率。 如果是利用XSAR代理,查询界面会完全支持 XQL。因此,XSAR的查准率与XQL的查准率是相同 的。 3.2.3 响应时间。自由文本方法的响应时间取 决于:与数据库进行关键字匹配时所使用的算法;设计 者牺牲精度从而缩短响应时间的程度。 ・168・ 情报杂志 第32卷 当使用数据库模式法时,响应时间取决于特定查 询的复杂程度和数据库为了执行查询而进行优化的程 度。因此,对于一个关系数据库,有多个连接的非索引 属性范围查询比一个简单的SELECT查询显然需要更 多的时间。因此,需要数据库管理员跟踪最频繁的查 询,确保对访问优化进行适当的调整。 对于XML存储库搜索代理,其响应时间是由代 理遍历目标库所用的时间决定的。这依赖于外部因 素,如网络速度、目标库Web服务器的性能以及目标 库的规模。在设计XSAR时,针对外部因素,采用三个 内部策略,尽量减少响应时间:多线程代理、缓存代理 服务器、赋予用户指定响应时间阈值的权力。接下来, 我们将描述这些策略。 代理程序从目标库中获取新页面,并产生线程来 解析这些获取的页面。HTML页面只需解析链接,而 XML页面却要对查询进行解析和搜索。如果页面的 解析和/或搜索是小规模的,那么产生一个新的线程是 昂贵的,而随着存储库中每一个页面规模的增加,线程 的数量相应增加。 XSAR允许用户设置响应时间阈值和搜索目标库 的最大深度。这使得XSAR能够适应不同用户的需 求,例如,有的用户需要全面搜索大型存储库而长时间 的运行代理,而有的用户则为了得到更快的响应,而将 搜索的最大深度设置为一个有限数。 3.3 系统维护的便捷性在自由文本方法中,维护 主要包括文档库的维护、搜索引擎和协同软件的维护, 以维持组织内部页面与信息库页面的一致性。数据库 模式方法,需要跟踪基础数据库的变化。当基础数据 库发生变化时,用于直接查询数据库的应用程序代码 需要进行相应的变化 。XML文档库,附加了一个透 明层,因为每个组织承诺以XML页面形式提供的信 息应符合DTD的要求。每个组织可以隐藏其内部数 据库模式,而独立的对信息共享流程中的模式进行更 改,只要每个组织提供共享所需的页面就可以了。跨 部门信息共享(Inter—Agency Information Sharing, IAIS)系统的维护包括来自于各组织页面的更新和搜 索代理的维护(如XSAR)。 从上面的讨论,我们可以看到,一般来说,数据库 模式方法需要最多的维护,而自由文本和IAIS方法需 要较少的维护。这三种方法的比较结果如表2所示。 从表2中可以看出,与自由文本方法相比,XML 文档方法的优势在于:共享结构化信息的能力强;能够 以更高的查准率和查全率对资源库进行动态检索。与 数据库模式方法相比,IAIS的主要优势在于:a.IAIS 一般更容易维护,因为DTD提供了间接增强层,IAIS 不需要跨部门获取数据库模式;b.IAIS能够共享非结 构化和结构化信息,代价是查询XML文档库比其他 方法需要更长的响应时间。 表2三种方法的比较结果 信息定义善嚣 歪 纂基 暴 4结束语 跨部门政府信息共享是电子政务建设的关键内 容,也是目前理论界重要的研究领域之一,将潜在地提 高政府部门行政工作效率和业绩,促进更好的决策,实 现协同办公和“一站式”服务。然而跨部门政府信息 共享是一个复杂的过程,受到诸多影响因素的制约。 鉴于此,本文从信息链的视角对结构化和非结构化政 府信息进行了分析,认为电子政务信息链是指以政府 有关部门输入各种信息和公众需求为起点到政府有关 部门最终处理有关信息并创造出让公众满意的服务为 终点的连续的有机节点形成的链条,包括政府内部跨 部门的信息交流链和政府与外界的信息互动链两大部 分;其中,跨部门政府信息共享是电子政务信息链畅通 的关键;由信息定义、信息存储、信息检索三个组件构 成的跨部门政府信息共享架构能够促进信息链的畅 通;可以应用自由文本法、数据库模式法和XML存储 库法等信息共享方法实现基于信息链的跨部门政府信 息共享。 参考文献 [1]陈氢.电子政务信息流模型探讨[J].情报杂志,2006,25 (11):20—22 [2] Ram S,Park J.Semantic Conflict Resolution Ontology(SCR— OL):An Ontology for Detecting and Resolving Data and Sche’ ma—level Semantic Conflictsf J].IEEE Transactions on Knowl— edge and Data Engineering,2004,16(2),189—202 [3] 龚立群,高琳.跨部门政府信息资源共享影响因素的实证 研究[J].情报资料工作,2012(4):61-65 [4]Gil-Garcia J R,Chun S A,Janssen M.Government Information Sharing and Integration:Combining the Social and the Technical [J].Information Polity,2009,14(1):1—10 f 51 Batista L,Comock M.Information Sharing in E—government Iniitatives:Freedom of Information and Data Protection Issues Concerning Local Government[J].Journal of Information,Law &Technology,2009(2):1—17 f6]Scholl H J,KubicekH,CimanderR,eta1.ProcessIntegration, Information Sharing,and System Interoperation in Government: A Comparative Case Analysis[J].Government Information Quartedy,2012(29):313—323 (责编:刘影梅) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- sarr.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务