|  网站首页  |  导 言  |  网站简介  |  网站纪事  |  公 告 栏  |  联系我们

您的位置:网站首页 >> 城建档案工作资讯 >> 港航工程项目档案知识智能服务

港航工程项目档案知识智能服务
【发表时间:2017/5/18 21:40:03】 【字号: 】 【颜色: 绿 】 【背景: 绿 】 【浏览次数:

本文来源:中国档案资讯网 发布日期:2017-05-05  

港航工程项目档案知识智能服务

中国档案 杨晶晶

  港口航道勘察设计工程项目随海外项目、合资业务、水文测量、工程总包、监理检测、设计咨询等业务的拓展,其单位全宗内产生的电子文件逐渐向多层次、多样化以及多类型发展,与此同时,用户对于蕴含在电子文件内容中的知识需求日益增长。本文主要根据港航勘察设计工程项目归档电子文件的内容结构及其描述特点,构建基于文献主体内容的勘察设计项目档案知识仓库和知识网络,实现档案知识的主动服务及智能服务,发掘档案知识的潜在价值。

  港航工程项目建港条件复杂、建设形式各异,码头按照货种划分有集装箱、散货、液体化工、矿石、原油、滚装、邮轮等类型,在具体工程的勘察测量、设计施工及竣工中又需要水工结构设计、勘察、平面、装卸工艺、土建结构、通信控制、道路堆场各专业的协同工作,生成了结构体系化、内容多元化的项目档案数据资源,并且在项目建设阶段主要产生了申请报告、初步设计报告、方案、工程可行性研究报告、规格书、论证报告、规划书、设计图纸和竣工文件等。同时,档案管理系统存储服务器上储存了大规模相应的亟待梳理的结构化数据和非结构化数据。在基础档案管理系统数字化管理基本实现的前提下,知识需求增长对档案数据开发利用提出两个问题:第一是“如何将每份电子文件内容中的数值、图表、图纸、事实、概念甚至一个创新点作为知识单元”,第二是“通过何种手段将知识的控制单位从文件深入到文件所含的数字、公式、原理、事实、结论等最小的独立的知识单元”。以这两个问题为出发点,建设港航工程项目档案知识数据库、实施档案知识标引链接、构建规范的档案知识网络,从而提供独立于原始文献的档案智能服务,就成为拓展港航建设项目档案服务形式、践行档案智能服务理念的落脚点。

  基于内容的数值型档案知识整合

  数值型知识是指描述某个事件或者某客观事实的有关数据值方面属性的知识单元,在港航建设行业可能涉及的数值型知识主要有时间、规模、指标、数量、长度、高程、重量、温度、速度及百分比等。基于档案内容的数值型知识开发体现为一标引、二关联和三建库。一标引指对工程项目建设过程中涉及数据属性的关键词进行标引。以某个原油码头为例,涉及的数据关键词主要有码头30万吨级、长度502米、年通过能力1800万吨、88米跨人行钢桥。二关联指通过对数值语句群体的抽取、筛选过滤及排重等实现数值型知识的挖掘及知识的关联建设,构建数据、工程项目、设计参与人之间的关系体系。三建库指将经过标引的档案知识及其关联关系存储在数据库中,形成档案知识仓库。

  首先,统一数据源是以港航工程项目档案管理系统服务器中存储的全部文件的数据内容作为数据源基础,其中包括工程建设过程中从工程可行性研究、初步设计到施工竣工形成的电子文件及图纸档案。其次,统一检索系统是指在建立基于全文内容的电子文件检索系统的基础上,制定档案数值型知识的自动抽取决策,提高主体抽取规则的置信度。具体实施方式为键入查询条件,通过查询标引过的档案知识实现匹配结果的规律性返回。最后,由点到面的档案知识推送指的是将检索结果(工程项目、港址港区、设计人员等数据要素)向与其相关的档案知识发散,实现由点到面的档案数据推送。

  设计图纸中的档案知识整合

  图纸档案知识的特点为核心度高、价值度高以及隐性程度高,同时这也体现出图纸档案知识整合开发的必要性。第一,图纸档案知识的核心度高可以解释为港航项目档案的主要组成部分为档案管理系统中存储的设计图纸,并且图纸的电子文件是港航项目档案中利用率最高的档案,其主体性和高利用性代表了其在港航项目档案中的核心地位。第二,图纸档案知识的价值度高可以理解为项目的图纸档案不仅是港航企业永久保存的档案资源,而且是价值最大的档案资源,对其重视程度代表了图纸档案知识整体的高度价值属性。第三,图纸档案知识的隐性程度高,其主要原因在于图纸档案知识体系的松散性,其高度的隐性化也正与其高价值紧密依存。图纸档案知识作为港航企业最为核心、价值度最高的档案资源,如何对其中包含的隐性知识实施描述,实现知识的显性化处理分析并建立档案数据关联是使这些核心档案发挥最大价值的重中之重。

  图纸档案知识的整合主要包括基于要素的检索、精细化图纸档案知识服务以及图纸档案知识库的建立。首先,基于要素的检索是通过从文件中自动抽取的图纸以及其对应的题名、属性、来源、内容、相关图纸和设计人员等要素实现基于图纸内容的检索。其次,通过推送性和属性类别的递次性实现图纸档案知识的精细化服务。推送性显示了档案数据由被动服务向主动服务的转变,显示了档案知识从静止到主动向用户推送的转换。属性类别的递次性是指通过对档案知识类别的细化分类及属性划分,将不同属性类别的档案知识赋予其特有标签,例如通过码头结构、图纸类型、建筑结构、海岸地貌、基础形式、所在港区等属性区分图纸类项。图纸档案知识在新的属性设置下能够为用户提供更为精细化、准确化和定制化的档案数据,在知识智能查询前提下,用户可以通过集装箱码头、重力式结构、辐射状沙洲等标签获取更加专业、准确的港航知识。

  勘察设计图表中的档案知识整合

  港航建设勘察设计工作中会生成大量的图表类档案文件。例如,一份勘察报告(科技档案)所涉及的表格主要包括:工作量统计表、物理力学性质指标、钻孔数据一览表、地基承载力特征值、土工试验成果表、地基土液化判别成果表、地下水稳定水位、十字板剪切试验成果、各主要土层不同压力段下沉降计算参数、各土层超固结比OCR值统计成果表、地基土评价一览表、抗剪强度统计表等。

  蕴含在电子档案中的图表知识,具有独立于整体文献的特殊价值。档案管理者通过对图表档案知识所含的名称、地区、时间、内容、来源及人员等数据信息的提取标引,运用属性划分的方法对表格文档分门别类并进行相关信息提取,同时利用数据技术实现档案信息整合发布。体现在利用层面即用户可以按照档案内图表表名中的某个关键词或档案内图表所含的内容检索查询有关电子图表。

  港航工程项目档案概念检索

  项目档案概念检索主要包括描述提取、导航链接和知识创新。第一步描述提取是指档案管理者按照知识类别从港航工程项目档案知识内容中依次提取出知识对象,进行描述、存储及知识链接后,将若干篇档案文献中获得的知识单元导入仓库。第二步在相关的档案知识概念与内容、内容与内容、结构与内容之间进行导航链接,将档案中挖掘的知识概念通过点与点的关系导航构建档案知识概念网络式布局。第三步对档案知识概念网络分析研究后,档案知识的组织结构由等级式转向网络式,新知识产生、知识创新得以实现。档案知识概念拓展后产生的新知识主要有档案知识单元的内外因、原理、结构组成、概念揭示、实践方法、主要应用、对比等。例如,对港航建设项目档案中“码头结构”这一概念进行知识归纳整合,档案管理者对不同结构码头的条件、适用、方法、原因、特点、属性等进行知识组织及知识整合,依次将基于多级链接知识的组织结构由等级结构转向网络结构,建立一个知识丰富的可理解的档案概念知识库。档案概念知识库可以反映其所在档案数据知识概念及两两之间的关联关系,从而使独立于原始文献的档案知识发现及知识创新得以实现,基于复合概念关联度的检索结果计算得以实现。

  档案管理者进行港航工程项目档案数据整合分析、建设档案知识元系统,其效益性主要体现为三个“高效”。第一个“高效”是指“查询高效”,结合检索技术实施档案知识整合能够不断完善档案知识库的同义描述元素集合、分类树以及关系表的增量化管理,能够及时研究检索结果处理方式,从而保证用户检索请求的知识查全率和查准率。第二个“高效”是指“集中高效”,档案知识推送服务的宗旨就是对分散的档案知识数据进行集中分析挖掘,准确、快速地形成关联规则约束下的各类整合后的信息和知识,系统具有良好的可扩展性。第三个“高效”是指“智能高效”,港航工程项目档案知识的智能化服务手段可以带来用户满意度优化、生产优化、经营优化和决策优化。

  作者单位:中交第一航务工程勘察设计院有限公司

打印本文  加入收藏  新浪收藏  返回顶部  关闭窗口
Copyright © 2005-2011 CAS All Rights Reserved. 中国档案学会 版权所有
http://www.wdjj.cn 中文域名:档案教育网.cn
地址:中国北京市宣武区永安路106号 邮编:100050
电话:010-88445962 传真:010-88471260 E-mail:wdjj126@126.com
京ICP备05053486号