需求分析
在政府、企业、科研院所内部都广泛存在着各种形式的信息资源,如何对这些资源进行整合,有效保护和利用信息资源,并向用户提供一站式检索服务成为关键。
(1) 对互联网上有用的信息和数据进行定向采集,存储到本地,把庞大的“互联网资源”有效“整合”到本单位的信息资源库中。
(2) 大量有用的纸质历史数据,出于保护和利用的考虑,都需要实现数字化,进行标引和分类,实现有序的内容组织和高效的全文检索。
(3) 从关系数据库的业务系统中获取有用数据,由于关系数据库比较成熟,而且提供了强大的权限认证和结构化数据的处理能力,有必要与信息资源进行统一整合。
(4) 分布部署在操作系统下的文件、电子邮件、图片等非结构化数据,比如直接存放在指定目录下文件,这些数据文件具有不同的密级和权限。
(5) 还有大量专用数据库系统中的数据,如各种商用信息资源库和自建的一些特色资源库。
待解决问题
数据采集
要实现互联网上有用的信息资源、纸质文档、电子文档快速、有序的采集和组织。
数据统一存储
要实现资源整合,必须在技术上彻底解决数据统一存储,统一管理问题,保证数据的一致性,同时利用相关系统的健壮性,保证数据的安全性。
统一认证
解决不同系统的统一认证问题。
数据迁移
要实施数据的统一存储、统一管理和统一认证,需要把一些不同类型的数据迁移到指定的数据库管理系统中。
(1) 能够自动的迁移数据,实现无人值守。
(2) 不能对现有的核心任务系统产生结构性的改变,也就是尽可能不影响现有的业务系统。
统一发布
系统不同,发布风格和使用方式各异,为了解决这一问题,必须进行资源或信息的统一发布。
统一检索
屏蔽所有的检索细节,把不同的检索统一成一种检索,使业务人员能够高效地利用统一检索界面,迅速获取自己需要的数据,专注自己的业务。
解决方案
清华同方知网(北京)技术有限公司自主研发的TPI系列软件是基于非结构化文档管理而开发的大型智能内容管理系统。该系统以全文检索数据库为核心,采用流行的B/S浏览器的检索方式,先进的C/S架构,能够同时管理文字、图片、多媒体、电子档案等信息,并提供全文检索服务,支持网页的动态发布,支持分级权限认证。
系统功能简介
方案主要包括以下5方面建设内容:数据采集模块、数据迁移模块、资源管理模块、资源发布模块、信息检索模块。各个模块协调工作,来实现软件系统的所有功能。其中资源管理模块包括全文检索管理系统和内容管理系统。
应用系统的功能模块图如图2-1所示。

更多内容请看PCdog.com--数字化校园网解决方案专题
