本站小編為你精心準(zhǔn)備了企業(yè)信息化異構(gòu)數(shù)據(jù)資源整合參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

1企業(yè)信息化發(fā)展概況
企業(yè)信息化作為中國信息化的一個(gè)重要組成部分進(jìn)程得到了充分的發(fā)展,企業(yè)在基礎(chǔ)設(shè)施、體系結(jié)構(gòu)、標(biāo)準(zhǔn)化、信息共享以及安全加密等方面做了大量的工作,使信息化工程管理、網(wǎng)絡(luò)建設(shè)、信息共享、支撐技術(shù)、信息安全等方面的技術(shù)要求、標(biāo)準(zhǔn)和管理基本完善基礎(chǔ)設(shè)施基本完成,網(wǎng)站數(shù)量飛速增加,企業(yè)正在由基礎(chǔ)建設(shè)轉(zhuǎn)到應(yīng)用建設(shè)的進(jìn)程中。但在企業(yè)信息化發(fā)展過程中也有很多問題亟待解決:
1)開放的、統(tǒng)一的應(yīng)用平臺(tái)建設(shè)有待于進(jìn)一步改善企業(yè)信息化的發(fā)展缺乏宏觀統(tǒng)一規(guī)劃,沒有明確提出信息化的發(fā)展目標(biāo)和發(fā)展規(guī)劃。"條塊分割"的管理體制與企業(yè)信息化的統(tǒng)一性、開放性、交互性和規(guī)模經(jīng)濟(jì)等自然特性產(chǎn)生了沖突。
2)標(biāo)準(zhǔn)化工作應(yīng)進(jìn)一步加強(qiáng)標(biāo)準(zhǔn)體系是企業(yè)信息化標(biāo)準(zhǔn)化工作的核心,也是企業(yè)信息化總體設(shè)計(jì)的重要內(nèi)容,它將各個(gè)業(yè)務(wù)環(huán)節(jié)有機(jī)地連接起來,并為彼此間的協(xié)同工作提供技術(shù)準(zhǔn)則。在整個(gè)企業(yè)信息化建設(shè)的各個(gè)層面上,大量的標(biāo)準(zhǔn)已經(jīng)存在,需要國家進(jìn)一步地明確和貫徹實(shí)施。
3)避免重復(fù)建設(shè),實(shí)現(xiàn)數(shù)據(jù)資源的有效共享由于企業(yè)信息化建設(shè)的模式、理念以及優(yōu)先級(jí)不明確造成當(dāng)前在整個(gè)企業(yè)信息化環(huán)境中重復(fù)建設(shè)大量存在,數(shù)據(jù)資源相對獨(dú)立。
4)完善立法工作2002年國家標(biāo)準(zhǔn)化管理委員會(huì)和國務(wù)院信息化工作辦公室聯(lián)合了《電子政務(wù)標(biāo)準(zhǔn)化指南》和2005年國家頒布的《電子簽名法》為電子政務(wù)和電子商務(wù)建設(shè)的相關(guān)方面提供了相關(guān)的規(guī)則和法規(guī),但應(yīng)該進(jìn)一步對網(wǎng)絡(luò)環(huán)境中的相關(guān)問題如版權(quán)、證據(jù)保存、可信管理以及業(yè)務(wù)規(guī)范作更明確細(xì)致的要求。
2、數(shù)據(jù)資源的整合是實(shí)現(xiàn)開放企業(yè)信息化的核心
我國信息化建設(shè)的重心正發(fā)生著本質(zhì)的變化,從建設(shè)初期的網(wǎng)絡(luò)建設(shè)、信息開始轉(zhuǎn)向了以整合內(nèi)外部資源為主體、以提高監(jiān)管能力和服務(wù)水平為目標(biāo)的應(yīng)用階段。長期以來企業(yè)信息部門的大量建設(shè)資金投入到硬件設(shè)備上,缺乏信息錄入、更新、深加工的技術(shù),更缺乏把這種信息資源進(jìn)行加工后產(chǎn)生增值的手段,使得作為信息資源擁有者的企業(yè)部門有著大量的“信息孤島”。
企業(yè)信息化建設(shè)必須以"信息資源管理為支撐",擺脫只注重局部應(yīng)用或以網(wǎng)絡(luò)為核心的觀念,將各個(gè)企業(yè)部門信息資源進(jìn)行后臺(tái)集中和統(tǒng)一管理:首先是通過統(tǒng)一的接口與標(biāo)準(zhǔn),將數(shù)據(jù)統(tǒng)一集中;其次是管理這些統(tǒng)一的數(shù)據(jù);最后,就是使這些數(shù)據(jù)能夠共享,實(shí)現(xiàn)信息資源的有效利用。
數(shù)據(jù)整合可以將原來孤立于多個(gè)異構(gòu)數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)信息整合起來,為企業(yè)信息化應(yīng)用提供一個(gè)完整統(tǒng)一的數(shù)據(jù)視圖,而要實(shí)現(xiàn)此目標(biāo)關(guān)鍵就是數(shù)據(jù)資源的整合,核心是互連互通和數(shù)據(jù)共享。通過將原來孤立于多個(gè)異構(gòu)數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)信息整合起來,為企業(yè)信息化提供一個(gè)完整統(tǒng)一的數(shù)據(jù)視圖,從而實(shí)現(xiàn)數(shù)據(jù)資源的透明訪問和數(shù)據(jù)資源的充分利用。現(xiàn)有的數(shù)據(jù)整合方法主要有以下四種:
1)定制轉(zhuǎn)換工具采用“一對一”的方式,很多的數(shù)據(jù)庫系統(tǒng)生產(chǎn)商都有自己的相關(guān)產(chǎn)品,使數(shù)據(jù)在不同的數(shù)據(jù)源之間定制專用的遷移轉(zhuǎn)換,實(shí)現(xiàn)數(shù)據(jù)的遷移和共享。例如MicrosoftHostIntegrationServer2000可以實(shí)現(xiàn)SQLServer2000和DB2之間的集成和整合,SQLServer2000中通過DTS實(shí)現(xiàn)向ACCESS和ORACLE及其他數(shù)據(jù)庫系統(tǒng)之間的遷移。
此種方式實(shí)現(xiàn)相對簡單,但存在多種不足:首先需要正確理解不同數(shù)據(jù)庫系統(tǒng)的元數(shù)據(jù)和結(jié)構(gòu)以及數(shù)據(jù)的流動(dòng)方式;其次此方法只能實(shí)現(xiàn)相對應(yīng)的數(shù)據(jù)庫系統(tǒng)之間的整合,擴(kuò)充性差,對于存在多種不同的數(shù)據(jù)庫系統(tǒng)的電子政務(wù)環(huán)境中,需要多種定制工具,實(shí)現(xiàn)方式相對麻煩;第三由于數(shù)據(jù)在不同的數(shù)據(jù)庫系統(tǒng)中存在多種副本,冗余量過大,而如果在訪問時(shí)即時(shí)遷移的話又影響到系統(tǒng)的相應(yīng)時(shí)間;第四數(shù)據(jù)在遷移過程中會(huì)產(chǎn)生大量的網(wǎng)絡(luò)流量,所以數(shù)據(jù)整合的時(shí)間會(huì)受到限制,該方法應(yīng)用較少。
2)集中復(fù)制數(shù)據(jù)采用“多對一”的方式,實(shí)際上是數(shù)據(jù)倉庫在企業(yè)信息化環(huán)境中的應(yīng)用。通過將同一領(lǐng)域的不同系統(tǒng)的數(shù)據(jù)庫的所有相關(guān)的數(shù)據(jù)通過分析、轉(zhuǎn)換和裝載中的數(shù)據(jù)移入數(shù)據(jù)倉庫中,實(shí)現(xiàn)對異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行集中式存儲(chǔ)和統(tǒng)一管理。此方式的優(yōu)點(diǎn)是系統(tǒng)在原有的系統(tǒng)架構(gòu)的基礎(chǔ)上采用不同的商業(yè)規(guī)則獨(dú)立運(yùn)作,數(shù)據(jù)集成的質(zhì)量高,在用復(fù)雜的查詢語言訪問低級(jí)別的詳細(xì)信息的時(shí)候是一個(gè)較好的方法,并且對于實(shí)現(xiàn)數(shù)據(jù)挖掘和決策支持是必然選擇。但基于數(shù)據(jù)倉庫的方法也存在一些不足:首先數(shù)據(jù)倉庫要想實(shí)現(xiàn)議購數(shù)據(jù)源之間的集中管理和存儲(chǔ)需要大量的時(shí)間和網(wǎng)絡(luò)流量;其次數(shù)據(jù)倉庫是面向主題的、歷史的數(shù)據(jù),往往是只讀的,而對于企業(yè)信息化環(huán)境中存在大量的數(shù)據(jù)需要進(jìn)行修改和刪除操作時(shí),只能定期更新而無法實(shí)現(xiàn)實(shí)時(shí)變化;第三當(dāng)異構(gòu)的數(shù)據(jù)源的數(shù)據(jù)模式發(fā)生變化或新的數(shù)據(jù)源加入時(shí),就必須生成一次全局的模式,使得維護(hù)全局模式變得更為困難,從而影響了系統(tǒng)的可擴(kuò)展性。
對于數(shù)據(jù)量較小的單位而言,可以綜合以上兩種方案的優(yōu)點(diǎn),采用聯(lián)邦數(shù)據(jù)庫理論的方法(比數(shù)據(jù)倉庫更小而且更關(guān)注與構(gòu)建復(fù)雜業(yè)務(wù)規(guī)則來支持功能強(qiáng)大的數(shù)據(jù)分析功能,并且對不同數(shù)據(jù)源的寫操作更為方便)。此方案中關(guān)鍵模塊為聯(lián)邦服務(wù)器,聯(lián)邦服務(wù)器通過軟件模塊與不同的數(shù)據(jù)源之間進(jìn)行通信,而客戶端通過多種應(yīng)用程序(包括ODBC、JDBC或WEB服務(wù)客戶機(jī))與聯(lián)邦服務(wù)器交互。但由于聯(lián)邦數(shù)據(jù)庫的復(fù)雜的實(shí)現(xiàn)技術(shù)和高昂的費(fèi)用代價(jià)嚴(yán)重的影響到在企業(yè)信息化環(huán)境中的應(yīng)用。
3)基于XML的WEBServices的數(shù)據(jù)整合要想實(shí)現(xiàn)異構(gòu)數(shù)據(jù)源整合,必須使異構(gòu)數(shù)據(jù)源為應(yīng)用程提供統(tǒng)一的全局模式的數(shù)據(jù)視圖,使數(shù)據(jù)層的數(shù)據(jù)用一個(gè)公共的數(shù)據(jù)模型表現(xiàn)為統(tǒng)一的數(shù)據(jù)格式,并能夠在公共數(shù)據(jù)模型上定義基本運(yùn)算和實(shí)現(xiàn)查詢和存取等操作。XML由于語義性強(qiáng)、交互性好、自描述、跨平臺(tái)和良好的可擴(kuò)展性等特性使其成為交換平臺(tái)模型的首選標(biāo)準(zhǔn)。作為SOA架構(gòu)的典型代表,WEBServices是一種基于XML的獨(dú)立軟件成分或服務(wù)程序,具有標(biāo)準(zhǔn)的程序接口和協(xié)議,可以實(shí)現(xiàn)不同硬件平臺(tái)之上的異構(gòu)數(shù)據(jù)庫系統(tǒng)之間的數(shù)據(jù)共享。負(fù)責(zé)數(shù)據(jù)集成的WEBService位于異構(gòu)數(shù)據(jù)源(數(shù)據(jù)層)和應(yīng)用程序(應(yīng)用層)之間,向下協(xié)調(diào)各種數(shù)據(jù)庫系統(tǒng),向上為訪問集成數(shù)據(jù)的應(yīng)用系統(tǒng)提供統(tǒng)一的全局?jǐn)?shù)據(jù)模式。
對于數(shù)據(jù)向XML的轉(zhuǎn)換主要基于模板的XML查詢、基于擴(kuò)展SQL的XML查詢和基于虛擬的XML文檔的查詢。整合的過程(如圖1所示)為:將業(yè)務(wù)數(shù)據(jù)從數(shù)據(jù)源中讀取并轉(zhuǎn)換為符合XML規(guī)范要求的格式;以WEBService方式將XML格式的數(shù)據(jù)提交至中間層(此過程可以采用WSsecurity或SSL、TSL來實(shí)現(xiàn)安全傳輸),由中間層仍然采用WEBService送達(dá)應(yīng)用層。此方案由于支持XML、SOAP和UDDI等標(biāo)準(zhǔn)或協(xié)議,使得整合平臺(tái)可以以中間件的形式在不同的硬件平臺(tái)、操作系統(tǒng)平臺(tái)和開發(fā)平臺(tái)之上實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫平臺(tái)的整合,并能夠通過將WEBService在注冊中心的實(shí)現(xiàn)代碼的重用。但數(shù)據(jù)冗余和無法充分利用現(xiàn)有的信息資源是無法克服的缺點(diǎn)。
圖1基于XML的數(shù)據(jù)集成的流程
4)基于元數(shù)據(jù)的數(shù)據(jù)整合數(shù)據(jù)元是通過定義、標(biāo)識(shí)、表示以及允許值等一系列屬性描述的在特定的語義環(huán)境中被認(rèn)為是不可再分的最小的數(shù)據(jù)單元。數(shù)據(jù)元一般來說由對象類、特性和表示3部份組成。它們的關(guān)系如圖2所示。數(shù)據(jù)元表示規(guī)范是通過描述數(shù)據(jù)元的一系列屬性來實(shí)現(xiàn)的。這些屬性實(shí)際上是數(shù)據(jù)元的元數(shù)據(jù)。針對數(shù)據(jù)元的查詢、維護(hù)及基于數(shù)據(jù)元的信息抽取的需要設(shè)計(jì)了以下幾個(gè)方面的基本屬性:標(biāo)識(shí)類屬性、表示類屬性、關(guān)系類屬性、管理類屬性和附加類屬性。
數(shù)據(jù)元元數(shù)據(jù)信息可以采用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫進(jìn)行存儲(chǔ)和組織,也可以采用XML文檔的方式。XML文檔的所具有的樹形結(jié)構(gòu)使其可以方便的描述數(shù)據(jù)元的組織結(jié)構(gòu)。目前電子交換的XML文檔標(biāo)準(zhǔn)通常使用XMLSchema進(jìn)行描述。數(shù)據(jù)元是一個(gè)完備的元數(shù)據(jù)集合,基于數(shù)據(jù)元庫和利用XMLSchema類型定義機(jī)制構(gòu)建的擴(kuò)展類型庫,可以定義出數(shù)據(jù)元元數(shù)據(jù)屬性到XMLSchema文檔元素之間的映射規(guī)則:數(shù)據(jù)元對應(yīng)XMLSchema中的XML元素。數(shù)據(jù)元包括了元數(shù)據(jù)模型的各類結(jié)構(gòu)信息的細(xì)節(jié),包括繼承信息和組成信息;數(shù)據(jù)元中構(gòu)成繼承關(guān)系的數(shù)據(jù)元對應(yīng)該數(shù)據(jù)元所對應(yīng)元素類型的基類型;與數(shù)據(jù)元構(gòu)成組成關(guān)系的數(shù)據(jù)元,對應(yīng)數(shù)據(jù)元所對應(yīng)元素的子元素;數(shù)據(jù)元所包含的數(shù)據(jù)類型(DataType)信息對應(yīng)數(shù)據(jù)元所對應(yīng)元素的類型。基于XML的交換技術(shù)非常容易進(jìn)行擴(kuò)展,對于分布式數(shù)據(jù)庫環(huán)境或數(shù)據(jù)倉庫中可以通過建構(gòu)基于XML的公共數(shù)據(jù)元庫,即可實(shí)現(xiàn)元數(shù)據(jù)的訪問、存取和集成,為電子政務(wù)的原數(shù)據(jù)提供統(tǒng)一的平臺(tái),從而實(shí)現(xiàn)電子政務(wù)環(huán)境中的異構(gòu)數(shù)據(jù)庫的有效整合。但由于使元數(shù)據(jù)用XMLSchema進(jìn)行描述,而XMLSchema的簡潔性有待于進(jìn)一步的改善,并且為了實(shí)現(xiàn)方便的定義元數(shù)據(jù),XMLSchema輔助生成技術(shù)的研究也將是一個(gè)挑戰(zhàn)。
3、結(jié)束語
企業(yè)信息化環(huán)境中數(shù)據(jù)是實(shí)現(xiàn)服務(wù)的核心,而異構(gòu)數(shù)據(jù)的整合是基礎(chǔ),隨著XML標(biāo)準(zhǔn)的完善和技術(shù)的更新,使其具有更強(qiáng)大的擴(kuò)展性和適應(yīng)性,基于XML的元數(shù)據(jù)將是企業(yè)信息化數(shù)據(jù)交換的主流技術(shù)。