本站小編為你精心準(zhǔn)備了信息挖掘應(yīng)用參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫(xiě)作靈感。歡迎深入閱讀并收藏。

2研究的主要方向
目前國(guó)內(nèi)外信息挖掘的研究主要是以知識(shí)發(fā)現(xiàn)的任務(wù)描述、知識(shí)評(píng)價(jià)與知識(shí)呈現(xiàn)為主線,以基于各種理論的有效知識(shí)發(fā)現(xiàn)算法研究為中心,以及更加廣泛的應(yīng)用研究為主要特點(diǎn)。
結(jié)構(gòu)化數(shù)據(jù)挖掘技術(shù)的研究較為成熟,主要集中在算法的適應(yīng)性、擴(kuò)展性和魯棒性的研究上。圍繞統(tǒng)計(jì)學(xué)方法的數(shù)據(jù)挖掘算法的研究一直受到關(guān)注,用于在具有先驗(yàn)知識(shí)的情況下的不確定知識(shí)發(fā)現(xiàn)。關(guān)聯(lián)規(guī)則知識(shí)發(fā)現(xiàn)算法是眾多的應(yīng)用研究的基礎(chǔ),研究工作集中在算法的改造以及可擴(kuò)展性和普適性的研究上。序貫?zāi)J绞荝.Agrawal提出的重要的數(shù)據(jù)挖掘方法。包括單一的概念層次,多概念層次的序貫?zāi)J降难芯俊T诓煌母拍顚哟伟l(fā)現(xiàn)序貫?zāi)J绞鞘钟袃r(jià)值的。
神經(jīng)網(wǎng)絡(luò)是目前常用的數(shù)據(jù)挖掘技術(shù),廣泛應(yīng)用于分類、聚類、預(yù)測(cè)建模和混沌模式的知識(shí)發(fā)現(xiàn)。基于概念格理論的知識(shí)發(fā)現(xiàn)的理論研究和應(yīng)用近年來(lái)受到重視。復(fù)雜類型數(shù)據(jù)的知識(shí)發(fā)現(xiàn)是目前國(guó)內(nèi)外知識(shí)發(fā)現(xiàn)領(lǐng)域的研究熱點(diǎn)。空間數(shù)據(jù)是指同占有一定空間的對(duì)象的相關(guān)聯(lián)的數(shù)據(jù)。空間數(shù)據(jù)挖掘方法主要包括空間分類和空間趨勢(shì)分析。
文本挖掘用于基于文本信息的知識(shí)發(fā)現(xiàn)。文本挖掘是利用智能算法,并結(jié)合文字處理技術(shù),分析大量的非結(jié)構(gòu)化文本源,抽取或標(biāo)記關(guān)鍵字概念,文字間的關(guān)系,獲取有用的知識(shí)和信息。其關(guān)鍵在于文本內(nèi)容的量化表征。多媒體數(shù)據(jù)的知識(shí)發(fā)現(xiàn)的研究主要是特征的抽取。在音頻數(shù)據(jù)挖掘中Fourie變換等用于抽取不變性特征。相應(yīng)的知識(shí)發(fā)現(xiàn)方法包括學(xué)習(xí)矢量量化和多層感知器等神經(jīng)網(wǎng)絡(luò)方法。
信息挖掘的理論研究表現(xiàn)出多學(xué)科的交叉和多種技術(shù)方法的融合及信息挖掘的泛化和統(tǒng)一的特征。知識(shí)發(fā)現(xiàn)技術(shù)逐漸滲透到復(fù)雜非線性系統(tǒng),如社會(huì)科學(xué)、生物信息科學(xué)、商業(yè)與金融領(lǐng)域、地震和氣象學(xué)等領(lǐng)域的信息處理之中。復(fù)雜性系統(tǒng)的信息過(guò)程表現(xiàn)出顯著的非線性動(dòng)力學(xué)特征。
3信息挖掘是商業(yè)信息處理技術(shù)的關(guān)鍵
商業(yè)領(lǐng)域中的海量歷史數(shù)據(jù)與實(shí)時(shí)數(shù)據(jù)和廣泛的應(yīng)用需求為信息挖掘的應(yīng)用和發(fā)展提供了一個(gè)廣闊的空間。信息挖掘與已有信息系統(tǒng)和人工智能技術(shù)相結(jié)合,為商業(yè)與金融數(shù)據(jù)的分析處理提供了重要的工具和理論方法。這些理論和工具已經(jīng)被用于解決金融與商業(yè)領(lǐng)域的以下各類問(wèn)題:信用等級(jí)的評(píng)估;金融和經(jīng)濟(jì)預(yù)測(cè);證券價(jià)格變動(dòng)的預(yù)測(cè);破產(chǎn)和銀行倒閉預(yù)測(cè);惡性透支和商業(yè)欺詐甄別;證券的投資選擇和分類;商業(yè)行為分析以及銷售與客戶關(guān)系分析等。
在金融與商業(yè)領(lǐng)域中,信息挖掘技術(shù)的應(yīng)用表現(xiàn)為范圍上的延拓和層次上的深化以及多種技術(shù)方法的整合。利用文本挖掘,可以從Internet上的成千上萬(wàn)的與金融相關(guān)的Web網(wǎng)頁(yè)中獲取全球金融市場(chǎng)的實(shí)時(shí)數(shù)據(jù)、與金融市場(chǎng)相關(guān)的市場(chǎng)、宏觀經(jīng)濟(jì)環(huán)境、政策和法規(guī)等消息、進(jìn)行金融分析報(bào)告等。利用數(shù)據(jù)挖掘技術(shù)對(duì)分布于全球的市場(chǎng)消息和信息的處理來(lái)預(yù)測(cè)全球市場(chǎng)的主要股票指數(shù),并對(duì)全球主要外匯交易市場(chǎng)貨幣交易率的未來(lái)走勢(shì)進(jìn)行預(yù)測(cè)和決策分析。
從細(xì)微和難懂的數(shù)據(jù)中識(shí)別、發(fā)現(xiàn)和抽取各類知識(shí)和規(guī)律。這樣的商業(yè)分析每天都在發(fā)生:營(yíng)銷管理人員需要為某種產(chǎn)品進(jìn)行目標(biāo)市場(chǎng)分析;同時(shí)他們要求知道購(gòu)買競(jìng)爭(zhēng)對(duì)手產(chǎn)品的客戶規(guī)模、潛在客戶對(duì)優(yōu)惠券的相對(duì)接受能力、競(jìng)爭(zhēng)對(duì)手的產(chǎn)品在零售商店中陳設(shè)的位置、下一個(gè)商業(yè)周期中對(duì)自己的及競(jìng)爭(zhēng)對(duì)手的產(chǎn)品需求預(yù)測(cè),等等。基于信息挖掘的商業(yè)與金融信息處理技術(shù)的價(jià)值在于能夠?yàn)槭褂谜咛峁臄?shù)據(jù)集合中發(fā)現(xiàn)新關(guān)系的能力。極大地加強(qiáng)戰(zhàn)術(shù)和戰(zhàn)略決策以及決策過(guò)程的精確性。
信息挖掘這一概念起源于知識(shí)發(fā)現(xiàn)(KDD)領(lǐng)域,廣泛地應(yīng)用到科學(xué)研究、金融、保險(xiǎn)、醫(yī)療保健、司法和制造等各個(gè)行業(yè)。各個(gè)學(xué)科領(lǐng)域都從不同的角度利用相應(yīng)的理論和分析方法進(jìn)行著信息挖掘的研究工作,涉及到機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析、數(shù)據(jù)庫(kù)技術(shù)、模式識(shí)別、人工智能、神經(jīng)網(wǎng)絡(luò)、可視化方法、不確定性推理、人工生命、模糊邏輯和粗糙集理論等領(lǐng)域。
信息挖掘的應(yīng)用對(duì)象從結(jié)構(gòu)化數(shù)據(jù)發(fā)展到半結(jié)構(gòu)化及非結(jié)構(gòu)化的復(fù)雜數(shù)據(jù)類型,包括關(guān)系數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)、空間數(shù)據(jù)庫(kù)、推理數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)、時(shí)態(tài)數(shù)據(jù)庫(kù)、文本數(shù)據(jù)、Web日志文件、圖形圖像數(shù)據(jù)及音頻和視頻數(shù)據(jù)等。信息挖掘所涉及到的知識(shí)類型,根據(jù)應(yīng)用特點(diǎn)可分為預(yù)測(cè)型、描述型、發(fā)現(xiàn)型、驗(yàn)證型等類型知識(shí),根據(jù)知識(shí)的性質(zhì)特點(diǎn)可分為關(guān)聯(lián)規(guī)則、分類規(guī)則、聚類規(guī)則、時(shí)序模式、相似模式、混沌模式、回歸模式、趨勢(shì)分析、偏差分析、模式分析等。