日韩视频专区_久久精品国产成人av_青青免费在线视频_欧美精品一级片_日韩在线观看中文字幕_九九热在线精品

美章網(wǎng) 資料文庫 文本挖掘的案例推理系統(tǒng)研究范文

文本挖掘的案例推理系統(tǒng)研究范文

本站小編為你精心準(zhǔn)備了文本挖掘的案例推理系統(tǒng)研究參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

文本挖掘的案例推理系統(tǒng)研究

《情報(bào)科學(xué)雜志》2015年第十一期

1引言

基于案例推理(Case-basedReasoning,CBR)是近年來人工智能領(lǐng)域一項(xiàng)重要的問題求解與學(xué)習(xí)相結(jié)合的推理技術(shù),它是基于過去的實(shí)際經(jīng)驗(yàn)或經(jīng)歷而對(duì)當(dāng)前問題進(jìn)行處理的一種方法。1987年以來,國(guó)際上每年都會(huì)召開CBR研討會(huì)(ICCBR,EC⁃CBR),極大促進(jìn)了CBR理論與應(yīng)用的發(fā)展。近年來,關(guān)于CBR的研究主要集中在CBR與其他人工智能方法的結(jié)合與比較,CBR作為解釋機(jī)制的算法研究,CBR案例改編機(jī)制研究,分布式的案例推理與學(xué)習(xí)研究等等【1-2】,目前已在故障處理、疾病診治、決策支持、案件審理等領(lǐng)域取得了較好的應(yīng)用效果【3】。然而,傳統(tǒng)CBR研究所關(guān)注的案例提取,重用,改編與保存的推理循環(huán)過程只是其發(fā)展的一方面,研究卻很少關(guān)注使用系統(tǒng)的用戶,而在一定層面上用戶是否積極參與決定了CBR系統(tǒng)的成功與否。正因缺乏與用戶交互等原因,當(dāng)前許多CBR系統(tǒng)仍面臨著案例庫案例過時(shí),案例表示缺乏可擴(kuò)展性,案例數(shù)量停滯無增長(zhǎng),系統(tǒng)缺乏用戶參與協(xié)作等問題【4】。而Web2.0作為一個(gè)以多數(shù)人取代少數(shù)人智情報(bào)科學(xué)第33卷第11期2015年11月慧與貢獻(xiàn)的平臺(tái),更注重用戶與Web間的交互,用戶既是信息的瀏覽者又是信息的創(chuàng)建者,這在一定程度上與CBR作為人機(jī)交互系統(tǒng)的理念不謀而合,同時(shí)對(duì)于含有大量文本的CBR系統(tǒng)案例庫,需要一定的技術(shù)輔助其發(fā)現(xiàn)文本中隱藏的趨勢(shì)或信息。鑒于此,本文擬從Web2.0與文本挖掘的角度進(jìn)行研究,該方向的研究目前相對(duì)薄弱,相關(guān)的論述也較少。國(guó)外學(xué)者WuHe,TawnyaMeans等人指出了傳統(tǒng)的單獨(dú)式CBR系統(tǒng)設(shè)計(jì)成本高,拓展性差等問題,闡述了基于Web的CBR應(yīng)用所具有的優(yōu)勢(shì)并將其稱作CBR2.0【4】;QiangYang與JingWu認(rèn)為案例結(jié)構(gòu)應(yīng)越簡(jiǎn)單越好,強(qiáng)調(diào)通過聚類劃分案例,對(duì)于文本案例也可根據(jù)附加在案例上的屬性值來進(jìn)行分類【5】。截止2013年6月20日,筆者在中國(guó)知網(wǎng)(CNKI)中以“案例推理”與“Web2.0”、“文本挖掘”等組合為關(guān)鍵字共檢索出相關(guān)文獻(xiàn)3篇。其中華南理工大學(xué)的李峰針對(duì)Web2.0環(huán)境下自底而上的知識(shí)形成過程,提出了基于案例的知識(shí)管理系統(tǒng)【6】;合肥工業(yè)大學(xué)的戴奇波、倪志偉等人設(shè)計(jì)了一種基于動(dòng)態(tài)數(shù)據(jù)流挖掘的案例推理模型【7】。總體來講現(xiàn)有文獻(xiàn)大多屬于理論層面的構(gòu)想并沒有深入探討,還未形成完善的體系。本文在以往研究的基礎(chǔ)上,以CBR作為人機(jī)交互系統(tǒng)為著眼點(diǎn),運(yùn)用Web2.0與文本挖掘技術(shù)構(gòu)建層次化的交互式系統(tǒng)模型,以解決傳統(tǒng)CBR忽略“用戶”作用的缺陷,并剖析了其在系統(tǒng)中的具體應(yīng)用與實(shí)現(xiàn),以期拓寬CBR研究的思路與方向。

2基于Web2.0與文本挖掘的CBR系統(tǒng)

2.1CBR中引入Web2.0與文本挖掘的必要性傳統(tǒng)CBR系統(tǒng)案例庫中的知識(shí)往往由專家給出,或者由以往經(jīng)驗(yàn)得出,案例的更新是“被動(dòng)地”,即只有當(dāng)用戶有求解需求時(shí)才會(huì)使用。如此被動(dòng)的方式往往使案例庫知識(shí)量少,新案例獲取困難,并且由于長(zhǎng)期得不到更新,成為靜態(tài)、過時(shí)的案例庫,極大影響解決問題的深度與廣度。同時(shí),傳統(tǒng)CBR系統(tǒng)缺乏用戶間交流協(xié)作的平臺(tái),使用系統(tǒng)的最大目的僅是單純尋找能解決當(dāng)前問題的最相關(guān)案例,用戶無法討論他們讀過的案例,也無法對(duì)案例做補(bǔ)充說明,案例庫資源得不到充分地增值與利用。從知識(shí)管理的角度來講,對(duì)于行家里手的工作經(jīng)驗(yàn),由于缺乏可以“主動(dòng)”貢獻(xiàn)的平臺(tái)而未能留下相對(duì)完整的解決方案記憶,其他用戶碰到類似問題只能重頭再來。伴隨著Web2.0的迅速發(fā)展與普及應(yīng)用,在CBR系統(tǒng)中引入Web2.0技術(shù),增加系統(tǒng)與用戶交流的接口,用戶從被動(dòng)的接受者變成主動(dòng)的內(nèi)容貢獻(xiàn)者,為用戶提供一個(gè)學(xué)習(xí)平臺(tái),可以評(píng)論案例,豐富案例庫,創(chuàng)建案例更加自主,使案例庫內(nèi)容呈現(xiàn)出開放與協(xié)同創(chuàng)作的特點(diǎn)。例如,可以用Wiki平臺(tái)幫助系統(tǒng)拓寬案例來源,還可通過Blog構(gòu)建網(wǎng)絡(luò)社區(qū)評(píng)論案例并為案例增加注釋【8】。引入Web2.0在系統(tǒng)中構(gòu)建不同的交流圈子,使用戶積極參與到系統(tǒng)互動(dòng)共享中,同時(shí)也大大降低了系統(tǒng)解決問題的成本。用戶的經(jīng)驗(yàn)和感知在一定程度上決定了案例的質(zhì)量,而用戶參與度與交互性的加強(qiáng)反過來促進(jìn)案例質(zhì)量的提高。研究表明大約80%的組織信息都包含在文本文檔中【9】,案例庫中同樣含有大量的文本信息。文本挖掘技術(shù)即嘗試從無結(jié)構(gòu)的文本中抽取有用的信息和知識(shí),而CBR系統(tǒng)關(guān)注于如何用這些知識(shí)來解決問題,兩者結(jié)合相互補(bǔ)充循序漸進(jìn)使系統(tǒng)更具靈活性。

2.2基于Web2.0與文本挖掘的CBR系統(tǒng)CBR作為一個(gè)社會(huì)技術(shù)系統(tǒng),環(huán)境、用戶等因素同樣被考慮進(jìn)來,激勵(lì)用戶討論他們讀過的案例,分享他們的想法與感受,回答案例中存在的問題。本文提出的基于Web2.0與文本挖掘的CBR系統(tǒng)框架如圖1所示。對(duì)比傳統(tǒng)CBR系統(tǒng),基于Web2.0與文本挖掘的CBR系統(tǒng)在案例的與更新,檢索以及知識(shí)的呈現(xiàn)方面有很大的不同與改進(jìn)。在結(jié)構(gòu)上,系統(tǒng)采用瀏覽器/服務(wù)器模式,減少用戶安裝和使用系統(tǒng)的復(fù)雜度,同時(shí)也消除了時(shí)間和地點(diǎn)的約束。用戶通過瀏覽器完成案例的、檢索與評(píng)價(jià)而無需了解HTML以及其他復(fù)雜軟件,還可登錄Wiki平臺(tái)分享經(jīng)驗(yàn)并通過Wiki頁面對(duì)案例添加標(biāo)簽,利用瀏覽器端的RSS閱讀器訂閱感興趣的案例并獲得及時(shí)提醒。用戶案例后,并不是直接存入案例庫,而是先保存在臨時(shí)案例庫中,再通過臨時(shí)案例庫更新案例庫。這樣一方面防止案例數(shù)據(jù)急劇增大以及部分用戶惡意添加無效內(nèi)容,減少數(shù)據(jù)冗余,另一方面在解決問題時(shí),先檢索案例庫,無合理匹配后再檢索臨時(shí)案例庫,提高了檢索效率與有效性。針對(duì)案例匹配的相似度算法,國(guó)內(nèi)外學(xué)者已有很多詳細(xì)的研究成果【10-11】,然而引入Web2.0后,系統(tǒng)通過檢索界面可利用Ajax技術(shù)與用戶交互【12】,通過向用戶提問與提示的方式縮小檢索范圍,即在案例檢索前由用戶選取必須或者優(yōu)先滿足的條件,得到一個(gè)初始案例集合,之后再與目標(biāo)案例逐一進(jìn)行相似度對(duì)比。算法步驟如下:Step1:根據(jù)用戶需求,確定目標(biāo)案例C0的屬性等;Step2:引導(dǎo)用戶選取案例中優(yōu)先或必須滿足的屬性或子過程,檢索案例庫,得到滿足約束條件的案例初始集合Ci,其中i為初始集合中案例個(gè)數(shù);Step3:利用相似度算法,逐一計(jì)算目標(biāo)案例C0與初始集合Ci中每個(gè)案例的相似度S1,S2,S3……Si;Step4:對(duì)于給定的閾值λ,若Sm>λ(其中m=1,2,……i),則將Sm對(duì)應(yīng)案例作為最佳匹配反饋給用戶。引入Web2.0與文本挖掘技術(shù)后,系統(tǒng)將不再僅僅是案例推理系統(tǒng),而是一個(gè)知識(shí)管理系統(tǒng),一個(gè)信息共享與協(xié)作平臺(tái),可以對(duì)實(shí)時(shí)、動(dòng)態(tài)數(shù)據(jù)進(jìn)行一定的處理,系統(tǒng)處于動(dòng)態(tài)變化的過程中。

3Web2.0與文本挖掘在CBR系統(tǒng)中的應(yīng)用與實(shí)現(xiàn)

3.1利用標(biāo)簽實(shí)現(xiàn)案例知識(shí)的標(biāo)引與組織標(biāo)簽是對(duì)內(nèi)容個(gè)人理解基礎(chǔ)上的標(biāo)注,它不需要遵循固定的模式與標(biāo)準(zhǔn),是一種靈活、自由而有序的信息分類技術(shù),可以從多個(gè)維度來揭示信息內(nèi)容。在傳統(tǒng)案例表達(dá)方式的基礎(chǔ)上,結(jié)合Web2.0去中心化,強(qiáng)調(diào)用戶參與的特征,系統(tǒng)允許用戶為其使用的案例設(shè)置標(biāo)簽,使用戶之間,案例內(nèi)容之間產(chǎn)生新的鏈接與聯(lián)系,如圖2所示。標(biāo)簽使得用戶間建立社會(huì)網(wǎng)絡(luò)關(guān)系,案例間建立概念關(guān)系,反過來用戶標(biāo)簽的使用習(xí)慣和分布特征也形成了標(biāo)簽間潛在的語義聯(lián)系。具體來講,第一,對(duì)于系統(tǒng)反饋的案例用戶可按照自身理解添加標(biāo)簽,每個(gè)案例能被添加多個(gè)標(biāo)簽。用戶擁有自己的系統(tǒng)賬戶,其中可設(shè)置標(biāo)簽列表,包含其曾經(jīng)添加過的所有標(biāo)簽,選擇其中某個(gè)標(biāo)簽即可獲得用戶使用該標(biāo)簽標(biāo)注的案例鏈接,標(biāo)簽幫助用戶分門別類地管理對(duì)自己有用的案例資源。第二,用戶可為多個(gè)案例添加標(biāo)簽,從而建立了用戶與案例間的關(guān)聯(lián),如圖2實(shí)線所示。同一案例可被不同的標(biāo)簽標(biāo)注,同一標(biāo)簽也可標(biāo)注不同的案例,不同的案例,不同的用戶之間便關(guān)聯(lián)起來,如圖2虛線所示。系統(tǒng)用戶的標(biāo)簽列表可以被其他用戶查看,其他用戶也可使用相同的標(biāo)簽。對(duì)案例添加標(biāo)簽成為一種基于共享的協(xié)作,更有價(jià)值的案例信息總是被更多用戶標(biāo)注,使用頻率越高的標(biāo)簽對(duì)案例內(nèi)容的概括也越準(zhǔn)確。第三,用戶添加的標(biāo)簽是對(duì)案例特征的描述,可作為案例檢索時(shí)的關(guān)鍵詞。在檢索過程中,一方面可以給出該標(biāo)簽下的相關(guān)案例,另一方面還可以向用戶提示與其相關(guān)的其他標(biāo)簽【6】。案例、標(biāo)簽、用戶間的關(guān)系在數(shù)據(jù)庫中可以通過建立二維關(guān)系表實(shí)現(xiàn),如圖3所示。其中標(biāo)簽表引用用戶表的UserID字段作為外鍵,案例表引用標(biāo)簽表的TagID字段作為外鍵。除了傳統(tǒng)標(biāo)簽外,系統(tǒng)還可引入標(biāo)簽云作為案例內(nèi)容的額外解釋。標(biāo)簽云能使文本案例以快速、可視化的形式展現(xiàn)出來,當(dāng)系統(tǒng)反饋給用戶一個(gè)備選案例時(shí),標(biāo)簽云給用戶對(duì)于案例內(nèi)容更直觀地感知與理解。有時(shí),用戶甚至可以直接使用標(biāo)簽云來對(duì)比兩個(gè)相似案例間的不同【13】。標(biāo)簽云可以通過在系統(tǒng)中集成Wordle、TagCloud與Imagechef等工具實(shí)現(xiàn)。

3.2利用Wiki構(gòu)建案例知識(shí)協(xié)作與共享平臺(tái)在一定程度上,案例庫內(nèi)存儲(chǔ)的案例數(shù)量決定了用其進(jìn)行推理決策的水平與效果,所以系統(tǒng)應(yīng)提供相應(yīng)機(jī)制允許用戶主動(dòng)豐富案例知識(shí)。然而一段經(jīng)驗(yàn),一個(gè)案例解決方案的形成可能需要多個(gè)用戶一段時(shí)間的實(shí)踐探索,同時(shí)也需要一個(gè)平臺(tái)去積累沉淀,并將這些凌亂的多用戶信息系統(tǒng)地顯示出來。作為Web2.0應(yīng)用之一的Wiki是支持社群協(xié)作的開放式自組織工具【14】,系統(tǒng)可利用Wiki構(gòu)建案例知識(shí)協(xié)作與共享平臺(tái)。CBR系統(tǒng)中的Wiki平臺(tái)如圖4所示,每個(gè)Wiki頁面可存放一個(gè)完整案例或尚未成熟的案例問題描述、解決方案等組成要素。用戶登錄平臺(tái)后,通過創(chuàng)建新Wiki頁面來呈現(xiàn)自己過去的實(shí)踐經(jīng)驗(yàn)或經(jīng)歷,其他用戶可對(duì)其觀點(diǎn)進(jìn)行補(bǔ)充并提出不同意見,通過彼此交流協(xié)作,實(shí)現(xiàn)案例知識(shí)融合。Wiki頁面的經(jīng)驗(yàn)片段不斷地被反饋、修改與完善,并通過Wiki的版本控制剔除惡意篡改的內(nèi)容,能夠形成完整合理的解決方案時(shí),再由系統(tǒng)管理人員將其引入案例庫或?qū)ο鄳?yīng)案例進(jìn)行更新。更新后的案例又通過Wiki平臺(tái)反饋給用戶,形成一個(gè)知識(shí)的動(dòng)態(tài)循環(huán)。用戶的貢獻(xiàn)越多,其擁有的權(quán)限就可以越大,系統(tǒng)變得更具有吸引力來激勵(lì)其作出更多貢獻(xiàn),同時(shí)吸引新用戶的加入。這樣的過程使案例數(shù)量不斷“主動(dòng)地”增加,同時(shí)促進(jìn)用戶間協(xié)作共享并且改善系統(tǒng)的使用體驗(yàn)。用戶在編輯頁面內(nèi)容時(shí)可添加超鏈接標(biāo)記,系統(tǒng)自動(dòng)尋找已定義的概念并添加相應(yīng)案例條目間的鏈接,案例之間或案例內(nèi)容各組成要素間的關(guān)系便可依靠頁面間的超鏈接標(biāo)記來實(shí)現(xiàn)。用戶在閱讀某個(gè)Wiki頁面時(shí),通過超鏈接跳轉(zhuǎn)至其他頁面以便了解更多感興趣的概念,頁面的鏈接目標(biāo)可以尚未存在,通過點(diǎn)選鏈接創(chuàng)建這些頁面,從而使系統(tǒng)得以增長(zhǎng)。Wiki引擎是整個(gè)平臺(tái)的核心,根據(jù)用戶的請(qǐng)求信息,Wiki引擎從案例庫存儲(chǔ)模塊讀取相應(yīng)數(shù)據(jù),它為用戶編輯和瀏覽Wiki頁面提供Web界面,將用戶標(biāo)記的頁面進(jìn)行處理,系統(tǒng)內(nèi)多個(gè)內(nèi)容重復(fù)的頁面可被匯聚于其中某個(gè)頁面,相應(yīng)鏈接結(jié)構(gòu)也隨之改變,從而實(shí)現(xiàn)案例間的跳轉(zhuǎn)導(dǎo)航。從案例優(yōu)化的角度,系統(tǒng)反饋給用戶的案例通過Wiki展現(xiàn)出來,用戶可對(duì)其作出評(píng)價(jià),即可在Wi⁃ki上設(shè)置案例評(píng)價(jià)模塊,用戶對(duì)案例的滿意度進(jìn)行打分并且標(biāo)注合理的標(biāo)簽,給出簡(jiǎn)短評(píng)注【15】。久而久之,用戶的評(píng)價(jià)數(shù)據(jù)可作為案例匹配檢索以及案例庫更新優(yōu)化的判定依據(jù)之一。具體來說,可在案例庫中為每個(gè)案例增加兩個(gè)字段CandidateTimes和SatisfactionTimes,CandidateTimes表示某案例被推送為候選案例的次數(shù),SatisfactionTimes表示該候選案例最終被成功采納的次數(shù)。兩者初始值均為零,當(dāng)某個(gè)案例被成功檢索并推送給用戶時(shí),Candi⁃dateTimes+1,用戶對(duì)于系統(tǒng)推送的案例給予評(píng)價(jià),若用戶滿意并可用則SatisfactionTimes+1。久而久之,若某案例的CandidateTimes遠(yuǎn)大于SatisfactionTimes,說明該案例的實(shí)用價(jià)值不高并影響案例庫質(zhì)量,應(yīng)在系統(tǒng)優(yōu)化階段予以剔除。

3.3利用RSS實(shí)現(xiàn)案例知識(shí)的聚合與推送RSS通過支持基于XML的RSSFeed實(shí)現(xiàn)信息內(nèi)容的訂閱、聚合和推送,為用戶提供個(gè)性化的“一站式”知識(shí)服務(wù)。用戶能夠訂閱案例內(nèi)容的先決條件是系統(tǒng)提供了RSSFeed,它由一個(gè)URL唯一標(biāo)識(shí),是以XML格式寫成的文檔,包含標(biāo)題、摘要或內(nèi)容選錄等。RSSFeed有多種生成方式,對(duì)主要用于案例讀取而更新較少的案例庫,可以采用RSSCre⁃ator等Feed生成軟件從案例庫中讀取現(xiàn)成數(shù)據(jù),生成靜態(tài)XML文件,實(shí)現(xiàn)RSS輸出;對(duì)于案例庫與用戶交互頻繁,案例庫更新較快的系統(tǒng)可根據(jù)用戶的請(qǐng)求編程動(dòng)態(tài)生成XML文件【16】。當(dāng)用戶進(jìn)行案例檢索時(shí),系統(tǒng)在返回候選案例列表的同時(shí)自動(dòng)給出RSSFeedURL。由于本文提出的系統(tǒng)采用B/S模式,所以用戶可通過在線RSS閱讀器或?yàn)g覽器自帶RSS功能訂閱相應(yīng)URL,閱讀器解析XML文檔中的每個(gè)條目,從而得出新下載的RSSFeed中新增的條目并呈現(xiàn)給用戶。CBR中RSS的解析結(jié)構(gòu)如圖5所示。系統(tǒng)模塊提供完整的案例內(nèi)容,同時(shí)生成相應(yīng)案例的RSSFeed,內(nèi)容聚合器讀取最新RSS文件匯總并進(jìn)行索引,之后瀏覽器端連接到聚合器,用戶通過點(diǎn)擊標(biāo)題鏈接獲取詳細(xì)內(nèi)容。當(dāng)案例庫中增加相關(guān)主題的案例或案例內(nèi)容發(fā)生變更時(shí),系統(tǒng)便可從多案例源搜集整合內(nèi)容到單個(gè)數(shù)據(jù)流反饋給用戶。如此做一方面案例的可見度提高,即使當(dāng)前沒有檢索需求,用戶仍可以從主動(dòng)推送的內(nèi)容中學(xué)習(xí)到自己感興趣的知識(shí),節(jié)省了用戶篩選、獲取信息的時(shí)間成本,每個(gè)用戶既是被動(dòng)的信息獲取者,又是主動(dòng)的信息提煉者【17】;另一方面,由于關(guān)注度提高,相應(yīng)案例的使用頻率和影響程度也大大增加。

3.4利用文本挖掘?qū)崿F(xiàn)案例知識(shí)的結(jié)構(gòu)化表示文本挖掘是分析文本數(shù)據(jù)、抽取文本信息進(jìn)而發(fā)現(xiàn)文本知識(shí)的過程,它關(guān)注于發(fā)現(xiàn)數(shù)據(jù)中的隱藏信息【18】。對(duì)于含有大量文本數(shù)據(jù)的CBR系統(tǒng),案例的形式和內(nèi)容往往由描述者決定,其文本的邏輯、表達(dá)和寫作格式不盡相同,如果不借助文本挖掘技術(shù)獲取文本的主要內(nèi)容特征,后續(xù)的案例分析、檢索等都難以開展。CBR系統(tǒng)中文本挖掘的應(yīng)用場(chǎng)景如圖6所示。用戶通過Wiki平臺(tái)記錄的非結(jié)構(gòu)化案例文本傳遞給文本挖掘模塊做進(jìn)一步處理。針對(duì)差異化的案例描述,通過文本預(yù)處理、關(guān)系抽取和關(guān)聯(lián)分析等一系列步驟把非結(jié)構(gòu)化、半結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的案例知識(shí)以框架的形式表示出來,并存儲(chǔ)到案例庫中。從這個(gè)角度來講,文本挖掘使案例庫在沒有專家知識(shí)支持的情況下也可產(chǎn)生。此外可將用戶的問題描述轉(zhuǎn)化為結(jié)構(gòu)化的案例檢索請(qǐng)求傳送到推理模塊,找出與問題案例最相似的歷史案例反饋給用戶。不同案例描述與解決問題的側(cè)重點(diǎn)不同,系統(tǒng)通過聚類對(duì)案例庫進(jìn)行分區(qū)【5】。聚類的結(jié)果構(gòu)成若干子案例庫,每個(gè)子案例庫被當(dāng)作一個(gè)新的個(gè)體案例,在使用過程中可用來反推系統(tǒng)進(jìn)行聚類的特征依據(jù),便于用戶學(xué)習(xí)案例知識(shí),也使案例庫的更新與系統(tǒng)維護(hù)變得更細(xì)化更快捷。另外,在每個(gè)子案例庫中可選取幾個(gè)代表案例,當(dāng)進(jìn)行相似度計(jì)算時(shí),可先與代表案例進(jìn)行比較,之后再與相似度較高的代表案例子案例庫中的每個(gè)案例逐一對(duì)比,縮小檢索范圍,提高檢索效率。用戶通過Wiki平臺(tái)貢獻(xiàn)的案例往往數(shù)量多且內(nèi)容較冗長(zhǎng),系統(tǒng)管理人員沒有時(shí)間閱讀整篇案例,故可利用自動(dòng)摘要技術(shù)產(chǎn)生案例關(guān)鍵詞甚至摘要,抽取的關(guān)鍵詞在案例中被高亮顯示,幫助管理員快捷有效地決定是否將此案例添加到案例庫中,其結(jié)果也可作為確定案例索引數(shù)據(jù)權(quán)重的輔助方法【19】。同時(shí),案例中諸如創(chuàng)建者、時(shí)間、地點(diǎn)等要素也被抽取出來構(gòu)建單獨(dú)的索引。

4結(jié)語

案例推理作為迅速發(fā)展起來的人工智能子領(lǐng)域,案例庫中案例的數(shù)量與質(zhì)量,用戶的參與度是決定系統(tǒng)成敗的關(guān)鍵因素。本文提出了一個(gè)將Web2.0與文本挖掘技術(shù)引入CBR的原型系統(tǒng),一方面使案例庫內(nèi)容可以主動(dòng)增加與更新,系統(tǒng)動(dòng)態(tài)性增強(qiáng),另一方面為用戶提供了一個(gè)溝通協(xié)作與學(xué)習(xí)的平臺(tái),提高系統(tǒng)用戶的參與度與交互性,使用戶體驗(yàn)與系統(tǒng)生命力大大增強(qiáng)。文中詳細(xì)分析了標(biāo)簽、Wiki、RSS與文本挖掘技術(shù)在CBR系統(tǒng)中的應(yīng)用與實(shí)現(xiàn),同時(shí)也為其他知識(shí)庫系統(tǒng)設(shè)計(jì)提供了一個(gè)指導(dǎo)方向。最終希望通過本文提出的方法引發(fā)更多從用戶角度對(duì)于CBR系統(tǒng)的探討,另外根據(jù)現(xiàn)有成果開發(fā)相應(yīng)的平臺(tái)與系統(tǒng),在實(shí)踐中驗(yàn)證該方案的有效性有待進(jìn)一步深入研究。

作者:吳彥偉 劉東蘇 李慧 單位:西安電子科技大學(xué) 經(jīng)濟(jì)與管理學(xué)院

主站蜘蛛池模板: 日日狠狠久久偷偷四色综合免费 | 日韩一区二区三区免费视频 | 在线中文视频 | 国产精品成人一区二区三区 | 亚洲天堂欧美 | 中字av在线 | 久久精品一区二区 | 成人福利av | 黑人操女人 | 日本五十路女优 | av黄色影院 | 精品中文字幕在线观看 | 国产成人综合在线观看 | 三级黄毛片 | 神马久久久久久久久久久 | 亚洲天堂中文字幕在线观看 | 日韩精品一区二区在线播放 | 粉嫩欧美一区二区三区 | 国产suv精品一区 | 亚洲午夜在线播放 | jizzjizz日本人 | www.自拍偷拍 | 国产一级片视频 | 成年女人色毛片 | 国产精品一区二区三区在线免费观看 | 看免费毛片 | 国产h视频在线观看 | 一区二区三区国产精品 | 六月综合激情 | 黄色成人小视频 | 好吊视频一区二区三区 | 1024香蕉 | 国产亚洲区 | 黄色片国产 | 色偷偷偷偷| 亚洲天天 | 青娱乐av | 精品国产乱码久久久久久久 | 国产一区二区三区久久久 | 午夜在线精品 | 风间由美一区 |