本站小編為你精心準(zhǔn)備了標(biāo)簽傳播在社會(huì)網(wǎng)絡(luò)中的運(yùn)用參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫(xiě)作靈感。歡迎深入閱讀并收藏。

《計(jì)算機(jī)工程與應(yīng)用雜志》2014年第十四期
1研究現(xiàn)狀
針對(duì)在大規(guī)模網(wǎng)絡(luò)結(jié)構(gòu)中進(jìn)行聚類時(shí),需要事先知道聚類數(shù)目、規(guī)模等先驗(yàn)信息,或者聚類算法的計(jì)算代價(jià)比較大的情況,Raghavan等人提出了基于標(biāo)簽傳播[8]的簡(jiǎn)單快速算法。在算法中,初始化時(shí)每個(gè)節(jié)點(diǎn)被賦予唯一的數(shù)字標(biāo)簽,在之后的每步中,將所有節(jié)點(diǎn)以隨機(jī)序列排列,根據(jù)鄰接節(jié)點(diǎn)當(dāng)前出現(xiàn)頻率最高的標(biāo)簽依次確定隨機(jī)序列中節(jié)點(diǎn)的標(biāo)簽。如此迭代,在幾乎線性的時(shí)間內(nèi)實(shí)現(xiàn)了節(jié)點(diǎn)聚類。由于算法的終止條件是事先約定的一個(gè)準(zhǔn)則,并非函數(shù)值的最大化或者最小化,因此滿足停止條件的網(wǎng)絡(luò)劃分結(jié)果不唯一,但Raghavan等人通過(guò)計(jì)算發(fā)現(xiàn)這些不同的網(wǎng)絡(luò)劃分之間具有極大的相似性。并且提出將各種網(wǎng)絡(luò)劃分結(jié)果進(jìn)行聚合,可以發(fā)現(xiàn)重疊的簇結(jié)構(gòu)。該算法僅將已知的網(wǎng)絡(luò)結(jié)構(gòu)作為啟發(fā)式搜索條件,在線性時(shí)間O(m+n)內(nèi)實(shí)現(xiàn)高效聚類,且適用于含有百萬(wàn)節(jié)點(diǎn)的大規(guī)模網(wǎng)絡(luò)。Barber和Clark指出LPA算法在將不同聚類結(jié)果進(jìn)行聚合時(shí),若不同的劃分方案中簇結(jié)構(gòu)越小,那么聚合后的簇結(jié)構(gòu)也就越多,是該算法存在的一個(gè)比較嚴(yán)重的缺陷。為了解決該問(wèn)題,他們?cè)谶^(guò)程中引入了一些限制,在目標(biāo)函數(shù)H(對(duì)H進(jìn)行極大化,等價(jià)于原始的LPA算法)上增加了一些數(shù)據(jù)項(xiàng),提高了LPA算法的性能[9]。Leung等人在對(duì)線性時(shí)間的LPA算法進(jìn)行分析總結(jié)的基礎(chǔ)上,提出了在社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)中進(jìn)行實(shí)時(shí)聚類的方法,改善了LPA算法簇結(jié)構(gòu)規(guī)模不均勻的缺陷,并且證明了標(biāo)簽傳播的啟發(fā)式方法在大規(guī)模網(wǎng)絡(luò)中進(jìn)行聚類更準(zhǔn)確、更高效[10]。此外,Long等人提出的基于圖相似的CLGA算法[11],Narasimhamurthy等人提出的圖模型分解方法[12],Zarei和Samani提出了基于Newman的反簇結(jié)構(gòu)概念,將網(wǎng)絡(luò)看成一個(gè)圖,通過(guò)在原圖的補(bǔ)圖中尋找反簇結(jié)構(gòu),進(jìn)而得到原簇的結(jié)構(gòu)的算法[12]等。國(guó)內(nèi)的研究學(xué)者也對(duì)這一問(wèn)題進(jìn)行了相關(guān)研究[13-14]。基于局部信息的聚類方法通常是考慮網(wǎng)絡(luò)中節(jié)點(diǎn)的局部近鄰信息,在大規(guī)模數(shù)據(jù)集中,可以高效地找到網(wǎng)絡(luò)最優(yōu)劃分或者近似最優(yōu)劃分,一般具有概念簡(jiǎn)單,易于實(shí)現(xiàn),算法復(fù)雜度相對(duì)較低等優(yōu)點(diǎn)。但縱觀每個(gè)基于局部信息的啟發(fā)式聚類算法,又分別有它各自的局限性。
2基于節(jié)點(diǎn)屬性相似度的標(biāo)簽傳播算法
2.1問(wèn)題描述LPA算法僅以網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)作為向?qū)В鶕?jù)節(jié)點(diǎn)之間的連接,可高效地進(jìn)行網(wǎng)絡(luò)聚類,這是LPA算法的優(yōu)點(diǎn)。但現(xiàn)實(shí)世界中的絕大多數(shù)網(wǎng)絡(luò),除了具有拓?fù)浣Y(jié)構(gòu)特征,網(wǎng)絡(luò)中的節(jié)點(diǎn)自身的屬性信息也很容易獲取,如科學(xué)家合著網(wǎng)絡(luò)中,每個(gè)學(xué)者都有其主要的研究方向。因此,LPA算法忽略了節(jié)點(diǎn)本身的屬性信息,僅考慮連接的局部信息,而且LPA算法具有較大的隨機(jī)性,這會(huì)致使算法對(duì)網(wǎng)絡(luò)劃分可能并非最優(yōu),甚至出現(xiàn)節(jié)點(diǎn)的錯(cuò)誤劃分。下面通過(guò)一個(gè)實(shí)例來(lái)形象、直觀地說(shuō)明該算法存在的問(wèn)題。一個(gè)小型的人際交互網(wǎng)絡(luò)如圖1所示,其中每個(gè)節(jié)點(diǎn)代表一個(gè)人,每個(gè)人所屬的學(xué)校用節(jié)點(diǎn)旁的字母表示。根據(jù)標(biāo)簽傳播算法,顯然網(wǎng)絡(luò)可以被劃分為兩個(gè)簇結(jié)構(gòu),A大學(xué){v1v2v3v4v5v6},B大學(xué){v7v8v9v10}。現(xiàn)在仔細(xì)分析v6節(jié)點(diǎn),在標(biāo)簽傳播過(guò)程中,根據(jù)連接節(jié)點(diǎn)與其鄰節(jié)點(diǎn)的連接情況來(lái)看,它的候選集合有兩個(gè):{v4v5}和{v9v10}對(duì)應(yīng)的標(biāo)簽分別為A大學(xué)和B大學(xué)。隨機(jī)選擇其一,如:A大學(xué),但根據(jù)它的實(shí)際屬性來(lái)看,它是屬于B大學(xué)的,因此節(jié)點(diǎn)出現(xiàn)了錯(cuò)誤的劃分,影響了網(wǎng)絡(luò)聚類的質(zhì)量。即使在下一輪的迭代過(guò)程中,它被劃分到正確的結(jié)構(gòu)中,但這也是需要付出時(shí)間代價(jià)的。針對(duì)上述情況,本文綜合考慮節(jié)點(diǎn)屬性信息,在保證原算法時(shí)間復(fù)雜度的基礎(chǔ)上,引入節(jié)點(diǎn)屬性相似度的概念,提出基于節(jié)點(diǎn)屬性相似度的標(biāo)簽傳播算法,致力于提高網(wǎng)絡(luò)劃分效果,降低算法的時(shí)間開(kāi)銷。
2.2節(jié)點(diǎn)屬性相似度在給出LPA-SNA算法的具體描述前,先給出計(jì)算節(jié)點(diǎn)屬性相似度所需的一些基本概念及定義。本文要用到的重要的表示符號(hào)如表1所示。
2.3LPA-SNA算法描述及實(shí)現(xiàn)在原始的LPA算法的基礎(chǔ)上,當(dāng)待更新節(jié)點(diǎn)的大部分鄰節(jié)點(diǎn)所屬的簇結(jié)構(gòu)不止一個(gè),即該節(jié)點(diǎn)的鄰接子系統(tǒng)不唯一時(shí),基于節(jié)點(diǎn)屬性相似度的標(biāo)簽傳播算法(LPA-SNA)計(jì)算每個(gè)鄰接子系統(tǒng)中節(jié)點(diǎn)屬性的平均值,進(jìn)而計(jì)算待更新節(jié)點(diǎn)與各鄰接子系統(tǒng)的屬性相似度,并選取令相似度maxSimi(SiSNir)最高的子系統(tǒng)的標(biāo)簽作為當(dāng)前節(jié)點(diǎn)的標(biāo)簽。由于一般的原始網(wǎng)絡(luò)包含節(jié)點(diǎn)及邊的信息,算法每次迭代時(shí),要根據(jù)鄰居節(jié)點(diǎn)標(biāo)簽信息來(lái)決定當(dāng)前節(jié)點(diǎn)的標(biāo)簽,如果每次都統(tǒng)計(jì)該節(jié)點(diǎn)有哪些鄰節(jié)點(diǎn),算法運(yùn)行時(shí)需要耗費(fèi)大量的時(shí)間。因此,對(duì)LPA-SNA算法進(jìn)行實(shí)現(xiàn)時(shí),要先進(jìn)行預(yù)處理,首先讀入包含網(wǎng)絡(luò)G節(jié)點(diǎn)及邊信息的文件,并根據(jù)讀入的G的拓?fù)浣Y(jié)構(gòu),構(gòu)造對(duì)應(yīng)的鄰接表結(jié)構(gòu)體ALGraph,ALGraph包含頂點(diǎn)表節(jié)點(diǎn)結(jié)構(gòu)體VNode和邊表節(jié)點(diǎn)結(jié)構(gòu)體ArcNode,而VNode存儲(chǔ)了每個(gè)節(jié)點(diǎn)的鄰節(jié)點(diǎn)數(shù)量及其屬性信息,ArcNode存儲(chǔ)了鄰居節(jié)點(diǎn)位置信息及邊信息。LPA-SNA算法包括以下5個(gè)步驟:(1)初始化網(wǎng)絡(luò)中的節(jié)點(diǎn)標(biāo)簽,依次為每個(gè)節(jié)點(diǎn)分配唯一的數(shù)字標(biāo)簽,即對(duì)于節(jié)點(diǎn)v,令Cv(0)=v。(2)令迭代計(jì)數(shù)器t=1。(3)以隨機(jī)順序排列網(wǎng)絡(luò)中的節(jié)點(diǎn),并將排序結(jié)果存放在向量X中。其中,Max_Vertex_Number為宏定義,表示網(wǎng)絡(luò)包含的節(jié)點(diǎn)數(shù)量。在迭代過(guò)程中,為了按照隨機(jī)順序?qū)?jié)點(diǎn)標(biāo)簽進(jìn)行更新,算法定義的隨機(jī)數(shù)組RandArray[Max_Vertex_Number],存儲(chǔ)0~Max_Vertex_Number-1的隨機(jī)排列的數(shù)據(jù),并設(shè)計(jì)函數(shù)RandInPlace(RandArray)來(lái)實(shí)現(xiàn)對(duì)數(shù)組中數(shù)據(jù)元素的隨機(jī)排序。
3實(shí)驗(yàn)分析
本文LPA-SNA算法的實(shí)驗(yàn)環(huán)境是Inter®CoreTM2.66GHz,2GB內(nèi)存,MicrosoftWindowsXP操作系統(tǒng)的PC機(jī);選用VisualC++6.0開(kāi)發(fā)環(huán)境。為了對(duì)改進(jìn)的LPA-SNA算法的可行性及有效性進(jìn)行實(shí)驗(yàn)論證,選擇美國(guó)大學(xué)足球賽程網(wǎng)絡(luò)[15]、科學(xué)家合著網(wǎng)絡(luò)兩個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。
3.1美國(guó)大學(xué)足球賽程網(wǎng)絡(luò)數(shù)據(jù)集實(shí)驗(yàn)首先,將LPA和LPA-SNA算法應(yīng)用美國(guó)大學(xué)足球賽程網(wǎng)絡(luò)。Newman提供的美國(guó)大學(xué)足球賽程網(wǎng)絡(luò),是分析社會(huì)網(wǎng)絡(luò)聚類的經(jīng)典的數(shù)據(jù)集,根據(jù)2000年秋季常規(guī)賽的比賽計(jì)劃構(gòu)建的,包含115個(gè)代表大學(xué)足球隊(duì)的節(jié)點(diǎn),616條表示兩個(gè)大學(xué)球隊(duì)之間進(jìn)行了比賽的邊。這些球隊(duì)構(gòu)成了一個(gè)具有簇結(jié)構(gòu)特性的網(wǎng)絡(luò),通常8到12個(gè)足球隊(duì)組成一個(gè)小組,不同小組間的球隊(duì)比賽的可能性要少于同一小組內(nèi)的球隊(duì)間比賽的可能性。將LPA算法與LPA-SNA算法分別應(yīng)用在該包含12個(gè)簇結(jié)構(gòu)的數(shù)據(jù)集上。為了不使算法陷入固定化、模式化的情況,在每次迭代過(guò)程中,LPA與LPA-SNA算法中節(jié)點(diǎn)更新順序都是隨機(jī)的。但由于存在該隨機(jī)策略,多次運(yùn)行兩種算法時(shí)會(huì)產(chǎn)生不同的聚類效果。為了更加真實(shí)地分析算法的性能,在美國(guó)大學(xué)足球網(wǎng)絡(luò)上分別將這兩種算法運(yùn)行30次,并且得到相關(guān)數(shù)據(jù)如表2所示。另外,為了更加直觀地比較LPA與LPA-SNA算法在運(yùn)行速度、網(wǎng)絡(luò)劃分質(zhì)量方面的性能,本文對(duì)兩種算法在足球賽程網(wǎng)絡(luò)上多次運(yùn)行時(shí)的時(shí)間、網(wǎng)絡(luò)模塊度兩個(gè)參數(shù)值情況繪制了對(duì)比折線圖,如圖2、3所示。根據(jù)表2所提供的實(shí)驗(yàn)數(shù)據(jù)結(jié)果可以看出,引入節(jié)點(diǎn)屬性相似度的LPA-SNA算法的平均迭代次數(shù)少于LPA算法,當(dāng)節(jié)點(diǎn)候選集合標(biāo)簽不唯一時(shí),通過(guò)計(jì)算節(jié)點(diǎn)屬性與候選鄰接子系統(tǒng)的屬性相似度選擇最佳的標(biāo)簽,使得節(jié)點(diǎn)很快被劃分到正確的網(wǎng)絡(luò)中,因此平均運(yùn)行時(shí)間更低,效率更高。同時(shí),觀察網(wǎng)絡(luò)聚類模塊度的平均值,可以看出LPA-SNA算法的平均Q值更大,說(shuō)明LPA-SNA算法中所劃分出的簇結(jié)構(gòu)內(nèi)部節(jié)點(diǎn)聯(lián)系得更加緊密,對(duì)網(wǎng)絡(luò)劃分質(zhì)量更高。另外,從迭代次數(shù)范圍、運(yùn)行時(shí)范圍兩個(gè)參數(shù)來(lái)分析,LPA算法的數(shù)據(jù)范圍更大。通過(guò)圖2、3可以看出,LPA算法的運(yùn)行時(shí)間、模塊度值的變化幅度要大,而LPA-SNA算法參數(shù)范圍區(qū)間相對(duì)較小,運(yùn)行時(shí)間及模塊度變化幅度相對(duì)較小。上述數(shù)據(jù)說(shuō)明,LPA算法在每次迭代過(guò)程中,由于節(jié)點(diǎn)順序排列具有隨機(jī)性,當(dāng)最高標(biāo)簽頻率不一致時(shí),標(biāo)簽選擇也具有隨機(jī)性,導(dǎo)致算法對(duì)網(wǎng)絡(luò)劃分的隨機(jī)性比較大。而LPA-SNA算法通過(guò)引入節(jié)點(diǎn)屬性相似度,降低了原始LPA算法的隨機(jī)性,提高原始算法運(yùn)行時(shí)間、聚類質(zhì)量的同時(shí),也具有更好的穩(wěn)定性。原始的足球賽程網(wǎng)絡(luò)數(shù)據(jù)集具有12個(gè)簇結(jié)構(gòu),為了進(jìn)一步分析LPA算法及LPA-SNA算法網(wǎng)絡(luò)聚類性能的差異,本文從上述的運(yùn)行30次的聚類結(jié)果中將美國(guó)足球賽程網(wǎng)絡(luò)均劃分為12個(gè)簇結(jié)構(gòu)時(shí)的情況進(jìn)行簡(jiǎn)單統(tǒng)計(jì),綜合考慮運(yùn)行時(shí)間和模塊度兩個(gè)參數(shù),選取性能比較均衡情況下的兩種算法對(duì)應(yīng)的網(wǎng)絡(luò)劃分,如圖4所示。該情況下,兩種算法的迭代次數(shù)、模塊度Q值、運(yùn)行時(shí)間3種情況如表3所示。將LPA-SNA算法與LPA算法與足球賽程網(wǎng)絡(luò)的真實(shí)劃分情況進(jìn)行對(duì)比分析,發(fā)現(xiàn)LPA算法在模塊度為0.5807時(shí)得出的簇結(jié)構(gòu)個(gè)數(shù)為12,運(yùn)行0.047s,有16個(gè)節(jié)點(diǎn)劃分錯(cuò)誤,其中五邊形表示的MidAmerican小組被劃分到兩個(gè)簇結(jié)構(gòu)中,正確率為86.08%,而LPA-SNA算法在網(wǎng)絡(luò)中挖掘12個(gè)簇結(jié)構(gòu)時(shí)的模塊度為0.5974,運(yùn)行時(shí)間為0.035s,有10個(gè)節(jié)點(diǎn)劃分錯(cuò)誤,正確率為91.30%。
3.2科學(xué)家合著網(wǎng)絡(luò)數(shù)據(jù)集實(shí)驗(yàn)DBLP(DigitalBibliography&LibraryProject)是由德國(guó)的Trier大學(xué)建立的,收錄計(jì)算機(jī)科學(xué)領(lǐng)域內(nèi)的出版物,包括書(shū)籍、期刊和會(huì)議論文,作者及合著者的姓名等相關(guān)內(nèi)容,提供非常全面的信息。目前為止,它至少已收錄13000000條書(shū)目記錄,由于文獻(xiàn)的質(zhì)量比較高且具有實(shí)時(shí)性,可以快速反映領(lǐng)域內(nèi)最新研究動(dòng)態(tài),因此它極具權(quán)威性,受到計(jì)算機(jī)領(lǐng)域?qū)W者們的廣泛認(rèn)可。此外,DBLP數(shù)據(jù)集可免費(fèi)獲取,因此本文從DBLP網(wǎng)站中搜集部分?jǐn)?shù)據(jù)作為實(shí)驗(yàn)研究對(duì)象。首先,搜集來(lái)自DBLP的6個(gè)領(lǐng)域20個(gè)會(huì)議上發(fā)表文章的學(xué)者,其中涉及的會(huì)議領(lǐng)域及名稱如下所示。選擇在會(huì)議中發(fā)表文章較多的1590個(gè)學(xué)者作為科學(xué)家合著網(wǎng)絡(luò)的節(jié)點(diǎn),如果兩個(gè)學(xué)者共同合作了文章,那么在網(wǎng)絡(luò)中他們之間就對(duì)應(yīng)存在一條邊,以此構(gòu)建一個(gè)科學(xué)家合著網(wǎng)絡(luò),并將學(xué)者的研究領(lǐng)域、發(fā)表文章的期刊名稱作為節(jié)點(diǎn)屬性信息。在該節(jié)點(diǎn)具有文本屬性的科學(xué)家合著網(wǎng)絡(luò)數(shù)據(jù)集上,分別實(shí)現(xiàn)LPA及LPA-SNA算法。本文通過(guò)引用這些屬性信息,計(jì)算節(jié)點(diǎn)屬性相似度,為節(jié)點(diǎn)選擇最佳的標(biāo)簽。通過(guò)對(duì)該數(shù)據(jù)集進(jìn)行聚類,比較PLA及PLA-SNA算法的性能。按照數(shù)據(jù)的搜集過(guò)程可知,在科學(xué)家合著網(wǎng)絡(luò)真實(shí)數(shù)據(jù)集原則上應(yīng)該劃分為6個(gè)簇結(jié)構(gòu)。將LPA算法和改進(jìn)的LPA-SNA算法運(yùn)行在網(wǎng)絡(luò)上,得到的簇結(jié)構(gòu)數(shù)量分別4個(gè)、6個(gè),如表4所示。ComputerVisionUtilize領(lǐng)域的CVPR會(huì)議中發(fā)表文章的作者經(jīng)常參加IJCAI、AAAI、ICML和ECML會(huì)議,由于LPA算法僅使用網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),根據(jù)網(wǎng)絡(luò)中節(jié)點(diǎn)的連接關(guān)系,很容易將CVPR中的學(xué)者劃分到ArtificialIntelligence領(lǐng)域中。但ComputerVisionUtilize領(lǐng)域的學(xué)者雖然經(jīng)常使用人工智能的方法,但它仍存在著一些獨(dú)特的方法,如分割、對(duì)象跟蹤和圖像建模等,因此,ComputerVisionUtilize領(lǐng)域的學(xué)者應(yīng)該隸屬單獨(dú)的一個(gè)簇結(jié)構(gòu)。另外,InformationandKnowledgeMan-agement領(lǐng)域的CIKM中的文章涉及的研究領(lǐng)域非常廣泛,吸引了許多信息分析、數(shù)據(jù)挖掘、數(shù)據(jù)庫(kù)等領(lǐng)域的研究學(xué)者。但是很顯然,與這些領(lǐng)域的任何一個(gè)會(huì)議相比較,CIKM有著自己獨(dú)特的研究主題,因此它也應(yīng)該形成獨(dú)立的簇結(jié)構(gòu)。原始的LPA算法僅根據(jù)節(jié)點(diǎn)間的連接來(lái)聚類,因此很容易將ComputerVisionUtilize與InformationandKnowledgeManagement中的節(jié)點(diǎn)劃分到其他簇結(jié)構(gòu)中,造成網(wǎng)絡(luò)劃分為4個(gè)簇結(jié)構(gòu),而LPA-SNA算法在引入節(jié)點(diǎn)屬性相似度以后,將DBLP的20個(gè)會(huì)議中的作者正確地劃分為6個(gè)簇結(jié)構(gòu)。另外,在該合著網(wǎng)絡(luò)上多次運(yùn)行LPA與LPA-SNA算法,實(shí)驗(yàn)得到的其他性能方面的數(shù)據(jù)如表5所示。如圖5、6為對(duì)算法運(yùn)行30次的時(shí)間、模塊度參數(shù)。結(jié)合表5的統(tǒng)計(jì)數(shù)據(jù)與圖5、6兩種算法的運(yùn)行時(shí)間、網(wǎng)絡(luò)模塊度參數(shù)折線圖可以看出,在科學(xué)家合著網(wǎng)絡(luò)上,LPA-SNA算法的聚類速度、網(wǎng)絡(luò)劃分質(zhì)量也明顯優(yōu)于LPA算法。引入節(jié)點(diǎn)屬性相似度以后,使具有多個(gè)鄰接子系統(tǒng)的節(jié)點(diǎn)根據(jù)其屬性特征很快地找到和本身接近的簇結(jié)構(gòu),降低了LPA算法的迭代次數(shù),減少了時(shí)間開(kāi)銷,提高了網(wǎng)絡(luò)聚類的質(zhì)量。
4總結(jié)
在對(duì)基于局部信息的LPA算法進(jìn)行深入研究的基礎(chǔ)上,引入節(jié)點(diǎn)屬性相似度的概念,提出了LPA-SNA算法。它以網(wǎng)絡(luò)結(jié)構(gòu)為主要依據(jù)的同時(shí),考慮節(jié)點(diǎn)屬性信息,對(duì)大規(guī)模數(shù)據(jù)集網(wǎng)絡(luò)進(jìn)行聚類,一定程度上克服了原始的LPA算法的隨機(jī)策略,提高了算法的聚類速度與網(wǎng)絡(luò)劃分質(zhì)量。通過(guò)在美國(guó)大學(xué)生足球賽程網(wǎng)絡(luò)、科學(xué)家合著網(wǎng)絡(luò)數(shù)據(jù)集上運(yùn)行LPA與LPA-SNA算法,驗(yàn)證了LPA-SNA算法的可行性與有效性。目前基于局部信息的聚類算法研究已取得了很大的進(jìn)展,能夠有效地探測(cè)社會(huì)網(wǎng)絡(luò)的簇結(jié)構(gòu),但隨著應(yīng)用領(lǐng)域的不斷拓展,網(wǎng)絡(luò)聚類問(wèn)題的多樣化,簇結(jié)構(gòu)挖掘仍不能完全發(fā)現(xiàn)網(wǎng)絡(luò)的全部功與特性。因此,如何針對(duì)各種不同類型的網(wǎng)絡(luò),設(shè)計(jì)出更加高效,無(wú)需先驗(yàn)知識(shí)指導(dǎo),利用局部信息即可挖掘簇結(jié)構(gòu)的算法,仍是今后需努力的一個(gè)方向。
作者:夏磊張樂(lè)君國(guó)林張勇實(shí)張健沛楊靜單位:哈爾濱工程大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院大連飛創(chuàng)信息技術(shù)有限公司