日韩视频专区_久久精品国产成人av_青青免费在线视频_欧美精品一级片_日韩在线观看中文字幕_九九热在线精品

美章網(wǎng) 資料文庫 配電網(wǎng)設(shè)備狀態(tài)的文本化數(shù)據(jù)可視化范文

配電網(wǎng)設(shè)備狀態(tài)的文本化數(shù)據(jù)可視化范文

本站小編為你精心準(zhǔn)備了配電網(wǎng)設(shè)備狀態(tài)的文本化數(shù)據(jù)可視化參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

配電網(wǎng)設(shè)備狀態(tài)的文本化數(shù)據(jù)可視化

摘要:針對(duì)配電網(wǎng)規(guī)模的日益擴(kuò)大,帶來了越來越多的配電網(wǎng)設(shè)備狀態(tài)數(shù)據(jù),用戶從海量的數(shù)據(jù)信息中洞察到配電網(wǎng)的整體情況存在困難的問題,提出了配電網(wǎng)設(shè)備狀態(tài)的文本數(shù)據(jù)可視化系統(tǒng)的設(shè)計(jì)方案。介紹了標(biāo)簽云的可視化方法,并從提取關(guān)鍵詞、計(jì)算單詞尺寸、布局算法和分析布局算法效果等層面提出了基于詞頻統(tǒng)計(jì)的文本化數(shù)據(jù)可視化方案,展示了文本化數(shù)據(jù)可視化的結(jié)果圖景。

關(guān)鍵詞:配電網(wǎng);設(shè)備狀態(tài);文本化數(shù)據(jù)可視化系統(tǒng)

0引言

隨著經(jīng)濟(jì)建設(shè)的進(jìn)程逐漸加快,人們對(duì)電能的需求不斷攀升,電網(wǎng)規(guī)模日益擴(kuò)大,配電網(wǎng)設(shè)備在運(yùn)行時(shí)產(chǎn)生的狀態(tài)數(shù)據(jù)信息越來越多。眾所周知,實(shí)時(shí)監(jiān)控與分析配電網(wǎng)設(shè)備狀態(tài)數(shù)據(jù),有利于避免配電網(wǎng)設(shè)備發(fā)生故障,最大程度地減少配電網(wǎng)設(shè)備的損失[1]。但是,用戶要想在海量的數(shù)據(jù)信息中洞察到配電網(wǎng)的整體情況存在著巨大的難度。為了幫助用戶更好地理解和分析配電網(wǎng)設(shè)備狀態(tài)的數(shù)據(jù)信息,建立一個(gè)能直觀呈現(xiàn)數(shù)據(jù)信息的可視化系統(tǒng)勢(shì)在必行。可視化系統(tǒng)基于人的視覺敏感度,能將抽象數(shù)據(jù)轉(zhuǎn)化成直觀的圖形或圖像,具有交互性特點(diǎn)的技術(shù)[2]。該技術(shù)如果應(yīng)用于配電網(wǎng)設(shè)備狀態(tài)文本化數(shù)據(jù)中,將能增強(qiáng)用戶對(duì)配電網(wǎng)設(shè)備狀態(tài)的形象化認(rèn)知,提高用戶提取、分析、處理數(shù)據(jù)的速度。本文將針對(duì)配電網(wǎng)設(shè)備狀態(tài)數(shù)據(jù)進(jìn)行可視化探討,并提出配電網(wǎng)設(shè)備狀態(tài)的文本化數(shù)據(jù)可視化系統(tǒng)設(shè)計(jì)方案。重點(diǎn)介紹標(biāo)簽云的可視化方法,并從提取關(guān)鍵詞、計(jì)算單詞尺寸、布局算法和分析布局算法效果等層面提出基于詞頻統(tǒng)計(jì)的文本化數(shù)據(jù)可視化方案,展示文本化數(shù)據(jù)可視化的結(jié)果圖景。

1文本化數(shù)據(jù)可視化

由于人工處理文本信息的速度較慢,因此需借助文本分析技術(shù)以提高信息處理的效率。目前,可挖掘并提取文本信息的技術(shù)存在不少,然而這些文本分析技術(shù)在幫助人們分析數(shù)據(jù)方面仍存在一定的缺陷[3]。文本化數(shù)據(jù)可視化技術(shù)是一種基于人的圖像敏感度,以視覺符號(hào)的形式呈現(xiàn)大量文本中的文字或數(shù)據(jù),從而幫助人們迅速掌握關(guān)鍵信息的技術(shù)。在文本化數(shù)據(jù)可視化的研究領(lǐng)域,主要包括的類別為基于文本內(nèi)容、文本關(guān)系和多層信息的文本化數(shù)據(jù)可視化[4]。基于文本內(nèi)容的文本化數(shù)據(jù)可視化可分為基于詞頻的可視化和基于詞匯分布的可視化。基于文本內(nèi)容的文本化數(shù)據(jù)可視化能處理單個(gè)特定的文本和文檔集合等對(duì)象,主要目的是幫助用戶迅速掌握文本的整體內(nèi)容和重點(diǎn)信息,同時(shí)指導(dǎo)用戶對(duì)文本信息進(jìn)一步理解。基于文本關(guān)系的文本化數(shù)據(jù)可視化的主要研究對(duì)象包括文本內(nèi)部或文本與外部之間的關(guān)系,如文本內(nèi)部的語義結(jié)構(gòu)、主題的相似性、文本與外部的引用等。基于文本關(guān)系的文本化數(shù)據(jù)可視化一般使用樹狀圖或網(wǎng)絡(luò)圖展示文本或數(shù)據(jù)。基于多層信息的文本化數(shù)據(jù)可視化側(cè)重于結(jié)合信息的多個(gè)層面,研究用戶從更多層面和更深層次理解文本數(shù)據(jù)的方法。如一則新聞的熱點(diǎn)將根據(jù)時(shí)間的推移發(fā)生變化。其中文本數(shù)據(jù)的其它層面指的便是新聞的熱度和時(shí)間因素。

2標(biāo)簽云的可視化方法

當(dāng)配電網(wǎng)設(shè)備故障時(shí),往往通過文字語言的方式記錄配電網(wǎng)設(shè)備和線路中的問題。而以文字而并非結(jié)構(gòu)化的數(shù)據(jù)來描述,將降低人工處理信息的速度和效率,同時(shí)導(dǎo)致數(shù)據(jù)處理的出錯(cuò)率升高,難以確保信息的準(zhǔn)確度。為了解決該難題,配電網(wǎng)設(shè)備狀態(tài)文本化數(shù)據(jù)可視化設(shè)計(jì)將運(yùn)用基于詞頻統(tǒng)計(jì)的可視化手段顯示文本數(shù)據(jù),同時(shí)采用標(biāo)簽云的文本可視化方法[5]。下面將闡述標(biāo)簽云的實(shí)現(xiàn)過程。第一步,預(yù)處理階段。在提取完相關(guān)文本信息后,應(yīng)尋找出文本中表示特征的重點(diǎn)信息,并用于可視化的數(shù)據(jù)展示。同時(shí),需提取出對(duì)文檔主要內(nèi)容具有代表性的關(guān)鍵詞和關(guān)鍵詞的權(quán)重值,從而勾勒出文本信息的大致輪廓,幫助用戶從整體上了解文本信息的主要內(nèi)容。第二步,可視化的設(shè)計(jì)和展示階段。該階段的主要工作是依據(jù)從文本中提煉出的特征信息,有針對(duì)性地設(shè)計(jì)可視化的整體布局。針對(duì)標(biāo)簽云的方法,單詞的大小、位置和顏色等信息應(yīng)重點(diǎn)關(guān)注。這些關(guān)鍵信息的考量有利于從細(xì)節(jié)上完善文本或數(shù)據(jù)的可視化設(shè)計(jì)和展示,實(shí)現(xiàn)重點(diǎn)突出、主題鮮明的目標(biāo)。第三步,數(shù)據(jù)信息的呈現(xiàn)階段。在該階段,文本和數(shù)據(jù)信息將呈現(xiàn)給用戶,同時(shí)通過交互的形式積極采納用戶對(duì)文本或數(shù)據(jù)信息的反饋,使信息得到進(jìn)一步完善和補(bǔ)充,最大化地滿足用戶對(duì)文本信息理解和分析的需要。

3基于詞頻統(tǒng)計(jì)的文本化數(shù)據(jù)可視化設(shè)計(jì)方案

以上主要闡述了文本化數(shù)據(jù)可視化的基本概念和主要類型,并對(duì)標(biāo)簽云可視化方法的實(shí)現(xiàn)路徑進(jìn)行了重點(diǎn)說明。下面將針對(duì)配電網(wǎng)的設(shè)備狀態(tài),從提取關(guān)鍵詞、計(jì)算單詞尺寸、布局算法、分析布局算法效果等層面提出基于詞頻統(tǒng)計(jì)的文本化數(shù)據(jù)可視化設(shè)計(jì)方案。

3.1提取關(guān)鍵詞

在一篇文檔中,關(guān)鍵詞是指能代表文檔基本內(nèi)容和主要思想的詞語。一般而言,衡量文檔詞語重要性的方法是權(quán)重法,如布爾權(quán)重法、熵函數(shù)和TF-IDF權(quán)重法。本文將采用TF-IDF權(quán)重法提取關(guān)鍵詞,該方法具有算法簡(jiǎn)便、準(zhǔn)確度和召回率高等優(yōu)勢(shì)[6]。其基本思路是文檔中占據(jù)權(quán)重較高的單詞出現(xiàn)的次數(shù)相對(duì)較多,即TF(頻率)較高,而該單詞出現(xiàn)的次數(shù)和范圍在別的文檔中則相對(duì)較少,即IDF(文檔占總文檔的比例的倒數(shù)的對(duì)數(shù))較低。TF和IDF分別為:TF(ti,dj)=a+(1+a)×tf/Max(tf)(1)IDF(ti)=log(N/nl)(2)式中,a為調(diào)節(jié)因子;tf為單詞在文檔中出現(xiàn)的總次數(shù);Maxt(f)為全部單詞在文檔中出現(xiàn)頻率的最大值;N為文檔的總數(shù)目;nl為包括單詞l的文檔數(shù)量。其中,IDF的值越小,單詞出現(xiàn)的文檔數(shù)目越多。將TF和IDF結(jié)合起來對(duì)最終單詞權(quán)重進(jìn)行計(jì)算,有:weightij=tfi.j×idfl=tfi.j×logN(/n)j(3)在運(yùn)用TF-IDF進(jìn)行關(guān)鍵詞提取的過程中,將配電網(wǎng)設(shè)備狀態(tài)所有缺陷的描述都整理成一個(gè)文檔。

3.2計(jì)算單詞尺寸

作為視覺屬性,單詞的尺寸能凸顯單詞在文檔中的重要程度。一般而言,在標(biāo)簽云的方法中,根據(jù)頻度或權(quán)重依次遞減的順序?qū)卧~進(jìn)行排序。通常單詞的頻度或權(quán)重越大,其尺寸就越大,這將放大權(quán)重較大的單詞,凸顯其重要性。一般地,網(wǎng)頁在正文中往往選用13px或14px的字體,由于標(biāo)簽云最后需在屏幕上顯示,因此字體的最大尺寸將設(shè)置為100px,最小設(shè)置為13px。在單詞權(quán)重值的計(jì)算中,計(jì)算結(jié)果已得到歸一化的處理,權(quán)重取值位于0至1的區(qū)間,那么通過權(quán)重值就能容易地計(jì)算出單詞在屏幕上顯示的尺寸。

3.3布局算法

本文將使用D3.js方法實(shí)現(xiàn)標(biāo)簽云,該方法能凸顯權(quán)重大的單詞,最大化地利用文檔空間,實(shí)現(xiàn)良好的文檔布局效果[7]。在配電網(wǎng)設(shè)備狀態(tài)的文本化數(shù)據(jù)可視化系統(tǒng)設(shè)計(jì)中,本文將運(yùn)用單詞擺放算法,根據(jù)權(quán)重值大小依次遞減的順序?qū)卧~進(jìn)行排序,即首先將權(quán)重最大的關(guān)鍵性的單詞擺放到離布局中心最近的位置,其次擺放剩下的關(guān)鍵性的單詞。如果文檔檢測(cè)到擺放的單詞與之前擺放的單詞重復(fù),那么將該單詞調(diào)換到新的地方,再對(duì)重復(fù)的單詞進(jìn)行二次檢測(cè)。循環(huán)以上步驟,如果全部的關(guān)鍵詞都合理地放置在相應(yīng)的位置且不存在重疊的現(xiàn)象,那么整個(gè)流程結(jié)束。在布局算法實(shí)現(xiàn)的過程中,值得注意的是重疊檢測(cè)和對(duì)單詞進(jìn)行二次擺放的策略。重疊檢測(cè)是影響布局算法效率的重要因素。通常來說,提高重疊檢測(cè)算法速度的主要方法是層次包圍盒[8],其主要工作理念是空間分解,在挑選出長(zhǎng)方形、圓形等幾何特性較簡(jiǎn)單的包圍盒后,根據(jù)包圍盒面積大小依次遞減的順序?qū)鼑羞M(jìn)行分解,從而得到原來圖形的幾何屬性。可通過建立樹的數(shù)據(jù)結(jié)構(gòu)來表示包圍盒的層次關(guān)系,最后繼續(xù)測(cè)試包圍盒重疊處。在調(diào)整位置的策略方面,本文選擇的是朝著360°方向從近到遠(yuǎn)地移動(dòng)關(guān)鍵詞的位置,直到找到不產(chǎn)生重疊的區(qū)域。該策略的優(yōu)點(diǎn)在于最先擺放的單詞將一直處于中心區(qū)域。具體而言,在調(diào)整位置的過程中,本文使用了在阿基米德螺線處移動(dòng)的策略[9]。阿基米德螺線是指如果點(diǎn)Q在射線OA中做勻速運(yùn)動(dòng),OA以勻速的角速度繞著O點(diǎn)旋轉(zhuǎn),那么Q點(diǎn)的運(yùn)動(dòng)軌跡就是阿基米德螺線。阿基米德螺線的主要特點(diǎn)是每?jī)蓷l曲線相隔2πα。基于此特點(diǎn),在調(diào)整位置時(shí)可使尋找到的新位置在螺旋線上朝著距離中心較遠(yuǎn)的方向轉(zhuǎn)移,以使處于布局中心處的單詞緊密相連。如果在直線上而不是在阿基米德螺線上移動(dòng),那么難以達(dá)到提高空間利用率的要求。

3.4分析布局算法效果

布局算法效果的衡量需借助一定的評(píng)估參數(shù),本文采用的可量化的評(píng)估參數(shù)分別是布局算法的實(shí)際運(yùn)行時(shí)間t、詞語與界面中心之間的平均距離dave和可覆蓋全部詞語的最小矩形面積Smin。

4可視化結(jié)果

在配電網(wǎng)設(shè)備狀態(tài)的文本化數(shù)據(jù)可視化系統(tǒng)中,最終應(yīng)呈現(xiàn)一幅可視化的效果圖景,即單詞均勻集中在一個(gè)平面,平面整體簡(jiǎn)潔大方,單詞之間互不重疊,關(guān)鍵詞尺寸依據(jù)各自的權(quán)重程度而大小不同。基于人的視覺感知,標(biāo)簽云的可視化方法能生動(dòng)形象地呈現(xiàn)出關(guān)鍵詞權(quán)重大小的差異。該文本化數(shù)據(jù)可清晰、直觀地展現(xiàn)出配電網(wǎng)的設(shè)備狀態(tài),有利于調(diào)度人員根據(jù)可視化的結(jié)果迅速判斷出配電網(wǎng)設(shè)備存在的問題,從而及時(shí)做出調(diào)整,加強(qiáng)對(duì)設(shè)備的監(jiān)控與管理。同時(shí),用戶交互是文本化數(shù)據(jù)可視化系統(tǒng)中必不可少的一部分。具體地說,用戶交互是指用戶通過高亮、縮放等操作接觸系統(tǒng)實(shí)現(xiàn)文本和數(shù)據(jù)信息的傳播,促進(jìn)用戶對(duì)數(shù)據(jù)的理解與分析,及用戶對(duì)信息的完善與補(bǔ)充。

5結(jié)語

本文主要針對(duì)配電網(wǎng)設(shè)備狀態(tài)數(shù)據(jù)進(jìn)行了可視化的研究,提出了配電網(wǎng)設(shè)備狀態(tài)的文本化數(shù)據(jù)可視化系統(tǒng)的設(shè)計(jì)方案。首先介紹了文本可視化的相關(guān)概念和基本特點(diǎn),其次介紹了標(biāo)簽云的可視化方法的實(shí)現(xiàn)路徑,并從提取關(guān)鍵詞、計(jì)算單詞尺寸、布局算法和分析布局算法效果等層面提出了基于詞頻統(tǒng)計(jì)的文本化數(shù)據(jù)可視化方案,最后展示了文本化數(shù)據(jù)可視化的結(jié)果圖景。

參考文獻(xiàn)

[1]鄧安明,鄭建鴻,宣磊,等.基于6LoWPAN的物聯(lián)網(wǎng)通信技術(shù)在配電網(wǎng)設(shè)備狀態(tài)監(jiān)控方面的研究與應(yīng)用[J].智能城市,2017(5):98-99.

[2]唐家渝,劉知遠(yuǎn),孫茂松.文本可視化研究綜述[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2013,25(3):273-285.

[3]楊光.電網(wǎng)可視化技術(shù)[J].國際電力,2004,8(2):45-47.

[4]林躍.基于語義的文本可視化研究[D].哈爾濱:哈爾濱工程大學(xué),2014.

[5]駱逸欣.文本數(shù)據(jù)可視化之標(biāo)簽云[J].電子技術(shù)與軟件工程,2017(13):197-198.

[6]施聰鶯,徐朝軍,楊曉江.TFIDF算法研究綜述[J].計(jì)算機(jī)應(yīng)用,2009,29(b06):167-170.

[7]趙聰.可視化庫D3.js的應(yīng)用研究[J].信息技術(shù)與信息化,2015(2):107-109.

[8]關(guān)振群,宋超,顧元憲,等.有限元網(wǎng)格生成方法研究的新進(jìn)展[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(1):1-14.

作者:吳楚 王金芹 金月 單位:云南電網(wǎng)有限責(zé)任公司瑞麗供電局

主站蜘蛛池模板: 久草超碰在线 | 国产第一页在线观看 | 天天干天天做 | 精品视频在线播放 | 亚洲一区二区观看 | 美女免费av| 噼里啪啦国语版在线观看 | 97超碰在线播放 | 日韩视频免费观看 | 久久久久久久久网站 | 国产精品自拍小视频 | 久久亚洲综合 | 热久久中文字幕 | 亚洲黄色录像 | 91视频麻豆 | 一区二区三区视频免费看 | 久久免费国产视频 | 亚洲a v网站 | 欧美性猛交xxxx乱 | 亚洲色图一区二区三区 | 国产青青操| 亚洲成人免费看 | 亚洲激情视频 | 国产成人免费看 | 国产精彩视频 | 国产 日韩 欧美 综合 | 激情四射av | 欧美美女一区二区 | 男人av的天堂 | 久久综合久色欧美综合狠狠 | 久久久综合色 | 午夜高清视频 | 小舞的淫辱日记(h)小说 | 亚洲自拍偷拍视频 | 毛片av网站| 亚洲欧美另类在线 | 天天插综合 | 一区二区三区免费视频观看 | 日韩精品小视频 | 天天综合网久久综合网 | 二区三区在线视频 |