日韩视频专区_久久精品国产成人av_青青免费在线视频_欧美精品一级片_日韩在线观看中文字幕_九九热在线精品

美章網(wǎng) 資料文庫(kù) GA-RS-LR算法下公司財(cái)務(wù)與個(gè)股投資研究范文

GA-RS-LR算法下公司財(cái)務(wù)與個(gè)股投資研究范文

本站小編為你精心準(zhǔn)備了GA-RS-LR算法下公司財(cái)務(wù)與個(gè)股投資研究參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

GA-RS-LR算法下公司財(cái)務(wù)與個(gè)股投資研究

摘要

運(yùn)用遺傳算法-粗糙集-邏輯回歸方法(GA-RS-LR)探討我國(guó)A股上市公司財(cái)務(wù)與股票收益的關(guān)系.運(yùn)用GA-RS方法獲得財(cái)務(wù)指標(biāo)最優(yōu)約簡(jiǎn);運(yùn)用LR模型探求兩者關(guān)系.最終,經(jīng)GA-RS約簡(jiǎn),60個(gè)財(cái)務(wù)指標(biāo)中有17個(gè)對(duì)股票投資有重要影響;通過LR模型,4個(gè)指標(biāo)具有顯著效應(yīng);其中,負(fù)債與權(quán)益市價(jià)比為5.82%負(fù)效應(yīng),其余為正效應(yīng).對(duì)2015年股票相對(duì)波動(dòng)進(jìn)行預(yù)測(cè)得到70%的準(zhǔn)確率,驗(yàn)證了GA-RS-LR模型對(duì)中長(zhǎng)期投資的有效性.

關(guān)鍵詞

遺傳算法-粗糙集;邏輯回歸;股票收益;公司財(cái)務(wù)

1引言

股票市場(chǎng)對(duì)一個(gè)國(guó)家和地區(qū)的經(jīng)濟(jì)發(fā)展動(dòng)向有前導(dǎo)作用.股票收益受到宏觀經(jīng)濟(jì)現(xiàn)狀、政策、公司財(cái)務(wù)、投資者情緒等因素影響.研究股票收益問題一直是學(xué)術(shù)界的研究熱點(diǎn).目前,學(xué)術(shù)界對(duì)股價(jià)與上市公司財(cái)務(wù)之間關(guān)系的探討主要從兩方面入手.一是通過建立計(jì)量模型來(lái)探求股票與其影響因素的關(guān)系,進(jìn)而對(duì)股價(jià)進(jìn)行分析與預(yù)測(cè)[1,2].然而計(jì)量模型對(duì)數(shù)據(jù)平穩(wěn)性、正態(tài)性等有嚴(yán)格限定,直接利用很難達(dá)到預(yù)期結(jié)果.股票市場(chǎng)數(shù)據(jù)體量巨大、類型繁多,故很多學(xué)者轉(zhuǎn)而選用數(shù)據(jù)挖掘方法來(lái)探究其關(guān)系.如有不少學(xué)者就運(yùn)用遺傳算法[3]、BP神經(jīng)網(wǎng)絡(luò)[4]等得到了較為理想的結(jié)果.粗糙集(RoughSets)理論[5,6]由波蘭數(shù)學(xué)家PawlakZ于1982年所提出.這是一種用于處理含糊和不確定信息的新型數(shù)學(xué)工具,具有優(yōu)越的知識(shí)簡(jiǎn)化能力.粗糙集理論利用現(xiàn)有知識(shí)庫(kù)對(duì)不精確的知識(shí)進(jìn)行近似描述[7].RS方法不需預(yù)先假定概率分布,也不需像模糊集理論一樣假設(shè)模糊隸屬函數(shù)的結(jié)構(gòu),而是僅僅利用數(shù)據(jù)本身提供的信息.目前對(duì)粗糙集的研究主要集中于其數(shù)學(xué)性質(zhì),理論的擴(kuò)展以及與其他智能方法的融合與有效算法等[8].杜婷(2012)將粗糙集運(yùn)用到了個(gè)人信用評(píng)估模型之中,并取得了良好的約簡(jiǎn)結(jié)果[9].王剛、楊善林將粗糙集與支持向量機(jī)相結(jié)合,以分析網(wǎng)絡(luò)商品評(píng)論中的情感進(jìn)行分析,實(shí)證表明,RS-SVM方法可以提高網(wǎng)絡(luò)用戶情感分析的準(zhǔn)確程度[10].邏輯回歸方法由vethulst首次提出.1980年,Ohlson率先將邏輯回歸模型用于財(cái)務(wù)危機(jī)預(yù)警,分析樣本公司在破產(chǎn)概率區(qū)間上的分布以及兩類錯(cuò)誤和分割點(diǎn)之間的關(guān)系,并得到高預(yù)測(cè)準(zhǔn)確率[11].劉遵雄、黃志強(qiáng)等(2012)在邏輯回歸的基礎(chǔ)上進(jìn)行完善,提出了基于平滑小編絕對(duì)偏離(SCAD)懲罰邏輯回歸模型,運(yùn)用到財(cái)務(wù)預(yù)警,實(shí)驗(yàn)結(jié)果表明SCAD懲罰邏輯回歸模型的分類效果更好[12].因此Logistic回歸法在經(jīng)濟(jì)領(lǐng)域的研究受到了極大關(guān)注.基于此,本文提出了遺傳算法-粗糙集-邏輯回歸(GA-RS-LR)數(shù)據(jù)挖掘技術(shù),用于探究股票投資與上市公司財(cái)務(wù)指標(biāo)體系的內(nèi)在聯(lián)系.運(yùn)用GA-RS模型得到最優(yōu)財(cái)務(wù)約簡(jiǎn)指標(biāo).并在此之上利用逐步回歸法與Logistic回歸模型以探究公司財(cái)務(wù)與股票收益的確切關(guān)系.最終得到上市公司財(cái)務(wù)指標(biāo)不同大類之間與個(gè)股投資概率之間的正負(fù)效應(yīng)關(guān)系及其影響大?。?/p>

2GA-RS-LR模型構(gòu)建

2.1GA-RS約簡(jiǎn)模型

粗糙集理論的屬性約簡(jiǎn)算法可分為是盲目刪除屬性約簡(jiǎn)算法與啟發(fā)式算法.遺傳算法作為啟發(fā)式算法中的一種,具有全局優(yōu)化和隱含并行的特點(diǎn),在解決復(fù)雜問題中具有明顯優(yōu)勢(shì).遺傳算法在屬性約簡(jiǎn)問題中需要具體考慮的因素如下:染色體編碼:設(shè)條件屬性集合為C={c1,c2,…,cn},則條件屬性空間ΩC可映射為遺傳算法的染色體.每個(gè)染色體用n維的{0,1}二進(jìn)制位串表示,每一位對(duì)應(yīng)一個(gè)條件屬性.若染色體上某一位取值為1則表示選擇該條件屬性;若某位取值為0,則表示剔除該條件屬性.由此染色體個(gè)體與屬性子集就建立了一一對(duì)應(yīng)關(guān)系.適應(yīng)值函數(shù)構(gòu)造:適應(yīng)值函數(shù)作為評(píng)估染色體的優(yōu)劣指標(biāo),其形式直接決定了種群的進(jìn)化行為[13].在屬性約簡(jiǎn)問題中,可將適應(yīng)值函數(shù)定義如式(1).式中,card(x)表示染色體中1的個(gè)數(shù).γC(D)(x)表示條件屬性集C的相對(duì)依賴度.POSCx(D)表示條件屬性集合Cx的相對(duì)正域.f(x)的目標(biāo)是使x中值為1的個(gè)數(shù)最少,使屬性集盡可能的約簡(jiǎn).γC(D)(x)的目標(biāo)是使x的相對(duì)依賴度最大.兩者結(jié)合正好滿足屬性約簡(jiǎn)的原理。選擇概率:選擇指從當(dāng)前種群中選擇適應(yīng)值高的優(yōu)良個(gè)體以生成交配池.設(shè)種群為G={x1,x2,…,xM},對(duì)xi∈G,其被選擇的概率設(shè)定為式(2).式中,F(xiàn)(xi)表示xi的適應(yīng)值.其值越高,被選擇的概率也越大,從而該染色體的優(yōu)良特性被保留下來(lái)的概率也就越大.交叉與變異:交叉運(yùn)算是指從交配池中隨機(jī)選取兩個(gè)體進(jìn)行位串,從而得到新一代基因個(gè)體的過程.由于核所包含的屬性必須存在于每一個(gè)個(gè)體中,因此采用一致交叉運(yùn)算以保證核所對(duì)應(yīng)基因位的取值為1.變異運(yùn)算指按照變異概率pm對(duì)調(diào)某位基因的二進(jìn)制字符數(shù)值的過程.變異可確保種群多樣性,避免陷入局部最優(yōu)的困境,但變異太頻繁,反而使得種群不穩(wěn)定.為維持種群穩(wěn)定性,pm一般設(shè)置在0.01~0.2之間.算法終止條件:連續(xù)t次迭代之后,若最優(yōu)個(gè)體適應(yīng)值不再提高,則認(rèn)為已經(jīng)近似找到最優(yōu)染色體,計(jì)算終止.GA-RS約簡(jiǎn)的具體流程見圖1.

2.2LogitRegression模型

通過GA-RS約簡(jiǎn),條件屬性集與決策屬性集之間的確定關(guān)系并沒凸顯出來(lái).因此,在GA-RS約簡(jiǎn)后,引入LR模型以探究?jī)烧咧g的可度量關(guān)系.假設(shè)某事件Y滿足:Y=1,事件發(fā)生;Y=0,事件不發(fā)生;且發(fā)生概率為p.若存在k個(gè)相互獨(dú)立的變量X′=(x1,x2,…,xk)與事件Y相關(guān),且X與事件Y發(fā)生概率之間滿足關(guān)系式(3),事件Y的發(fā)生概率與未發(fā)生概率之比取對(duì)數(shù)便可得到Logistic函數(shù)(4):LR模型的理論約束相對(duì)寬松,無(wú)須對(duì)變量進(jìn)行分布類型、協(xié)方差陣等的假定,但LR模型對(duì)變量之間的共線性干擾卻相對(duì)敏感.而GA-RS約簡(jiǎn)只保證屬性集合的重要性,而沒有考慮獨(dú)立性.若直接采用LR模型進(jìn)行擬合,由于個(gè)指標(biāo)之間的共線性影響,模型的擬合效果將受到干擾,甚至出現(xiàn)錯(cuò)誤的模型.故本文選擇逐步回歸法,通過變量篩選來(lái)處理多重共線性問題,最終得到最優(yōu)LR模型.

3GA-RS-LR模型實(shí)證

3.1數(shù)據(jù)選取與處理

以我國(guó)上海交所與深交所上市的A股上市公司為依據(jù),選取2014年下半年內(nèi)數(shù)據(jù)完整、具有不同行業(yè)分類的非ST、非*ST的上市公司作為樣本.提取公司財(cái)務(wù)季度指標(biāo)60個(gè),個(gè)股開盤價(jià)、收盤價(jià),上證綜合開盤指數(shù)、收盤指數(shù)等指標(biāo),最終得到樣本913個(gè).其中財(cái)務(wù)指標(biāo)體系的分布見表1不同指標(biāo)之間量綱不同,同一指標(biāo)不同個(gè)體之間的差別各異,直接利用原始數(shù)據(jù)進(jìn)行分析,不僅會(huì)增大模型的復(fù)雜度,還會(huì)造成結(jié)果的不理想.故運(yùn)用K-均值聚類對(duì)各項(xiàng)指標(biāo)進(jìn)行逐一聚類,并最終將公司就不同指標(biāo)分別分為3類.由于公司財(cái)務(wù)報(bào)表的公布具有時(shí)滯性,股票數(shù)據(jù)選取也將延后一個(gè)季度.同時(shí),考慮到投資者投資其他領(lǐng)域而非股票所造成的機(jī)會(huì)成本,本文用上證綜指收益率作為基準(zhǔn)收益率:當(dāng)大盤指數(shù)上升時(shí),若個(gè)股上升幅度更大,則認(rèn)為該個(gè)股為強(qiáng)勢(shì)股,值得投資;反之,投資該個(gè)股并非明智之舉.同理,當(dāng)大盤指數(shù)下降時(shí),若個(gè)股下降幅度更小,則該個(gè)股是抗壓股;反之.基于此將股票分為2類.“好”為具有投資價(jià)值的強(qiáng)勢(shì)股或者抗壓股;“差”為不值得投資的股票.

3.2GA-RS屬性約簡(jiǎn)

在對(duì)離散化數(shù)據(jù)進(jìn)行GA-RS屬性約簡(jiǎn)之前,需要設(shè)定遺傳算法的參數(shù).約簡(jiǎn)后,影響股價(jià)相對(duì)收益率的財(cái)務(wù)指標(biāo)從60個(gè)變量縮減為17個(gè).約簡(jiǎn)集合相對(duì)決策屬性的依賴度都達(dá)到了100%,這表明該約簡(jiǎn)結(jié)果對(duì)決策屬性的解釋度100%.約簡(jiǎn)后的指標(biāo)分布見表3可知,發(fā)展能力指標(biāo)數(shù)目最多,共6個(gè)指標(biāo);其次是償債能力.考慮到時(shí)滯性,該17個(gè)約簡(jiǎn)指標(biāo)應(yīng)是股票價(jià)格波動(dòng)的領(lǐng)先指標(biāo),對(duì)下期的股價(jià)相對(duì)波動(dòng)有著顯著的影響.投資者在決策時(shí)應(yīng)重點(diǎn)關(guān)注.

3.3Logistic回歸與逐步回歸

通過GA-RS約簡(jiǎn)后,財(cái)務(wù)指標(biāo)得到了極大的簡(jiǎn)化,但是GA-RS屬性約簡(jiǎn)只能保證上市公司財(cái)務(wù)指標(biāo)屬性集對(duì)個(gè)股相對(duì)波動(dòng)率的相對(duì)重要性,而沒有給出兩者之間更為確切的關(guān)系.因而引入LR模型對(duì)約簡(jiǎn)的財(cái)務(wù)指標(biāo)與股票波動(dòng)的相互關(guān)系做更為細(xì)致準(zhǔn)確的刻畫.同時(shí),對(duì)財(cái)務(wù)指標(biāo)體系而言,計(jì)算過程中所運(yùn)用的基礎(chǔ)數(shù)據(jù)有交叉,故指標(biāo)之間存在很強(qiáng)的相關(guān)性.這一缺陷會(huì)導(dǎo)致財(cái)務(wù)指標(biāo)之間存在比較嚴(yán)重的共線性,如果直接使用LR模型將極大減弱模型的擬合效果.因此,在LR模型中使用逐步回歸法進(jìn)行變量篩選,消除變量之間的共線性,從而精簡(jiǎn)模型.通過計(jì)算17個(gè)約簡(jiǎn)指標(biāo)的VIF值可知,固定資產(chǎn)增長(zhǎng)率、銷售費(fèi)用本增長(zhǎng)率的VIF都超過5,說(shuō)明變量之間存在共線性.利用逐步回歸法得到的LR模型中變量的VIF值見表4.可以發(fā)現(xiàn),此時(shí)各變量之間已不存在共線性問題.設(shè)樣本中個(gè)股為強(qiáng)勢(shì)股或者抗壓股的概率為p,則該個(gè)股值得投資的概率也就等于p,進(jìn)而個(gè)股投資概率比p/(1-p)與4個(gè)財(cái)務(wù)指標(biāo)之間的回歸方程為:括號(hào)里為相應(yīng)參數(shù)估計(jì)的z值,通過z值可知模型已通過檢驗(yàn).根據(jù)式(5)得到個(gè)股為抗壓股的概率p與財(cái)務(wù)指標(biāo)之間的關(guān)系,即Logistic模型為:可知,負(fù)債與權(quán)益市價(jià)比率對(duì)股票投資概率的影響最大.x1每變動(dòng)1單位,股票為抗壓股的投資概率之比則相應(yīng)變化-5.819%.由于負(fù)債與權(quán)益市價(jià)比率指標(biāo)屬于償債能力的指標(biāo)大類,該指標(biāo)主要用來(lái)衡量負(fù)債與權(quán)益資金的相對(duì)比重.其值愈大,公司自有資金愈少,對(duì)債權(quán)人的保障愈少.因而,對(duì)股價(jià)的波動(dòng)將產(chǎn)生負(fù)效應(yīng).相比之下,固定資產(chǎn)增長(zhǎng)率、存貨周轉(zhuǎn)率、普通股獲利率對(duì)個(gè)股投資概率比則為正效應(yīng).它們分別反應(yīng)了公司發(fā)展?fàn)顩r與預(yù)期,經(jīng)營(yíng)管理能力,以及每股股息的實(shí)得利率.其對(duì)股票投資價(jià)值的影響分別為0.824%、0.12%、1.009%.此外,除了這4個(gè)上市公司財(cái)務(wù)指標(biāo)之外的其他影響因素對(duì)個(gè)股投資概率比的綜合影響也表現(xiàn)為負(fù)效應(yīng),大約為4.056個(gè)百分點(diǎn).為驗(yàn)證模型有效性,以2014年第4季度財(cái)務(wù)指標(biāo)為自變量,2015年第1季度股票投資比為應(yīng)變量進(jìn)行模型預(yù)測(cè)檢驗(yàn),得到900個(gè)樣本的預(yù)測(cè)準(zhǔn)確度為70%.這表明大約有630個(gè)上市公司的個(gè)股波動(dòng)可以通過上一期的GA-RS-LR模型得到準(zhǔn)確預(yù)測(cè).這對(duì)價(jià)值型的中長(zhǎng)期投資者具有一定的參考意義.

4結(jié)論

本文提出了遺傳算法-粗糙集-邏輯回歸方法(GA-RS-LR)探究股價(jià)相對(duì)收益率與財(cái)務(wù)指標(biāo)的關(guān)系.利用K-均值聚類進(jìn)行離散化處理,既解決了數(shù)據(jù)量綱不一致的問題,又使同一類別相似個(gè)體之間的差異被忽略,而不同類別之間的差異被放大.通過選用GA-RS方法以約簡(jiǎn)眾多的財(cái)務(wù)指標(biāo).最終得到由17個(gè)指標(biāo)所組成的約簡(jiǎn)體系,且RS約簡(jiǎn)的相對(duì)依賴度為100%.基于約簡(jiǎn)指標(biāo)數(shù)據(jù),利用逐步回歸法對(duì)LR模型進(jìn)行變量篩選,解決共線性問題.最終得到上市公司財(cái)務(wù)指標(biāo)不同大類之間與個(gè)股投資概率比之間的正負(fù)效應(yīng)關(guān)系及其影響大小,并得到70%的預(yù)測(cè)準(zhǔn)確度,驗(yàn)證了GA-RS-LR模型對(duì)中長(zhǎng)期投資所具有的優(yōu)勢(shì).

參考文獻(xiàn)

[1]陳玉山,席斌.獨(dú)立成分分析方法在股票分析中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(6):1473-1476.

[2]吳榮盛.全流通條件下的股票價(jià)格與財(cái)務(wù)信息的相關(guān)性研究-來(lái)自我國(guó)滬深300指數(shù)的實(shí)證研究[D].成都:西南財(cái)經(jīng)大學(xué)經(jīng)濟(jì)學(xué)院,2014.

[3]胡冰,潘福錚,胡清鋒.遺傳算法在股票短期投資決策中的運(yùn)用[J].系統(tǒng)工程與實(shí)踐,2003,23(2):7-13.、

[4]王莎.BP神經(jīng)網(wǎng)絡(luò)在股票預(yù)測(cè)中的應(yīng)用研究[D].長(zhǎng)沙:中南大學(xué)商學(xué)院,2008.

[7]董威.粗糙集理論及其數(shù)據(jù)挖掘應(yīng)用[M].沈陽(yáng):東北大學(xué)出版社,2009.

[8]王國(guó)胤.Rough集理論在不完備信息系統(tǒng)下的擴(kuò)充[J].計(jì)算機(jī)研究與發(fā)展,2002,39(10):1238-1243.

[9]杜婷.基于粗糙集支持向量機(jī)的個(gè)人信用評(píng)估模型[J].統(tǒng)計(jì)與決策,2012,1(13):94-96.

[10]王剛,楊善林.基于RS-SVM的網(wǎng)絡(luò)商品評(píng)論情感分析研究[J].計(jì)算機(jī)科學(xué),2013,40(11):274-277.

[12]劉遵雄,黃志強(qiáng),孫清,張恒.SCAD懲罰邏輯回歸的財(cái)務(wù)預(yù)警模型[J].統(tǒng)計(jì)與信息論壇,2012,27(12):21-26.

作者:瞿尚薇 王斌會(huì) 單位:暨南大學(xué)

主站蜘蛛池模板: 青青草视频网 | 国产精品成人在线视频 | 国产精品中文字幕在线观看 | 成人免费大片黄在线播放 | 成人做爰视频www | 69国产精品 | 97超碰免费观看 | 亚洲天堂男人的天堂 | 超碰在线公开 | 欧美双插 | 欧美三级欧美一级 | 中文字幕国产精品 | 久久免费播放视频 | 青青操国产 | 一季繁星越南剧在线观看免费 | 天天综合天天色 | 日本www视频在线观看 | www视频在线免费观看 | 欧美色精品 | 国产精品久久久久久久久久久久久久久久 | 色婷婷综合网 | 久久a毛片 | 中文字幕在线观看你懂的 | 97免费在线观看视频 | 国产激情在线视频 | 国产精品大全 | 天天做天天爱天天爽综合网 | 在线观看不卡一区 | 亚洲午夜伦理 | 欧美大片18 | 中文字幕永久在线视频 | 污片在线看 | 懂色av成人一区二区三区 | 综合久久综合 | 国产成人99久久亚洲综合精品 | 精品免费看| 日韩av一 | 丝袜超碰 | 国产精品二区视频 | 午夜一级黄色片 | 你懂的在线网站 |