本站小編為你精心準(zhǔn)備了基因組單核苷酸多態(tài)性運(yùn)用參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫(xiě)作靈感。歡迎深入閱讀并收藏。

1人類(lèi)基因組
人類(lèi)基因組計(jì)劃已經(jīng)取得了顯著的進(jìn)展,約占整個(gè)基因組6.3%的DNA序列已被測(cè)定,已鑒定的基因7484個(gè),約1萬(wàn)條人類(lèi)基因的序列已被克隆。人類(lèi)基因組全序列測(cè)定預(yù)計(jì)可以提前在2003年完成[1]。人類(lèi)基因組是一個(gè)十分穩(wěn)定的體系,不同的民族、群體和個(gè)體都有46條染色體,有相同數(shù)目的基因和基因分布,也有基本相同的核苷酸序列。正是基因組結(jié)構(gòu)的這種穩(wěn)定性保證了人類(lèi)作為一個(gè)物種的共同性和穩(wěn)定性,也決定了目前基因組測(cè)定是有意義的,即有代表性的。
然而人類(lèi)基因組又是一個(gè)變異的體系。在長(zhǎng)期進(jìn)化的過(guò)程中,基因組的DNA序列不斷地發(fā)生變異。這些變異可能是有害的、有益的或中性的,它們其中的一些被保存下來(lái),導(dǎo)致了不同種族、群體和個(gè)體間基因組的差異或多態(tài)性。除了同卵雙生子外,沒(méi)有兩個(gè)個(gè)體的基因組是完全相同的。隨著基因組測(cè)序的進(jìn)展,全面深入地了解個(gè)體和群體間基因組的變異或多態(tài)性已成為可能,并日益顯示其重要性。這不僅因?yàn)楦嗟亩鄳B(tài)性標(biāo)記有助于基因的鑒定和定位,同時(shí)通過(guò)建立序列變異與表型、序列變異與疾病風(fēng)險(xiǎn)之間的關(guān)系,將把對(duì)疾病,特別是對(duì)復(fù)雜疾病的預(yù)防、診斷和治療置于堅(jiān)實(shí)的遺傳學(xué)基礎(chǔ)上,從而使人類(lèi)基因組計(jì)劃給人類(lèi)健康帶來(lái)實(shí)際的利益。
人類(lèi)基因組中的遺傳多態(tài)性較多地表現(xiàn)在重復(fù)序列,特別是短串聯(lián)重復(fù)序列,如小衛(wèi)星DNA和微衛(wèi)星DNA,它們的多態(tài)性主要是基于重復(fù)序列拷貝數(shù)的變異。微衛(wèi)星DNA位點(diǎn)在人類(lèi)基因組中數(shù)以千計(jì),它們分布廣泛,是很好的遺傳標(biāo)記。另一類(lèi)更加普遍的多態(tài)性是基因組中散在的單個(gè)堿基的不同。這種不同雖然也包括單個(gè)堿基的缺失和插入,但更多的是單個(gè)堿基的置換,即單核苷酸的多態(tài)性(singlenucleotidepolymorphism,SNP)。SNP為數(shù)眾多,分布廣泛。如果比較任意兩條同源染色體的堿基序列,那么平均約1000堿基對(duì)(bp)就有一個(gè)堿基不同。單個(gè)堿基變異能導(dǎo)致基因功能異常者習(xí)慣上被稱(chēng)為突變。
隨著人類(lèi)基因組計(jì)劃的進(jìn)展,人們愈來(lái)愈相信基因組中的這類(lèi)多態(tài)性有助于解釋個(gè)體的表型差異、不同群體和個(gè)體對(duì)疾病,特別是對(duì)復(fù)雜疾病的易感性、以及對(duì)各種藥物的耐受性和對(duì)環(huán)境因子的反應(yīng)。因此,尋找研究SNP已成為人類(lèi)基因組計(jì)劃的內(nèi)容和目標(biāo)之一[1,2]。例如美國(guó)國(guó)立衛(wèi)生研究院(NIH)在1998年準(zhǔn)備斥資4000萬(wàn)美元就SNP的檢測(cè)技術(shù)及應(yīng)用進(jìn)行招標(biāo),并強(qiáng)調(diào)SNP計(jì)劃的迫切性[3,4]。本文擬在對(duì)人類(lèi)基因組SNP作一簡(jiǎn)要說(shuō)明的基礎(chǔ)上,著重介紹SNP的醫(yī)學(xué)意義及其應(yīng)用,并兼及一些發(fā)展中的批量鑒定和檢出SNP的方法。
2單核苷酸多態(tài)性
單核苷酸多態(tài)性(SNP)是指基因組內(nèi)特定核苷酸位置上存在兩種不同的堿基,其中最少一種在群體中的頻率不小于1%。盡管遺傳密碼由4種堿基組成,但SNP通常只是1種二等位基因的(biallelic),或二態(tài)的遺傳變異。SNP作為一種堿基的替換,大多數(shù)為轉(zhuǎn)換,即一種嘧啶堿基換為另一種嘧啶堿基或一種嘌呤堿基換為另一種嘌呤堿基,轉(zhuǎn)換與顛換之比2∶1。SNP在CG序列上出現(xiàn)最為頻繁,而且多是C→T,原因是CG中C即胞嘧啶常為甲基化的、自發(fā)地脫氨后即成為胸嘧啶。人類(lèi)基因組中共有多少SNP位點(diǎn),目前尚難以確定,這主要是因?yàn)檫€不確知單堿基變異的程度,而各作者對(duì)此估計(jì)不完全相同,有作者估計(jì)每400bp就有1個(gè)堿基不同,另一些作者估計(jì)堿基的變異頻率在0.5‰~10‰之間。
如果假定1/1000的堿基是多態(tài)的話(huà),那么人類(lèi)30億堿基中當(dāng)有約三百萬(wàn)SNP位點(diǎn)。由此可見(jiàn),SNP數(shù)比微衛(wèi)星標(biāo)記數(shù)要高出幾個(gè)數(shù)量級(jí)。盡管就單個(gè)SNP而言只有兩種變異體,變異程度不如微衛(wèi)星或小衛(wèi)星DNA。但SNP在基因組中數(shù)量巨大,分布頻密,因此就整體而論,它們的多態(tài)性要高得多。而且由于SNP是二態(tài)的,易于自動(dòng)化批量檢測(cè),因而被認(rèn)為是新一代的遺傳標(biāo)記(第1代的遺傳標(biāo)記是RFLP,第2代是各種短串聯(lián)重復(fù)序列STR標(biāo)記)。目前的SNP計(jì)劃希望首先鑒別出已知基因的cSNP,然后在5年內(nèi)制作出擁有100000個(gè)SNPs的基因組,以滿(mǎn)足比較均質(zhì)群體中的關(guān)聯(lián)分析和其它研究的需要[1,3]。SNP在單個(gè)基因或整個(gè)基因組中的分布不是均勻的。有根據(jù)認(rèn)為,由于選擇壓力等原因,SNP在非轉(zhuǎn)錄序列中要多于轉(zhuǎn)錄序列。
由于基因組中為蛋白質(zhì)編碼的序列僅約為3%,絕大多數(shù)SNP當(dāng)位于非編碼區(qū)。在蛋白質(zhì)編碼區(qū)的SNP被稱(chēng)為cSNP,它們和位于表達(dá)調(diào)控序列中的SNP在功能或致病方面具有更重要的意義[4]。這樣的多態(tài)性常被稱(chēng)為功能多態(tài)性(functionalpolymorphism)。此外,在一些基因中有SNP的密集區(qū),但由于已知SNP尚少,有關(guān)SNP的分布規(guī)律還有待進(jìn)一步研究。
3SNP的醫(yī)學(xué)意義和應(yīng)用
基因在決定個(gè)體的正常表型,即形態(tài)、代謝和免疫狀態(tài)等方面起著決定性的作用。通過(guò)賦予個(gè)體對(duì)疾病的易感性或抵抗力,以及影響機(jī)體與環(huán)境因素的相互作用,基因也對(duì)任何一種疾病的發(fā)生發(fā)展起著重要作用。因此,人們希望能識(shí)別這些基因,以加深對(duì)疾病的認(rèn)識(shí),從而改進(jìn)疾病的診斷預(yù)防。限于技術(shù)條件和其它一些原因,迄今疾病的遺傳研究大多從單個(gè)基因入手,或按照單基因的模式進(jìn)行,很少能夠考慮包括成千上萬(wàn)基因的整個(gè)基因組及其功能狀態(tài)。但隨著SNP的不斷發(fā)現(xiàn)和人類(lèi)第3代遺傳標(biāo)記圖的繪制,現(xiàn)在已有可能描繪在某一疾病時(shí)或發(fā)育階段中多個(gè)基因位點(diǎn)甚至整個(gè)基因組的狀態(tài)。
3.1連鎖分析與基因定位SNP可以用于疾病的連鎖分析和未知致病基因的定位。SNP數(shù)量大和分布廣,在任何已知或未知致病基因附近都可能找到眾多的SNP,并用于遺傳病的單倍型診斷。在有適當(dāng)?shù)募蚁蒂Y料時(shí),SNP又可用作遺傳標(biāo)記來(lái)定位未知基因。與目前廣泛使用的微衛(wèi)星小衛(wèi)星基因圖比較,未來(lái)SNP圖的標(biāo)記更多,分辨率更高,定位基因也更加準(zhǔn)確。有作者計(jì)算,有700~900個(gè)SNP的基因圖與目前用于基因組掃描的300~400個(gè)微衛(wèi)星位點(diǎn)的基因圖的分析能力相當(dāng),但制作前者要容易得多。而如果采用1500~3000個(gè)SNP作掃描,結(jié)果明顯優(yōu)于目前使用的微衛(wèi)星掃描[5]。
3.2疾病的關(guān)聯(lián)分析如果說(shuō)連鎖分析是基于家系中一種疾病或表型與某個(gè)等位基因的同時(shí)存在(coexistence)或相聯(lián)系的話(huà),那么關(guān)聯(lián)分析則是基于群體中某種疾病與某個(gè)特定等位基因的頻率相關(guān)。經(jīng)典的連鎖分析常苦于家系中患病成員的不足和DNA標(biāo)本的不易取得,而關(guān)聯(lián)分析無(wú)需家系資料,只需研究一個(gè)群體中的患者與非患者。當(dāng)一個(gè)遺傳標(biāo)記的頻率在患者明顯超過(guò)非患者時(shí),即表明該標(biāo)記與疾病關(guān)聯(lián)。通過(guò)比較分析兩者的單倍型和發(fā)現(xiàn)連鎖不平衡,關(guān)聯(lián)分析也可將基因組中任何未知的致病基因定位。但要做到這一點(diǎn),估計(jì)需要有3萬(wàn)~30萬(wàn)個(gè)SNP[4]。
3.3復(fù)雜疾病或過(guò)程的基因定位迄今為止,在復(fù)雜疾病和復(fù)雜生理過(guò)程相關(guān)基因的識(shí)別和定位方面取得的成績(jī)?nèi)允钟邢蕖_@是因?yàn)樗鼈兩婕暗幕虮姸?而一個(gè)基因怎樣影響另一個(gè)基因的表達(dá),即基因間的相互作用還不清楚,眾多環(huán)境因素所起的作用也難以確定。結(jié)果是多數(shù)致病等位基因的外顯率低,只有少數(shù)等位基因的攜帶者才有明顯的表型或癥狀。這就使傳統(tǒng)的家系連鎖分析方法無(wú)能為力。近些年在復(fù)雜疾病基因定位方面比較成功的例子,如乳腺癌、遺傳性非息肉性結(jié)腸癌和Ⅱ型糖尿病的某些亞型,都屬涉及的基因相對(duì)不多和致病基因外顯率高的腫瘤或疾病。然而,如果有基于SNPs的高分辨率的基因圖作為全基因組連鎖分析或關(guān)聯(lián)分析的基礎(chǔ),則可能同時(shí)篩查到復(fù)雜疾病或性狀的眾多相關(guān)基因。許多作者都希望SNP的大量發(fā)現(xiàn)和第3代的基因圖的制成與應(yīng)用能給復(fù)雜疾病的基因定位帶來(lái)重大突破。最近有作者聲稱(chēng)已通過(guò)SNP關(guān)聯(lián)分析發(fā)現(xiàn)了兩個(gè)前列腺癌相關(guān)基因[6]。又有作者以SNP為標(biāo)記,用半?yún)?shù)法作連鎖/連鎖不平衡綜合分析和模擬基因組掃描試驗(yàn)以定位復(fù)雜性狀的基因,并表明綜合分析可以獲得比單純連鎖分析或單純連鎖不平衡分析更好的結(jié)果[7]。
3.4法醫(yī)學(xué)應(yīng)用SNP作為最多的一類(lèi)遺傳標(biāo)記可以用于基因分型,從而在個(gè)人識(shí)別、親權(quán)鑒定中發(fā)揮作用。已有作者采用寡核苷酸連接分析(PCR-OLA)測(cè)定含有20個(gè)常見(jiàn)SNP的PCR擴(kuò)增片段作基因分型。這種分型可以采用比色分光光度方法,并自動(dòng)化地完成,因而能在較大群體中進(jìn)行[8]。
3.5疾病發(fā)病的分子遺傳機(jī)理的闡明遺傳病研究中已經(jīng)積累了大量堿基置換引起基因功能或表型異常的病例。近年來(lái)還建立了p53、HPRT、PAH等基因的突變數(shù)據(jù)庫(kù)[9,10]。如果能系統(tǒng)地鑒定和記錄基因的cSNP和基因調(diào)控區(qū)的SNP,那么通過(guò)病例-對(duì)照的突變分析,就有可能闡明這類(lèi)SNP與異常表型之間的關(guān)系,從而對(duì)疾病遺傳機(jī)理的闡明作出重要貢獻(xiàn)。另一個(gè)誘人的前景是,由于DNA芯片及其它技術(shù)的發(fā)展,已存在大規(guī)模自動(dòng)化檢測(cè)SNP的可能。未來(lái)有可能檢測(cè)許多個(gè)體的所有的多態(tài)位點(diǎn),包括一切有功能意義的多態(tài)位點(diǎn),這種全基因組多態(tài)性?huà)呙杌蚧蛐头治鋈绻茉诖笕后w、或至少在許多個(gè)體中進(jìn)行,那么通過(guò)表型與全基因組SNP圖譜的相關(guān)研究,理論上可將人類(lèi)的任何表型、功能、對(duì)任何疾病的易感性加以定位。
除此以外,利用微陣列技術(shù)將來(lái)還可以同時(shí)檢測(cè)某一疾病時(shí)所有相關(guān)基因的表達(dá)。在未來(lái),一張個(gè)體的基因組結(jié)構(gòu)圖譜(SNP圖譜)和一張個(gè)體的基因組表達(dá)圖譜將能全面地描繪出個(gè)體的遺傳物質(zhì)及其功能狀態(tài),而歸納眾多個(gè)體的這種結(jié)構(gòu)和功能圖譜將把疾病的發(fā)病機(jī)理研究推向一個(gè)嶄新的水平。大群體中的全基因組多態(tài)位點(diǎn)檢查由于工作量巨大,目前還難以想象,但在特定患病人群或?qū)φ杖巳褐袦y(cè)定某些相關(guān)基因或候選基因的SNP,以闡明疾病發(fā)生的遺傳基礎(chǔ)則已有可能。
3.6環(huán)境因子易感基因的檢出[11]在疾病發(fā)生的過(guò)程中,個(gè)體或群體對(duì)環(huán)境致病因子的易感性起著重要作用。這種易感性的遺傳基礎(chǔ)是基因組的結(jié)構(gòu)差異或/和表達(dá)差異。SNPs有助于闡明這些差異。絕大多數(shù)SNPs本身雖不是易感性的原因,但在全基因組范圍內(nèi)比較易感和非易感人群之間的SNP圖譜,則可顯示易感人群基因組的結(jié)構(gòu)特點(diǎn),并通過(guò)關(guān)聯(lián)分析或連鎖不平衡分析指導(dǎo)尋找易感基因。當(dāng)然,個(gè)體或群體的易感性并不完全由其基因型決定。在環(huán)境致病因子作用下的基因表達(dá)往往起著更重要的作用。因?yàn)榧词够蛐鸵恢?基因表達(dá)還會(huì)受到甲基化、體細(xì)胞突變、X染色體的隨機(jī)失活等影響。隨著DNA微陣列芯片在基因表達(dá)研究中的應(yīng)用,如果能夠確定易感基因的關(guān)鍵組織或細(xì)胞,那么理論上只需有限的個(gè)體或標(biāo)本就可確定環(huán)境因子對(duì)基因組表達(dá)的影響并找出易感基因。
3.7指導(dǎo)用藥和藥物設(shè)計(jì)同一藥物在不同個(gè)體產(chǎn)生的效果不是完全相同的。這種不同是由于藥物本身在不同個(gè)體體內(nèi)活化、代謝、清除方面的差異所決定的,而這種差異首先是遺傳差異。基因組的多態(tài)性,尤其是SNP多態(tài)性能充分地反映個(gè)體間的遺傳差異。通過(guò)研究遺傳多態(tài)性與個(gè)體對(duì)藥物敏感性或耐受性的相關(guān)性,可以闡明遺傳因素對(duì)藥物效用的影響,從而對(duì)醫(yī)生針對(duì)性的用藥和藥物的開(kāi)發(fā)提供指導(dǎo)和依據(jù)。單個(gè)基因?qū)λ幬镒饔玫挠绊懸延胁簧傺芯俊@?已知一些參與藥物代謝的酶的基因和受體基因可以改變藥物在體內(nèi)的代謝和個(gè)體對(duì)藥物的敏感性。
但對(duì)于常見(jiàn)的復(fù)雜疾病來(lái)說(shuō),了解單個(gè)基因?qū)λ幬镒饔玫挠绊懯沁h(yuǎn)遠(yuǎn)不夠的,因?yàn)檫@些疾病的發(fā)病有眾多基因和環(huán)境因素的參與,而單個(gè)基因或因素的貢獻(xiàn)甚微,并認(rèn)為一般不會(huì)超過(guò)5%。因此,有必要在整體水平上全面認(rèn)識(shí)多個(gè)基因的作用,而這只有基因組水平上才有可能做到。SNP以其數(shù)量眾多和易于批量檢測(cè),正好為此提供了條件。目前,正在興起的藥物基因組學(xué)(pharmacogenomics)研究遺傳因素對(duì)藥物作用的影響和不同基因型個(gè)體對(duì)藥物反應(yīng)的差異[12],從而為臨床有針對(duì)性地合理用藥和根據(jù)不同基因型群體對(duì)藥物的反應(yīng)來(lái)改進(jìn)藥物設(shè)計(jì)提供了理論依據(jù)。這是當(dāng)前制藥行業(yè)對(duì)SNPs制圖和發(fā)展大量檢出SNPs方法表現(xiàn)出空前興趣的原因。可以理解,藥物基因組學(xué)首先選擇研究的對(duì)象將是與藥物活化、代謝或靶分子有關(guān)的基因及其多態(tài)性,以便用最少的投入發(fā)展對(duì)不同人群或個(gè)體更加安全有效的藥物和診斷試劑。
4SNP的識(shí)別和檢出
作為DNA序列中單個(gè)堿基的置換,理論上任何用于檢測(cè)單堿基突變或多態(tài)的技術(shù)都可用于SNPs的識(shí)別或檢出,例如,RFLP、等位基因特異的寡苷酸雜交、寡核苷酸連接分析(OLA)、等位基因特異的PCR(ARMS)、DNA測(cè)序等都可分別用于已知或未知的SNPs的檢測(cè)。這些方法大多需要電泳和熒光標(biāo)記。當(dāng)前在人類(lèi)基因組中搜尋SNPs最普遍采用的策略是將已定位的序列標(biāo)記點(diǎn)(sequencetaggedsites,STS)和表達(dá)序列標(biāo)記(expressedsequencetags,ESTs)進(jìn)行再測(cè)序。從事SNPs識(shí)別和制圖的有美國(guó)麻省理工學(xué)院(MIT)的Whitehead基因組研究所、華盛頓大學(xué)、芝加哥大學(xué)、斯坦福大學(xué)以及Genset、Diadexus等一些大學(xué)和公司的實(shí)驗(yàn)室。
但無(wú)論為了大量發(fā)現(xiàn)新的SNPs,還是用已知SNPs作群體基因型分析,都需要同時(shí)檢測(cè)大量的位點(diǎn),而上述基于電泳和需標(biāo)記DNA的方法則因其樣本處理費(fèi)時(shí)費(fèi)力而效率有待提高。為此,近年來(lái)已發(fā)展了一些批量地、自動(dòng)化地識(shí)別或檢出SNPs的方法。如DNA微陣列分析法[13,14],即在一塊小硅片上進(jìn)行微陣列分析,讓目標(biāo)DNA與密集的多重寡核苷酸陣列進(jìn)行雜交以檢出SNPs的有效方法。實(shí)現(xiàn)這種分析的關(guān)鍵是能在芯片上高密度地原位合成大量不同的寡核苷酸探針,以及實(shí)現(xiàn)雜交后的熒光檢測(cè)和計(jì)算機(jī)分析。而采用綜合探針矩陣(probematrix)合成技術(shù)通過(guò)多輪的合成反應(yīng)可以生成大量隨機(jī)的多態(tài)DNA分子,即寡核苷酸探針,后者的數(shù)目隨合成反應(yīng)的次數(shù)呈指數(shù)增加。
微陣列DNA芯片在理論上可以提供足以檢出任何SNP的探針,并通過(guò)雜交檢出基因組中的cSNP或SNPs。目前采用DNA芯片法已從1139個(gè)STSs(其總長(zhǎng)為279kb)中發(fā)現(xiàn)了279個(gè)SNPs,平均每1001bp中有1個(gè)SNP[15]。在1998年的冷泉港會(huì)議上,一些公司已聲稱(chēng)發(fā)展了同時(shí)可檢查10000個(gè)位點(diǎn)的芯片,并希望開(kāi)發(fā)出一次評(píng)價(jià)全基因組的芯片[16]。此外,采用特殊的質(zhì)譜法[17-19]和高效液相層析法也可以大規(guī)模和快速檢出SNP或進(jìn)行SNP的初篩。一些公司和實(shí)驗(yàn)室正努力發(fā)展一些大規(guī)模SNPs檢測(cè)技術(shù),以期研制成檢測(cè)全基因組SNPs的芯片。已經(jīng)推出一些檢測(cè)諸如p53抑癌基因、艾滋病毒、乳腺癌、囊性纖維病基因已知SNPs的芯片或診斷試劑盒。但批量地、廉價(jià)地識(shí)別和檢出SNPs的技術(shù)還不能認(rèn)為已經(jīng)成熟和處于臨床普遍推廣的階段。
就整體而言,當(dāng)前SNPs的研究還處于發(fā)展階段,用芯片微陣列雜交鑒定的SNPs也僅2000個(gè)[15]。傳統(tǒng)的基于電泳檢出SNPs的方法費(fèi)時(shí)費(fèi)力,且不都適用于識(shí)別未知的SNPs,而芯片微列陣技術(shù)還有待進(jìn)一步改進(jìn)并使價(jià)格能為一般實(shí)驗(yàn)室或醫(yī)院所承受。在應(yīng)用SNPs作尋找致病等位基因的一些實(shí)驗(yàn)中還發(fā)現(xiàn)了一些問(wèn)題[20],如減數(shù)分裂時(shí)的基因重組給SNPs的定位增加了困難,并影響到關(guān)聯(lián)分析。另一些作者認(rèn)為只憑SNPs恐難以確定致病的突變等。盡管如此,由于SNPs對(duì)于基因組學(xué)的意義及其在醫(yī)學(xué)生物學(xué)各領(lǐng)域中的應(yīng)用前景,它已成為實(shí)驗(yàn)室和公司爭(zhēng)奪的對(duì)象(所謂SNPs大戰(zhàn))和人類(lèi)基因組計(jì)劃與癌瘤基因組解剖計(jì)劃(CGAP)中的一個(gè)重要補(bǔ)充和研究熱點(diǎn)。SNPs的研究已受到廣泛的重視和強(qiáng)有力的支持[21],在美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)也已建立了SNPs的公用數(shù)據(jù)庫(kù)及SNPs的報(bào)告登記制度。我國(guó)的基因組計(jì)劃已注意到這一點(diǎn),并根據(jù)我國(guó)的實(shí)際情況,考慮加速發(fā)展SNPs研究及其應(yīng)用的策略和重點(diǎn)。