CNV在動(dòng)物研究中的案例分析2
發(fā)稿時(shí)間:2016-04-13來源:天昊生物
英文題目:Bovine
NK-lysin: Copy number variation and
functional
diversification
期刊名:PNAS
影響因子:9.674
研究背景:
抗菌肽(AMP)是先天免疫系統(tǒng)的效應(yīng)分子,它在整個(gè)生命周期都廣泛存在。人粒溶素(GNLY)和豬
NK-lysin是同源基因,都屬于抗菌肽(AMP),它們?cè)诘挚苟喾N微生物,包括革蘭氏陽性和陰性細(xì)菌,真菌,原蟲,病毒,甚至腫瘤細(xì)胞都是非常有效的。
NK-lysin的同源基因已經(jīng)在許多物種中被鑒定到,包括人,豬,牛,馬和幾種鳥類。在人類及其它大多數(shù)哺乳動(dòng)物中,
NK-lysin是單基因,而牛的
NK-lysin是十幾年前第一個(gè)被報(bào)道的,當(dāng)時(shí)從四種不同奶牛中發(fā)現(xiàn)了兩個(gè)
NK-lysin cDNA片段(
Bo-lysin 89和
Bo-lysin
62),但是目前還不清楚這兩個(gè)片段是來自兩個(gè)不同的
NK-lysin基因還是來自同一個(gè)
NK-lysin基因的等位基因。
拷貝數(shù)變異(CNV)是一種常見的動(dòng)物基因組結(jié)構(gòu)變異。過去已經(jīng)針對(duì)不同品種的牛進(jìn)行了全基因組CNV分析,其中兩個(gè)研究表明,牛
NK-lysin基因處于一個(gè)CNV區(qū)域。高度一致(90%)的重復(fù)(>
1
Kb)被稱為“片段復(fù)制”,片段復(fù)制在哺乳動(dòng)物基因組中是非常常見的,它是基因家族擴(kuò)張的主要機(jī)制之一。奶?;蚪M測(cè)序顯示和人及小鼠一樣奶牛中的許多免疫相關(guān)基因拷貝數(shù)也得到擴(kuò)張,這其中就包括抗菌肽,β-防御素,C型溶菌酶和脂多糖結(jié)合蛋白,這些基因家族的擴(kuò)張可能會(huì)產(chǎn)生新的功能基因,從而影響反芻動(dòng)物胃中的獨(dú)特生理或群體環(huán)境中的疾病抵抗能力。
研究材料: 4頭荷斯坦牛;CHORI-240 Bovine BAC文庫(kù);5個(gè)組織(肺、胸腺、脾臟、呼吸淋巴結(jié)、腸淋巴結(jié))
技術(shù)平臺(tái): PacBio RS三代測(cè)序,一代測(cè)序,qPCR,抑菌實(shí)驗(yàn)
研究思路:
通過NCBI數(shù)據(jù)庫(kù)鑒定到7個(gè)不同
NK-lysin序列;
系統(tǒng)發(fā)育分析把它們分為4個(gè)不同的
NK-lysin基因;
克隆測(cè)序驗(yàn)證
NK2A,
NK2B,
NK2C是否真實(shí)存在;
BAC克隆重測(cè)序鑒定牛科4個(gè)
NK-Lysin基因;
鑒定
NK-Lysin家族基因組結(jié)構(gòu)和CNV斷點(diǎn);
一代測(cè)序驗(yàn)證本次得到的 Bo-NK
contig精確性;
???em>NK-Lysin家族的遺傳結(jié)構(gòu)分析;
???em>NK-Lysin家族的重復(fù)序列分析;
qPCR檢測(cè)???em>NK-Lysin基因在不同組織中的表達(dá);
??芅K-Lysin多肽的抗菌效果;
研究結(jié)果:
???/strong>NK-lysin純合性分析
通過尋找NCBI脫氧核苷酸數(shù)據(jù)庫(kù)鑒定到7個(gè)不同NK-lysin序列,序列的系統(tǒng)發(fā)育分析可以把它們分為4個(gè)分支,分別代表4個(gè)不同的NK-lysin基因(NK1, NK2A, NK2B, NK2C)(Fig. S1),其中NK1, NK2A, NK2B彼此密切相關(guān),而與NK1有顯著不同。
Fig. S1.
7個(gè)不同NK-lysin序列的系統(tǒng)發(fā)育分析
其中NK1 和 NK2A在??茀⒖蓟蚪MUMD 3.1中分別被注釋為uncharacterized LOC616323和 Bovine
GNLY,這兩個(gè)基因在11號(hào)染色體上串聯(lián)排列。而NK2B, NK2C在牛參考基因組中是不存在的。為了確認(rèn)NK2A, NK2B, NK2C的真實(shí)性,針對(duì)這幾個(gè)基因的保守區(qū)設(shè)計(jì)引物,為了減少等位基因變異在分析中的影響,基于770K HD
SNP芯片分型結(jié)果選擇了NK-lysin區(qū)域及側(cè)翼兩個(gè)基因(ATOH8和SFTPB)是純合子的4頭荷斯坦牛(2527,
2796, 2822, 3850)用于下一步的分析。結(jié)果從這4個(gè)個(gè)體中共得到5個(gè)不同的序列(Fig.
1),這5個(gè)序列形成3個(gè)分支,分別對(duì)應(yīng)NK2A,NK2B,NK2C。這3個(gè)分支與NK1有明顯的不同。在個(gè)體2527中檢測(cè)到NK2A的兩條序列,如果個(gè)體2527在NK-lysin區(qū)域是純合的,那么在牛中NK2A至少存在兩個(gè)拷貝。在個(gè)體2822和3850中沒有發(fā)現(xiàn)NK2B相關(guān)克隆,并且使用NK2B特異基因引物不能得到其擴(kuò)增子,說明在這兩個(gè)個(gè)體中不存在NK2B。
Fig. 1. 在4個(gè)純合個(gè)體(2527, 2796, 2822,
3850)中進(jìn)行NK2A, NK2B, NK2C序列分析。對(duì)牛的NK-lysin 參考序列(NK1, NK2A, NK2B,
NK2C),豬同源序列(Horse-NKL),馬同源序列(Horse-NKL)和來源于4個(gè)個(gè)體的5個(gè)不同克隆序列(Seq.
1–5)進(jìn)行系統(tǒng)進(jìn)化分析。
BAC克隆測(cè)序鑒定4個(gè)NK-Lysin基因
通過對(duì)覆蓋NK-Lysin區(qū)域的兩個(gè)重疊BAC克隆進(jìn)行測(cè)序來確定牛科NK-Lysin家族的精確基因數(shù)目和基因組構(gòu)成,這兩個(gè)BAC克隆分離于CHORI-240
Bovine BAC文庫(kù),然后使用PacBio
RS進(jìn)行測(cè)序。通過兩輪測(cè)序,平均覆蓋深度達(dá)到1310-1551×,因?yàn)檫@兩個(gè)文庫(kù)有重疊,所以對(duì)序列進(jìn)行了de
novo組裝,得到兩個(gè)contig,這兩個(gè)contig有2 kb的完全重疊區(qū)域。然后這兩個(gè)contig被組裝成一個(gè)長(zhǎng)度227,063
bp,覆蓋整個(gè)NK-Lysin區(qū)域的supercontig。這個(gè)組裝結(jié)果(Bo-NK)要比目前?;蚪M189,124 bp
(Bos_taurus_UMD_3.1)的組裝結(jié)果長(zhǎng)了38
kb,而這個(gè)長(zhǎng)度上的區(qū)別主要由參考基因組的錯(cuò)誤組裝引起的。
鑒定NK-Lysin家族基因組結(jié)構(gòu)和CNV斷點(diǎn)
針對(duì)本次得到的Bo-NK supercontig
進(jìn)行散點(diǎn)圖分析,結(jié)果發(fā)現(xiàn)了3個(gè)具有95%相似性的片段復(fù)制(SD-NK2A;SD-NK2B;SD-NK2C),每一個(gè)片段復(fù)制都包含一個(gè)NK-lysin基因,NK1位于NK2C下游41.8
kb ,并且SD-NK2C長(zhǎng)度要比SD-NK2A 和 SD-NK2B短,(Fig.
2B)。連接點(diǎn)4(JP-4)序列和其它三個(gè)連接點(diǎn)(JP-1,JP-2,JP-3)相比有所不同(Fig. 2C)。
Fig. 2. PacBio 對(duì)BAC 克隆的測(cè)序分析。(A) 本次得到的Bo-NK
supercontig序列和原來基因組序列 (Bos_taur-us_UMD_3.1.1)的比較結(jié)果。錯(cuò)配
(垂直的藍(lán)線);內(nèi)部重復(fù)(灰盒);4個(gè)NK-lysin 基因位置 (箭頭) 。(B) 針對(duì)本次得到的 Bo-NK supercontig
進(jìn)行散點(diǎn)圖分析
。(C)NK-Lysin家族的基因組結(jié)構(gòu)和鑒定到的斷點(diǎn)。JP-2的側(cè)翼序列作為參考序列。
一代測(cè)序驗(yàn)證本次得到的 Bo-NK contig精確性
為了確定本次得到的Bo-NK
contig精確性,在每個(gè)連接點(diǎn)(JP)設(shè)計(jì)引物進(jìn)行驗(yàn)證(以CHORI-240 Bovine
BAC文庫(kù)的供體DNA作為模板),一代測(cè)序后發(fā)現(xiàn)JP-1,JP-3,JP-4 的PCR產(chǎn)物與三代測(cè)序得到的Bo-NK
contig完美一致。
NK-Lysin家族的遺傳結(jié)構(gòu)分析
通過對(duì)這4個(gè)NK-Lysin的基因組序列進(jìn)行比對(duì)來確定其遺傳結(jié)構(gòu)(Fig.S2)。結(jié)果發(fā)現(xiàn)這4個(gè)NK-Lysin基因都包含5個(gè)外顯子,并且這些外顯子的大小相差不多,但是NK1的內(nèi)含子要大于其它3個(gè)基因的內(nèi)含子。NK2A,NK2B,NK2C 相互之間有95%相似性,但是與NK1只有85%
的相似性。通過對(duì)這4個(gè)NK-Lysin以及人類、豬、馬、羊同源基因編碼序列的系統(tǒng)發(fā)育分析,發(fā)現(xiàn)只在反芻動(dòng)物存在NK-Lysin基因家族的擴(kuò)張。
Fig. S2.
4個(gè)NK-Lysin基因組序列的比對(duì)
牛NK-Lysin基因家族的重復(fù)序列分析
在人類基因家組中,重復(fù)序列經(jīng)常是與重組熱點(diǎn)是關(guān)聯(lián)的,另外與斷點(diǎn)處重復(fù)序列錯(cuò)配引起的染色體不穩(wěn)定也是相關(guān)的。深入分析了NK-Lysin區(qū)域內(nèi)重復(fù)元件的分布(Fig.
3A)??傮w來說每個(gè)斷點(diǎn)處下游區(qū)域要比上游區(qū)域具有更多的重復(fù),NK1的側(cè)翼序列重復(fù)度更高,它包含一個(gè)大的長(zhǎng)的,分散的細(xì)胞核元件(LINES),這與其它3個(gè)基因有明顯不同。數(shù)個(gè)重復(fù)家族位于NK-Lysin區(qū)域內(nèi),包括2個(gè)L1家族,2個(gè)LTR家族,4個(gè)??铺禺惖模痰?,分散的細(xì)胞核元件(SINE)家族(BOVTA,BTALUL2,CHR-2_BT,CHR-2A)。接著繪制了每個(gè)斷點(diǎn)處上游或下游5
kb內(nèi)牛科重復(fù)家族的分布圖(Fig. 3B)。JP-1,JP-2,JP-3
下游臨近區(qū)域富集了SINES,特別是BOVTA元件。BOVTA元件組成了一個(gè)??铺禺愔貜?fù)家族,這與人類片段復(fù)制相關(guān)的ALU重復(fù)家族非常類似,表明片段側(cè)翼的斷點(diǎn)具有很高的同源性,這有助于減數(shù)分裂時(shí)的不平等交換和???em>NK-Lysin基因家族結(jié)構(gòu)的不穩(wěn)定性。
Fig. 3. 重復(fù)元件分析。(A)組裝好的supercontig
Bo-NK內(nèi)重復(fù)元件的分布,四個(gè)斷點(diǎn)和基因如圖所示。(B) 每個(gè)斷點(diǎn)處上游或下游5
kb內(nèi)SINEs的分布圖。
???/strong>NK-Lysin基因的組織特異性表達(dá)
為了檢測(cè)???em>NK-Lysin基因是否都表達(dá),分別在5個(gè)組織(肺、胸腺、脾臟、呼吸淋巴結(jié)、腸淋巴結(jié))中檢測(cè)了這些基因的表達(dá)量。qPCR結(jié)果發(fā)現(xiàn)這4個(gè)NK-Lysin基因都表達(dá),但是每個(gè)基因表達(dá)都表現(xiàn)出組織特異性(Fig.
4):NK1 和NK2A在腸淋巴結(jié)高表達(dá)但是在肺中低表達(dá);NK2B在各組織中都表達(dá),但在腸淋巴結(jié)和肺中高表達(dá);NK2C則在肺中表達(dá)量最高。
Fig. 4. NK-Lysin在肺(L)、胸腺(T)、脾臟(S)、呼吸淋巴結(jié)(RLN)、腸淋巴結(jié)(IPP)中的基因表達(dá)。
???/strong>NK-Lysin多肽的抗菌效果
使用革蘭氏陽性菌金黃色葡萄球菌和革蘭氏陰性菌大腸桿菌對(duì)4種NK-Lysin多肽的抗菌效果進(jìn)行了測(cè)試,這4種NK-Lysin多肽在納摩爾濃度對(duì)這兩種菌株的抑菌效果都是有效的(Fig.
5A)。接著使用透射電鏡觀察了NK-Lysin多肽對(duì)大腸桿菌細(xì)胞膜的作用效果(Fig.
5B),結(jié)果發(fā)現(xiàn)沒有經(jīng)過NK-Lysin多肽處理的細(xì)胞呈現(xiàn)完整的細(xì)胞形態(tài),例如保持一個(gè)完整的細(xì)胞膜和充足的細(xì)胞質(zhì);而經(jīng)過NK-Lysin多肽處理的細(xì)胞則呈現(xiàn)周質(zhì)空間膨脹和細(xì)胞質(zhì)收縮,這表明這4種??芅K-Lysin多肽具有明顯的抗菌效果。
Fig. 5. (A)
4種NK-Lysin多肽對(duì)革蘭氏陽性菌金黃色葡萄球菌和革蘭氏陰性菌大腸桿菌的抗菌效果。(B) 透射電鏡觀察NK-Lysin多肽對(duì)大腸桿菌細(xì)胞的作用效果,(a)
對(duì)照細(xì)胞;(b)5 μM NK-Lysin多肽處理20分鐘后的細(xì)胞。