昊閱讀】Nature Genetics 9月精選文章一覽
發(fā)稿時間:2018-09-25來源:天昊生物
(一)
Genome-wide polygenic scores for common diseases identify individuals with risk equivalent to monogenic mutations
常見疾病的全基因組多基因評分可識別相當(dāng)于單基因突變風(fēng)險的個體
公共衛(wèi)生需求中的一個關(guān)鍵問題是識別特定疾病的高風(fēng)險個體,以加強篩查或預(yù)防治療。因為大多數(shù)常見疾病都有遺傳因素,一個重要的方法是根據(jù)遺傳的DNA變異對個體進行分層。常見臨床應(yīng)用主要集中在尋找患病風(fēng)險增加了幾倍的罕見單基因突變攜帶者。盡管大多數(shù)疾病風(fēng)險是多基因控制的,但還沒有可以使用的多基因預(yù)測方法來識別與單基因突變相當(dāng)?shù)娘L(fēng)險個體。本研究開發(fā)并驗證了五種常見疾病的全基因組多基因評分方法。該方法分別確定了8.0、6.1、3.5、3.2和1.5 %的患冠心病、房顫、2型糖尿病、炎癥性腸病和乳腺癌的風(fēng)險增加三倍以上人口。對于冠狀動脈疾病,這種相對風(fēng)險比罕見單基因突變的攜帶頻率高20倍。研究人員建議,現(xiàn)在是該考慮將多基因風(fēng)險預(yù)測納入到臨床護理并討論相關(guān)問題的時候了。
(二)
Biobank-driven genomic discovery yields new insight into atrial fibrillation biology
生物庫驅(qū)動的基因組發(fā)現(xiàn)為房顫生物學(xué)提供新的見解
為了確定心房顫動(最常見的心律失常)的遺傳變異,本研究對超過100萬人進行了全基因組關(guān)聯(lián)研究,包括60620例心房顫動患者和970216名對照。研究者在111個位點上鑒定了142個獨立的風(fēng)險變異,并確定了151個可能參與心房顫動的功能候選基因優(yōu)先級。許多已鑒定的風(fēng)險變異落在據(jù)報道會導(dǎo)致人類嚴重心臟缺陷的基因附近(GATA4, MYH6, NKX2-5, PITX2, TBX5) ,或者落在對橫紋肌功能和完整性起重要作用的基因附近(例如CFL2, MYH7, PKP2, RBM20, SGCG, SSPN)。通路和功能富集分析還表明,許多推定的心房顫動基因通過心臟結(jié)構(gòu)重塑起作用,可能以“心房心肌病”的形式,在胎兒心臟發(fā)育期間作為對成人心臟壓力的一種反應(yīng)。
(三)
EBS is a bivalent histone reader that regulates floral phase transition in Arabidopsis
EBS是一種調(diào)節(jié)擬南芥花發(fā)育的二價組蛋白閱讀器
細胞感知多種信號并將其轉(zhuǎn)化為不同染色質(zhì)和轉(zhuǎn)錄狀態(tài)的能力對生物過程至關(guān)重要。在植物中,及時過渡到開花狀態(tài)對于成功繁殖至關(guān)重要。EARLY BOLTING IN SHORT DAY (EBS)是一種負轉(zhuǎn)錄調(diào)節(jié)子,可防止擬南芥過早開花。本研究發(fā)現(xiàn)EBS含有BAH-PHD閱讀器模塊,分別結(jié)合H3K27me3和H3K4me3。實驗中觀察到一部分EBS相關(guān)基因與H3K27me3和H3K4me3和PRC2的共富集。值得注意的是,EBS采用自動抑制模式來調(diào)節(jié)其在H3K27me3和H3K4me3之間的結(jié)合偏好轉(zhuǎn)換。這種結(jié)合平衡至關(guān)重要,因為EBS-H3K27me3或EBS- H3K4me3相互作用的中斷會導(dǎo)致早期的花轉(zhuǎn)換。本研究結(jié)果鑒定了一種能夠識別兩種拮抗組蛋白標(biāo)記的二價染色質(zhì)閱讀器,并提出了活性染色質(zhì)狀態(tài)和抑制染色質(zhì)狀態(tài)之間相互作用的獨特機制。
(四)
Polycomb-mediated gene silencing by the BAH–EMF1 complex in plants
Polycomb通過BAH–EMF1復(fù)合物介導(dǎo)的植物基因沉默
Polycomb蛋白在多細胞生物中執(zhí)行著全基因組轉(zhuǎn)錄抑制功能。進化保守的Polycomb抑制蛋白復(fù)合物2 (PRC2)催化組蛋白H3K27me3,它在動物中是由Polycomb抑制蛋白復(fù)合物1 (PRC1)讀取和影響的,但是這一標(biāo)記在植物中的解釋仍然不清楚。本研究報道了在雙子葉擬南芥中,兩個同源BAH結(jié)構(gòu)域包含的蛋白質(zhì)與花發(fā)育蛋白形成了植物特異性復(fù)合物BAH–EMF1c,讀取并影響H3K27me3標(biāo)記,并介導(dǎo)了全基因組轉(zhuǎn)錄抑制。此外,在單子葉水稻中,擬南芥BAH結(jié)構(gòu)域蛋白的同源物也結(jié)合甲基化的H3K27,并與EMF1的水稻同源物形成復(fù)合物,這表明BAH–EMF1c在開花植物中是保守的。因此,本研究結(jié)果發(fā)現(xiàn)植物特異性BAH–EMF1c在高等植物中實現(xiàn)了類似PRC1的功能,這表明植物和動物中PRC1活性的趨同進化。
(五)
Copy number signatures and mutational processes in ovarian carcinoma
卵巢癌的拷貝數(shù)特征和突變過程
由拷貝數(shù)變化導(dǎo)致的基因組復(fù)雜性阻礙了卵巢癌的有效分子分層。這里,為了解釋這種復(fù)雜性,研究者從117例嚴重卵巢癌(HGSOC)病例的低深度全基因組測序中獲得拷貝數(shù)相關(guān)特征,并在527例病例中進行了驗證。結(jié)果表明,HGSOC基因組通過多種突變導(dǎo)致已知基因組模式的畸變。拷貝數(shù)變化特征暴露值可以用于在診斷時預(yù)測總生存率和耐藥復(fù)發(fā)的可能性。相關(guān)特征暴露值的測量為選擇針對多個突變過程的組合治療提供了一個合理的指導(dǎo)框架。
(六)
Genomic correlates of response to immune checkpoint blockade in microsatellite-stable solid tumors
微衛(wèi)星穩(wěn)定實體腫瘤免疫檢查點封鎖反應(yīng)的基因組相關(guān)性分析
腫瘤突變負荷與多種實體腫瘤對免疫檢查點阻斷的反應(yīng)相關(guān),盡管在微衛(wèi)星穩(wěn)定腫瘤中,這種關(guān)聯(lián)具有不確定的臨床用途。這里,研究者統(tǒng)一分析了249例腫瘤的全外顯子測序(WES),包括臨床注釋為進行免疫治療患者的正常組織及相匹配多種癌癥類型組織。分析結(jié)果鑒定出超出突變負荷的基因組相關(guān)性,包括個體驅(qū)動基因中的體細胞事件、某些全局突變特征和特定的HLA限制性新抗原等。然而,這些特征往往是相互關(guān)聯(lián)的,這突顯了識別產(chǎn)生免疫反應(yīng)性腫瘤環(huán)境的基因驅(qū)動事件的復(fù)雜性。這項研究為以綜合和多方面的方式分析大規(guī)模臨床群體,以增強發(fā)現(xiàn)免疫檢查站封鎖反應(yīng)的有臨床意義的預(yù)測特征能力,開辟了一條前進的道路。
(七)
The maize W22 genome provides a foundation for functional genomics and transposon biology
玉米W22基因組為功能基因組學(xué)和轉(zhuǎn)座子生物學(xué)提供了基礎(chǔ)
自20世紀中葉以來,玉米W22自交系一直是玉米遺傳的平臺。為了簡化玉米基因組分析,研究者已經(jīng)使用高通量測序技術(shù)對W22參考基因組進行測序和重新組裝。結(jié)果表明,從轉(zhuǎn)座子組成和拷貝數(shù)變異到單核苷酸多態(tài)性,與B73參考基因組相比,在多個尺度上存在顯著的結(jié)構(gòu)異質(zhì)性。這種參考基因組的產(chǎn)生使得數(shù)以千計的突變子(Mu)和解離子(Ds)轉(zhuǎn)座子插入能夠被準確放置,用于反向和正向遺傳學(xué)研究。使用RNA-seq、差異核酸酶敏感性圖譜和亞硫酸氫鹽測序分別測定了開放閱讀框、開放染色質(zhì)位點和DNA甲基化圖譜,實現(xiàn)了對基因組的注釋??傊?,這里開發(fā)的資源整合了W22作為功能基因組學(xué)的參考基因組,為玉米泛基因組奠定了基礎(chǔ)。
(八)
Extensive intraspecific gene order and gene structural variations between Mo17 and other maize genomes
Mo17和其他玉米基因組之間廣泛的種內(nèi)基因順序和基因結(jié)構(gòu)變異
玉米是一種重要的糧食作物,它具有高度的基因組多樣性和雜種優(yōu)勢。之前已經(jīng)公布了雌性系B73的基因組序列。在這里,研究者報道了相應(yīng)男性代表品系Mo17的從頭基因組組裝結(jié)果。在2183 Mb組裝基因組中,超過96.4 %的基因可以被10個假染色體中的362個scaffolds覆蓋,其中有38620個帶注釋的蛋白質(zhì)編碼基因。比較分析揭示了大的基因順序和基因結(jié)構(gòu)變異:大約10%的注釋基因是相互不同步的,超過20%的預(yù)測基因具有大的效應(yīng)突變或大的結(jié)構(gòu)變異,這可能會導(dǎo)致兩個自交系之間的蛋白質(zhì)差異。本研究結(jié)果提供了一個重要玉米種質(zhì)的高質(zhì)量參考基因組序列,所鑒定的種內(nèi)基因順序和基因結(jié)構(gòu)變異應(yīng)該會對雜種優(yōu)勢和基因組進化產(chǎn)生影響。
(九)
Estimation of complex effect-size distributions using summary-level statistics from genome-wide association studies across 32 complex traits
使用來自32個復(fù)雜性狀全基因組關(guān)聯(lián)研究的匯總水平統(tǒng)計來估計復(fù)雜效應(yīng)大小分布
研究者開發(fā)了一種基于似然的方法來分析匯總水平統(tǒng)計數(shù)據(jù)和外部連鎖不平衡信息,以估計常見變異的效應(yīng)大小分布,其特征在于潛在易感SNPs的比例和它們效應(yīng)的靈活正態(tài)混合模型。對32項全基因組關(guān)聯(lián)研究結(jié)果的分析表明,盡管所有性狀都是高度多基因的,但多基因的程度和性質(zhì)有很大差異。精神疾病和與精神健康和能力相關(guān)的性狀似乎是最多基因的,涉及一系列小的影響,包括主要慢性疾病在內(nèi)的大多數(shù)性狀都涉及具有明顯影響的SNPs群。通過預(yù)測發(fā)現(xiàn),鑒定解釋全基因組關(guān)聯(lián)研究中發(fā)現(xiàn)的大多數(shù)遺傳力的SNPs所需的樣本量將從幾十萬到幾百萬不等,這取決于性狀潛在的效應(yīng)大小分布。因此,本研究結(jié)果預(yù)測了多基因風(fēng)險評分對各種疾病的風(fēng)險預(yù)測能力。
(十)
Modified penetrance of coding variants by cis-regulatory variation contributes to disease risk
通過順式調(diào)節(jié)變異改變編碼變異體的外顯率有助于疾病風(fēng)險
編碼變體代表基因型和表型之間的許多最強關(guān)聯(lián),然而,它們在效果上表現(xiàn)出個體間的差異,稱為“可變外顯率”。在這里,研究者聚焦順式調(diào)控變異如何改變編碼變異的外顯率。使用GTEx數(shù)據(jù)庫中的功能基因組和基因數(shù)據(jù),研究者觀察到,在普通人群中,純化選擇已經(jīng)耗盡了預(yù)測會增加致病編碼變異外顯率的單倍型組合。相反,在癌癥和孤獨癥患者中,研究者觀察到疾病相關(guān)基因中致病變異體的外顯率增加的單倍型構(gòu)型的豐富,提供了編碼變異體的調(diào)控單倍型構(gòu)型影響疾病風(fēng)險的證據(jù)。最后,研究通過使用CRISPR/Cas9編輯孟德爾SNP來實驗驗證這個模型,在不同的表達單倍型上使用轉(zhuǎn)錄組作為表型讀數(shù)。本研究的結(jié)果表明,聯(lián)合調(diào)控和編碼變異效應(yīng)是人類性狀遺傳結(jié)構(gòu)的重要組成部分,并有助于改變致病變異的外顯率。
(十一)
Efficiently controlling for case-control imbalance and sample relatedness in large-scale genetic association studies
在大規(guī)模GWAS中有效控制case-control不平衡和樣本相關(guān)性的方法
目前利用大型生物庫在研究成千上萬種表型的全基因組關(guān)聯(lián)研究(GWAS)時,大多數(shù)病例數(shù)據(jù)比對照少得多。廣泛使用的兩種方法為線性混合模型和最近提出的邏輯混合模型,他們都表現(xiàn)不佳;當(dāng)用于分析不平衡的病例對照表型時,它們會產(chǎn)生較大的I型錯誤率。在這里,研究者提出了一種可擴展的、精確的廣義混合模型關(guān)聯(lián)檢驗,該檢驗使用saddlepoint近似來校準分數(shù)測試統(tǒng)計的分布。這種命名為SAIGE (可擴展和精確廣義混合模型)方法,即使在case-control比率非常不平衡的情況下,也能提供精確的P值。SAIGE使用最先進的優(yōu)化策略來降低計算成本,因此它適用于大型生物庫的成千上萬種表型的GWAS分析。通過對408961份來自歐洲血統(tǒng)的英國白人參與者的英國生物庫數(shù)據(jù)的分析,研究者發(fā)現(xiàn)SAIGE可以有效地分析大樣本數(shù)據(jù),控制不平衡的case-control比率和樣本相關(guān)性。