(一)
Activity-by-contact model of enhancer–promoter regulation from thousands of CRISPR perturbations
基于數(shù)千種CRISPR擾動試驗明確增強子-啟動子調(diào)節(jié)的接觸活性模型
人類基因組中的增強子元件控制基因在特定細胞類型中的表達方式,并攜帶數(shù)千種影響常見疾病風(fēng)險的基因變異。然而,我們?nèi)匀徊恢涝鰪娮邮侨绾握{(diào)節(jié)特定基因的,我們也缺乏預(yù)測增強子——跨細胞類型的基因連接的一般規(guī)則。我們開發(fā)了一種實驗方法,CRISPRi-FlowFISH,來擾亂基因組中的增強子,并將其應(yīng)用于檢測 與30個基因相關(guān)的>3,500增強子。我們發(fā)現(xiàn),在預(yù)測CRISPR數(shù)據(jù)集中的復(fù)雜連接方面,簡單的接觸式活動模型明顯優(yōu)于以前的方法。這種接觸活性模型允許我們在染色質(zhì)狀態(tài)測量的基礎(chǔ)上,構(gòu)建給定細胞類型中增強子-基因連接的全基因組圖譜。CRISPRi-FlowFISH和接觸活性模型共同提供了一種系統(tǒng)的方法來繪制和預(yù)測哪些增強子調(diào)節(jié)哪些基因,并將有助于解釋非編碼基因組中數(shù)以千計的疾病風(fēng)險變異體的功能。
(二)
Comparative genetic architectures of schizophrenia in East Asian and European populations
東亞和歐洲人群精神分裂癥的比較遺傳結(jié)構(gòu)
精神分裂癥是一種使人衰弱的精神疾病,全球約有1%的終生風(fēng)險。大規(guī)模精神分裂癥基因研究主要報道了歐洲血統(tǒng)樣本,可能缺少重要的生物學(xué)見解。這里,我們報道了迄今為止東亞參與者(22,778例精神分裂癥患者和35,362名對照)的最大規(guī)模研究,在19個基因座中鑒定了21個全基因組顯著關(guān)聯(lián)。賦予精神分裂癥風(fēng)險的常見遺傳變異在東亞和歐洲祖先(遺傳相關(guān)性?=?0.98?±?0.03)之間具有高度相似的效應(yīng),這表明精神分裂癥的遺傳基礎(chǔ)及其生物學(xué)在不同人群中廣泛共享。一項包括東亞和歐洲祖先個體的固定效應(yīng)薈萃分析在176個基因座(53個新基因座)中鑒定出208個重要關(guān)聯(lián)??缂蚁稻氉鲌D減少了44個基因座的候選因果變異。多基因風(fēng)險評分在跨祖先轉(zhuǎn)移時降低了效果,突出了包含足夠的主要祖先群體樣本以確保其在人群中普遍性的重要性。
(三)
Neuronal impact of patient-specific aberrant NRXN1α splicing
患者特異性異常NRXN1α剪接對神經(jīng)元的影響
NRXN1經(jīng)歷廣泛的選擇性剪接,并且NRXN1中的非常見雜合缺失與神經(jīng)精神障礙密切相關(guān)。我們確定人類誘導(dǎo)多能干細胞(hiPSC)衍生的神經(jīng)元很好地代表了在人腦中觀察到的NRXN1α選擇性剪接的多樣性,記錄了123種高置信度框架內(nèi)人類NRXN1α亞型?;颊邅碓吹腘RXN1+/-HiPsC神經(jīng)元顯示野生型NRXN1α亞型減少了一半以上,并從突變等位基因表達了數(shù)十種新的亞型。患者來源的NRXN1+/-hiPSC神經(jīng)元中神經(jīng)元活性的降低通過以基因型依賴的方式過度表達個體對照亞型而得到改善,而個體突變亞型降低對照HiPsC神經(jīng)元中的神經(jīng)元活性水平。以基因型依賴的方式,患者特異性NRXN1+/-突變的表型影響可以通過野生型NRXN1α亞型水平的降低以及突變型NRXN1α亞型的存在而發(fā)生。
(四)
Stalled developmental programs at the root of pediatric brain tumors
小兒腦瘤根源的發(fā)育進程停滯原因
兒童腦瘤懷疑是產(chǎn)前起源的。為了識別脆弱的發(fā)育狀態(tài),我們從胚胎腦橋和前腦這兩個主要腫瘤部位生成了一個超過65,000個細胞的單細胞轉(zhuǎn)錄圖譜。我們得到了191個不同細胞群的特征,并定義了區(qū)域細胞多樣性和分化動力學(xué)。將大量腫瘤轉(zhuǎn)錄組投影到該數(shù)據(jù)集表明,WNT髓母細胞瘤與菱形唇源苔蘚纖維神經(jīng)元譜系和胚胎腫瘤相匹配,多層玫瑰花結(jié)完全概括了神經(jīng)元譜系,而2a/b組非典型畸胎樣/橫紋肌樣腫瘤可能起源于神經(jīng)外胚層之外。重要的是,單細胞腫瘤圖譜揭示了高度定義的細胞層次,反映了相應(yīng)正常譜系的轉(zhuǎn)錄程序。我們的發(fā)現(xiàn)確定特定神經(jīng)祖細胞分化受損是這些兒科癌癥的常見機制,并為未來的建模和治療干預(yù)提供了一個合理的框架。
(五)
Histone hyperacetylation disrupts core gene regulatory architecture in rhabdomyosarcoma
組蛋白高乙?;茐臋M紋肌肉瘤的核心基因調(diào)控結(jié)構(gòu)
核心調(diào)節(jié)轉(zhuǎn)錄因子(CR TFs)協(xié)調(diào)超增強子(SEs)的作用位置,以激活細胞身份指定基因網(wǎng)絡(luò)的轉(zhuǎn)錄,這一過程在促進癌癥中至關(guān)重要。在這里,我們定義了橫紋肌肉瘤的核心調(diào)節(jié)通路,并確定關(guān)鍵的CR TF依賴性。這些CR TF構(gòu)建組蛋白乙?;阶罡叩拿福欢艿氖?,同樣的酶也含有最多的組蛋白去乙?;浮N覀儼l(fā)現(xiàn),超乙?;x擇性地中止了CR TF的轉(zhuǎn)錄。為了研究這種表型的結(jié)構(gòu)決定因素,我們使用了絕對定量的結(jié)構(gòu)(AQuA) HiChIP,它揭示了天然SE接觸的侵蝕,以及涉及組蛋白乙?;慕佑|的異常擴散。超乙?;瘡暮诵恼{(diào)節(jié)遺傳元件中去除RNA 聚合酶II (RNA Pol II),并去除核糖核酸Pol II,但不去除BRD4相縮合物。這項研究確定了平衡組蛋白修飾狀態(tài)以維持硒結(jié)構(gòu)和CR TF轉(zhuǎn)錄的SE特異性要求。
(六)
WNT signaling and AHCTF1 promote oncogenic MYC expression through super-enhancer-mediated gene gating
WNT信號和AHCTF1通過超增強子介導(dǎo)的基因促進致癌MYC表達
WNT信號激活癌細胞中MYC的表達。這里我們報道,這個過程涉及致癌超增強子介導(dǎo)的活性MYC等位基因通過核孔增加的轉(zhuǎn)錄輸出。由于MYC轉(zhuǎn)錄物在細胞核中的衰變比在細胞質(zhì)中更快,致癌的超增強子促進了細胞核MYC轉(zhuǎn)錄物的輸出,加速了它們從結(jié)腸癌細胞的核降解系統(tǒng)中的逃逸。這一過程的總和,如計算機模擬所支持的,結(jié)腸癌細胞的細胞質(zhì)MYC信使核糖核酸水平高于野生型細胞。MYC的癌細胞特異性門控由AHCTF1(也稱為ELYS)調(diào)節(jié),它通過β-連環(huán)蛋白將核孔蛋白連接到致癌的超增強子上。我們的結(jié)論是,WNT信號與染色質(zhì)結(jié)構(gòu)協(xié)作,對規(guī)范癌癥驅(qū)動因子的表達進行轉(zhuǎn)錄后失調(diào)。
(七)
The mutational footprints of cancer therapies
癌癥治療的突變印跡
一些癌癥療法會破壞DNA并導(dǎo)致癌細胞和健康細胞的突變。治療誘導(dǎo)的突變可能是治療的一些長期和晚期副作用的基礎(chǔ),如精神殘疾、器官毒性和繼發(fā)性腫瘤。然而,不同化療造成的突變負擔(dān)尚未被探索。在這里,我們確定了六種廣泛使用的抗癌療法的突變特征或足跡,這六種療法涵蓋了來自不同器官的3500多個轉(zhuǎn)移性腫瘤。這些包括鉑類藥物產(chǎn)生的先前已知的和新的突變信號,以及核苷代謝抑制劑先前未知的信號。利用這些突變印跡,我們估計了不同治療方法對腫瘤突變負擔(dān)的貢獻,以及它們對基因組編碼和潛在驅(qū)動突變的風(fēng)險。這里確定的突變印跡允許精確評估不同癌癥治療的突變風(fēng)險,以了解它們的長期副作用。
(八)
Lack of detectable neoantigen depletion signals in the untreated cancer genome
未治療的癌癥基因組中缺乏可檢測的新抗原缺失信號
體細胞突變可導(dǎo)致新抗原的形成,新抗原是由人類白細胞抗原分子在腫瘤細胞表面呈現(xiàn)的免疫原性肽。預(yù)計這些突變處于負選擇壓力下,但最終新抗原耗竭的程度仍不清楚。在人類白細胞抗原親和力預(yù)測的基礎(chǔ)上,我們注釋了人類基因組與人類白細胞抗原結(jié)合肽的可譯性,并在來自未治療癌癥的大基因組數(shù)據(jù)集中篩選了降低的單核苷酸替代率。當(dāng)考慮到基于三核苷酸的突變信號時,明顯的新抗原耗竭信號變得可以忽略不計,這是由于缺乏能量或腫瘤進化早期活躍的有效免疫逃避機制。
(九)
A resource-efficient tool for mixed model association analysis of large-scale data
大規(guī)模數(shù)據(jù)混合模型關(guān)聯(lián)分析的資源高效利用工具
全基因組關(guān)聯(lián)研究(GWAS)已被廣泛用作檢測遺傳變異和表型之間關(guān)聯(lián)的實驗設(shè)計。兩個主要的混淆因素--人群分層和相關(guān)性,可能會導(dǎo)致夸大的GWAS檢驗統(tǒng)計數(shù)據(jù),從而導(dǎo)致虛假的關(guān)聯(lián)?;诨旌暇€性模型(MLM)的方法可用于解釋樣本結(jié)構(gòu)。然而,全基因組協(xié)會(GWA)在英國生物庫(UKB)等生物庫樣本中的分析常常超過大多數(shù)現(xiàn)有MLM工具的能力,尤其是在性狀數(shù)量很大的情況下。在這里,我們開發(fā)了一個基于MLM的工具(fastGWA),通過主成分控制種群分層,通過稀疏的遺傳關(guān)系矩陣控制關(guān)聯(lián)性,用于GWA生物庫規(guī)模數(shù)據(jù)的分析。我們通過大量仿真證明fastGWA是可靠的、強有力的和高資源效率的。然后,我們將fastGWA成功應(yīng)用于來自456,422個個體的陣列基因型和估算樣本上的2,173個性狀,以及來自UKB 46,191個個體的全外顯子測序樣本上的2,048個性狀。