於淼課題組合作開發從單細胞三維基因組數據中識別染色質環結構的新算法SnapHiC

發布時間:2021-08-27瀏覽次數:1847


大量近期研究表明, 染色質在細胞核內的三維空間結構, 例如A/B區室(compartment, 拓撲關聯結構域(TAD)和染色質環(chromatin loop, 可以在一定程度上調控細胞特異性的基因表達。其中染色質環結構富集於不同基因表達調控元件之間,對於深入了解轉錄調控機製具有重要助益。 目前,染色質構象捕捉技術(Hi-C)已被廣泛應用於描繪染色質在細胞核內的組織分布以及鑒定染色質的三維特征結構。而近年來快速發展的單細胞染色質構象捕捉(單細胞Hi-C)技術更使得人們可以在單細胞水平研究染色質在細胞核內的結構和分布。然而現有的識別染色質環結構的算法大都是針對由大量細胞產出的且進行深度測序的Hi-C數據開發的,並不適用於極度稀疏的單細胞Hi-C數據。因此,亟需開發專門適用於單細胞Hi-C數據的識別染色質環的數據分析方法。


2021826日,於淼青年研究員團隊與美國克裏夫蘭診所胡明博士團隊和加州大學聖地亞哥分校任兵教授團隊等合作在Nature Methods雜誌在線發表了題為“SnapHiC: a computational pipeline to identify chromatin loops from single cell Hi-C data”的文章,報道了他們開發的名為SnapHiC的新算法,可從少量單細胞Hi-C數據中準確地識別高分辨率(文中為10Kb分辨率)的染色質環結構。SnapHiC軟件目前已公開發布在Github網站(https://github.com/HuMingLab/snapHiC)。


SnapHiC算法首先利用重啟隨機遊走算法(random walk with restart, RWR)對每個單細胞的染色質相互接觸圖譜進行補全, 由此來推測染色體上任意兩個位點之間的接觸概率。之後SnapHiC通過配對t-檢驗鑒定出相互接觸概率顯著高於預期的位點對,作為候選的染色質環結構。為了盡可能地降低假陽性的比例,SnapHiC要求由候選的染色質環所聯結的兩個位點無論是在全局或局部背景模型下,其相互作用概率均在統計學意義上顯著高於預期值。最後,SnapHiC對所有候選染色質環進行聚類,並挑選出每一個聚類簇中相互作用最強的位點對作為最終識別的染色質環。


與傳統的將多個單細胞Hi-C數據疊加模擬大量細胞的Hi-C圖譜之後再識別染色質環的思路不同,SnapHiC將每個細胞視作獨立的數據集,通過對單細胞核內染色質相互接觸頻率的方差進行估計,提高了統計學檢驗的效能,從而能夠利用更少的單細胞Hi-C數據更準確地識別出更多的染色質環。這種統計學效能的提高,在細胞數較少時優勢尤為明顯。


作者首先將SnapHiC應用於已發表的小鼠胚胎幹細胞的單細胞Hi-C數據集,並與目前大量細胞Hi-C數據分析中常用的多種染色質環識別算法(HiCCUPSFastHiCFitHiC2HiC-ACT)進行比較,結果顯示相較於傳統算法,SnapHiC可在從更少的細胞中識別到更多更準確的染色質環。


作者隨後將SnapHiC應用於2019年發表的人腦前額葉皮層組織的單個細胞內的DNA甲基化和染色質三維結構 (sn-m3C-seq) 數據集 (PMID: 31501549)。作者從14種不同的細胞類型中, 更近一步地鑒定出每種細胞中的染色質環結構。分析結果發現很多染色質環具有細胞類型特異性,並且由這些細胞類型特異性的染色質環所聯結的兩端DNA通常與細胞特異性的基因表達與轉錄調控相關。作者最後利用這些染色質環將335個與神經精神障礙疾病相關的SNP位點與其可能調控的靶基因聯係起來。例如在星形膠質細胞(astrocytes)中,2個位於增強子內的與阿爾茲海默症(Alzheimer’s disease)關聯的序列變異(rs112481437, rs138137383) APOE基因的啟動子區域形成染色質環結構,揭示了這兩個SNP位點在星形膠質細胞中可能參與APOE基因的轉錄調控。 結果還顯示該染色質環結構在星形膠質細胞中的特異性:因為該結構並沒有在其它細胞類型中(如神經細胞neurons、小膠質細胞microglia和寡突膠質細胞oligodendrocytes)出現。


算法SnapHiC填補了利用單細胞Hi-C數據進行可靠染色質環鑒定方法領域的空白,極大的提高了從少量單細胞Hi-C數據中識別染色質環的檢測效能,有助於未來更好地研究複雜組織中的不同細胞類型中特異性染色質高級空間結構。


於淼青年研究員和現任NovaSignal公司軟件工程師的Armen Abnousi博士為本文的共同第一作者。美國克裏夫蘭診所胡明博士和加州大學聖地亞哥分校任兵教授為該論文的共同通訊作者,万博英超狼队网官方网 為第一單位。




Baidu
map