2022年2月17日, 國際學術期刊Cell Systems在線發表了万博英超狼队网官方网 徐書華教授團隊的研究成果“Haplotype-resolved de novo assembly of a Tujia genome suggests the necessity for high-quality population-specific genome references”。為了論證構建族群特異的參考基因組的必要性和應用價值,研究團隊利用長讀長(long-read sequencing)等新一代測序技術,從頭組裝(de novo assemble)了一個高質量的土家族基因組(TJ1);通過係統性數據分析和評估表明,相比於通用的人類參考基因組,族群特異性參考基因組能夠顯著提升遺傳變異檢測的準確度與靈敏性,更高效地揭示群體間的遺傳結構與遺傳差異,更全麵地判別醫學疾病相關的低頻罕見變異,更精準地輔助遺傳診斷(圖1)。該研究從方法學和技術層麵闡明了族群特異性參考基因組對遺傳學研究以及個性化醫學應用的重要性。
圖1. 研究的整體構架
基因組中蘊含的遺傳密碼決定了物種及個體間的差異,是表型世代傳承和生物演化的根源。國際人類基因組計劃(HGP)在2003年完成了第一個參考基因組,並長期以來作為通用的人類參考基因組廣泛應用在生物學與醫學研究中。目前通用的人類參考基因組(GRCh38)是由20個誌願者的DNA序列拚湊而成,其中歐裔族源成分約占57%,非裔占37%,亞裔占6%,如此低的亞裔族源比例無法全麵地代表亞洲人群的基因組結構和遺傳多樣性。長讀長測序技術的發展為從頭組裝高質量的參考基因組提供了技術支持,為數不多的幾個亞洲人群基因組的從頭組裝體(de novo assembly)已公開,包括漢族NH1和HX1、日本人JG1、韓國人AK1以及研究團隊此前與國內合作者共同發布的藏族ZF1等。這些組裝體為生物學研究提供了東亞人群基因組的參考資源。然而,關於族群參考基因組構建的價值和必要性仍然存在較多爭議,其中更有不少理論和技術問題尚未得到解決。舉例來說,在我國是否各民族都有必要構建參考基因組,抑或可借用既有的漢族參考基因組作替代?少數族群的參考基因組對遺傳學以及更廣泛的生物醫學研究的價值究竟有多大?如何構建以及如何充分發揮這些族群特異參考基因組的優勢?
圍繞這些問題,研究團隊利用了多種技術測定並組裝了一個土家樣本可區分親源的染色體水平高質量參考基因組(TJ1)。之所以選取TJ1作為研究目標,是因為土家族是遺傳關係上最接近漢族的少數民族(圖1A),該研究背後的邏輯是:如果土家族特異的參考基因組的構建都具有充分的價值,則說明其他與漢族遺傳關係更遠緣的少數民族更有必要構建自身的參考基因組。利用TJ1已經解析單親源的兩套染色體(TJ1.p0與TJ1.p1)及已公開的其它基因組資源(GRCh38,NH1,ZF1等;圖1B),研究團隊係統評估了族群特異性參考基因組在遺傳變異檢測、群體遺傳分析以及醫學應用中的影響與作用。
遺傳變異檢測方麵,TJ1相較其它參考基因組能顯著提升土家樣本短讀長測序(short read sequencing)的比對質量;更準確更靈敏地檢測出單核苷酸變異(single nucleotide variation)與基因組結構變異(structural variation),尤其是對後者的提升最為明顯(圖1C),並在單親源序列解析中作出更精準的推斷。研究團隊同時也提出了族群特異性參考基因組的“最佳實踐”分析流程(best practice),基於族群特異性參考基因組構建泛基因組圖(pan-genome graph)是其中重要一環,最終支撐遺傳變異檢測及深度分析和應用。
群體遺傳學分析方麵,TJ1能更好地代表土家樣本中優勢等位基因(major allele),更精細地體現土家與漢族之前的遺傳差異,從而為全基因組關聯分析與法醫學等領域提供更有信息量的祖源信息位點(ancestry informative marker)。此外,族群特異性基因組有助於自然選擇的檢測,比如研究中發現了在乳糖耐受相關的基因LCT以及與HBV相關的基因UBXN8上的遺傳變異可能在土家族中受到自然選擇,而這些信號無法通過使用通用的參考基因組檢測到(圖1D)。
醫學應用方麵,TJ1能更靈敏和廣譜地捕獲醫學相關基因上的罕見或低頻遺傳變異(圖1E);實際上,待測群體和參考基因組的遺傳關係與遺傳變異的檢測準確性和靈敏度呈正相關。此外,研究團隊還發現族群特異參考基因組能減少遺傳診斷的假陽性從而避免誤診。
最後,研究團隊也指出,不僅族群的遺傳背景在參考基因組的構建與應用中是關鍵因素,而且族群組裝體的測序組裝質量也非常重要。通過分析發現,低質量的族群參考基因組在實際應用中存在誤判風險,其表現甚至可能不及通用的人類參考基因組的效果。因此,該論文支持和呼籲構建高質量的族群參考基因組。
本研究工作由狗万外围充值 徐書華團隊青年研究員樓海一博士、中國科學院上海營養與健康研究所博士生高揚、謝波和王亦民作為共同第一作者主要實施和完成。樓海一博士與徐書華教授為該文共同通訊作者;万博英超狼队网官方网 為第一單位與通訊單位;狗万外围充值 附屬中山醫院與人類表型組研究院為通訊作者單位。
該項工作得到了國家自然科學基金委、人類表型組上海市市級重大專項、中國科學院、英國皇家學會牛頓基金、國家重點研發計劃、上海市科委等多項基金的資助,同時得到貝瑞基因公司的技術支持。
原文鏈接:https://www.sciencedirect.com/science/article/pii/S2405471222000412?dgcid=author
微信掃碼查看原文