徐書華團隊建立重構性別偏向性族群融合曆史的新方法MultiWaverX

發布時間:2022-05-23瀏覽次數:968

2022523日,生物信息學專業期刊Briefings In Bioinformatics在線發表了万博英超狼队网官方网 徐書華團隊的研究成果MultiWaverX: Modeling latent sex-biased admixture history 。該項工作提出了一種新方法MultiWaverX可推斷人群性別偏向性混合曆史,並應用該方法分析和重構了中亞地區、中東地區以及美洲大陸的17個人群的性別偏向性基因交流曆史。

性別偏向性實際上廣泛存在於人群基因交流過程中,即特定祖源的男女遺傳貢獻存在差異。非裔美國人(African Americans)和拉丁裔美洲人(Hispanic Americans or Latino American)為學界熟知的存在性別偏向性混合的人群。性別偏向性混合的研究對了解人群形成和演化曆程、理解現代人類遺傳差異、以及指導醫學研究都有重要的理論意義和應用價值。然而,受限於分析方法,人群演化曆史上錯綜複雜的基因交流中存在的性別偏向性長期以來未得到充分研究,特別是一些經曆過多次而複雜基因交流曆史的人群,曾經發生的不同方向的性別偏向混合往往被忽視。MultiWaverX的提出在很大程度上為這些問題的解決提供了新方法和新思路。


1. MultiWaverX算法流程圖

MultiWaverX是在研究團隊前期提出的算法MultiWaver基本模型和方法的基礎上進一步發展而來,特別是植入了性別偏向性混合曆史推斷模塊。其具體算法可以分為以下三個步驟(圖1):(1)基於常染色體的祖先片段長度分布信息,利用最大期望算法(EM algorithm)或二分搜索算法(Binary Search algorithm)估計不同混合模型下混合時間和常染色體混合比例等參數,進而利用似然比檢驗(Likelihood ratio test)或貝葉斯信息準則(Bayes Information Criterion)選擇最優混合模式。(2)在第一步確定的混合模式下,基於X染色體的祖先片段長度分布信息估計X染色體的混合比例。(3)針對每個祖先人群的每波混合事件,結合常染色體和X染色體的混合比例計算男性貢獻比例,從而判斷性別偏向性方向以及程度。相比於傳統方法,MultiWaverX有如下兩個優勢:首先,該方法可以準確地估計混合波數以及每波混合事件的混合時間、混合比例和性別偏向性混合參數,為後續性別偏向混合曆史的精細化重構打下基礎;其次,該方法充分利用常染色體與X染色體共享曆史事件的規律,通過數據量相對更豐富的常染色體推斷人群混合模式,進而估計性別偏向性參數,可以有效克服由於X染色體較短,數據量較小帶來的模型推斷不穩定的缺陷。係統的模擬驗證數據表明,MultiWaverX在不同混合模式下估計性別偏向性參數均有較高的準確性,在應對各類數據噪聲時也表現出一定的穩健性。此外,研究團隊依據混合過程中特定祖先人群男性貢獻比例的變化趨勢,進一步將性別偏向性混合模型歸納為以下五種(圖2):穩定模型(steady model)、增強模型 (enhanced model)、減弱模型(dilution model)、波動模型(turnover model)、抵消模型(cancellation model)。其中,性別偏向抵消模型最為特殊,性別偏向信號在經曆多次方向相反的混合事件後得以抵消。研究團隊在分析實際數據時,發現中國西北少數民族哈薩克族是該混合模型的代表人群。哈薩克族主要居住於中國西北地區,其主要遺傳成分來自東亞和歐洲祖先人群,且混合比例比在常染色體和X染色體水平上均為6040,若使用傳統方法進行推斷,結果均為無性別偏向混合。而通過MultiWaverX分析,研究團隊發現該人群呈現出早期歐洲男性為主(約3000年前),近期東亞男性為主(約750年前)的兩波性別偏向性混合曆史。


2. 性別偏向性混合模型分類及流程圖

現代人類曆史進程錯綜複雜,帝國的興起與衰敗,奴隸貿易與戰爭,人群的擴張與遷徙都對人群遺傳混合產生了深遠的影響。應用上,研究團隊選取全球典型混合人群分布區域,中亞、中東以及美洲大陸為例,分別解析其性別偏向性混合曆史,重構了全球人群性別偏向混合圖譜(圖3)。中亞地區位於歐亞大陸的腹心地帶,對於促進東西方文化、經濟與基因交流起著重要的作用,從古至今,歐亞大陸上複雜的人口流動曆史也不斷塑造著這片土地的遺傳多樣性。青銅時代歐洲人群東遷、公元前334324年間的亞曆山大東征以及始於公元前130年間的古絲綢之路都促進了早期歐亞大陸不同國家、不同文明之間的交流與碰撞。公元13世紀初,蒙古帝國的興起以及成吉思汗西征進一步推動了東西方在經濟、文化、宗教等方麵的交流。研究團隊基於中亞地區混合人群的分析結果表明該地區混合事件可以大致分為兩波,其中較久遠的一波發生在距今25003300年間,主要表現為歐洲男性與東亞女性為主的混合,而較為近期的一波大致為距今500900年前,其性別偏向主要為東亞男性為主的混合。公元7世紀,阿拉伯奴隸貿易與擴張促進了亞歐非三大洲內各個封建文明之間的經濟文化交流,推動了印度洋和地中海區域海上貿易的繁榮與發展,而位於亞歐非三洲交界的中東地區也為進一步了解人類進化曆史提供了重要信息。基於中東地區混合人群的研究結果表明其混合時間大致為距今1600年前,且混合偏向主要表現為歐洲男性與非洲女性。15世紀末,隨著地理大發現、新航路的開辟以及跨大西洋奴隸貿易的興起,大洲之間相對孤立的狀態進一步被打破。基於美洲大陸混合人群的分析表明該地區人群混合時間大致處於距今400500年前,且性別偏向為歐洲男性與非洲女性或美洲原住民人群女性為主的混合。以上曆史事件均對現代人類性別偏向性混合產生了深遠的影響,MultiWaverX的提出也為進一步解析世界人群遺傳多樣性形成和演化機製提供了新的方法和思路。


3. 現代人類演化曆史上性別偏向性混合模式示意圖

中國科學院上海營養與健康研究所博士研究生張瑞、北京交通大學數學與統計學院倪旭敏副教授、國科大畢業生苑鍇博士為該論文共同第一作者,万博英超狼队网官方网 /附屬中山醫院徐書華教授為通訊作者。万博英超狼队网官方网 、附屬中山醫院、人類表型組研究院為通訊單位。該項工作獲得了國家自然科學基金委、中國科學院先導專項、英國皇家學會牛頓基金、上海市科委、中央高校基本科研專項等多項基金的資助。


論文鏈接:https://academic.oup.com/bib/advance-article-abstract/doi/10.1093/bib/bbac179/6590437?redirectedFrom=fulltext&login=false


Baidu
map