倪挺團隊開發新算法揭示基因內含子多聚腺苷酸化的動態調控
基因組領域知名期刊《Genome Research》在2021年11月這一期發表了狗万外围充值 倪挺課題組題為“Cancer-associated dynamics and potential regulators of intronic polyadenylation revealed by IPAFinder using standard RNA-seq data”的方法學研究論文。該研究開發了可以基於常規RNA-seq數據推斷基因中內含子poly(A)位點並定量其使用的生物信息學方法IPAFinder,利用IPAFinder可以幫助探索內含子多聚腺苷酸化在不同病理和生理條件下的動態變化和潛在生物學功能。
內含子多聚腺苷酸化(Intronic polyadenylation,IPA)指基因使用內含子poly(A)位點從而產生截短轉錄本的現象。最近的研究表明IPA在白血病發生發展和肌肉纖維化過程中具有重要作用。基於常規RNA-seq數據推斷位於3′ UTR區域的可變多聚腺苷酸化的方法(比如DaPars和QAPA)已有開發,但仍沒有基於使用最廣泛的常規RNA-seq數據推斷內含子中多聚腺苷酸化的方法,阻礙了對基因非編碼區複雜調控的認識。
為了解決這一問題,本研究開發了IPAFinder的方法,可從常規RNA-seq數據中直接推斷內含子poly(A)位點,並且不需要任何poly(A)位點的注釋信息。模擬數據的測試證明IPAFinder不僅可以準確推斷兩種不同類型的IPA(composite IPA和skipped IPA),還可以排除內含子保留、可變5′剪切位點等選擇性剪切事件的幹擾。對於覆蓋度在40×的有重複的模擬數據,IPAFinder能以高的準確率推斷出超過80%的差異使用的IPA位點。通過比較分析同時擁有常規RNA-seq和3′-seq的真實數據,發現IPAFinder分析結果和3′-seq分析結果總體一致。此外IPAFinder還能檢測到3′-seq檢測不到的動態變化的IPA事件(比如基因PDXDC1的IPA事件)。
抑癌基因TSC1存在內含子多聚腺苷酸化的動態調控
通過使用IPAFinder分析TCGA數據庫中六種癌症類型的正常/腫瘤配對樣本RNA-seq數據,研究團隊發現腫瘤樣本中內含子poly(A)位點使用比例存在上調趨勢。通過篩選,研究團隊最終得到490個非冗餘的動態變化的IPA事件,其中癌症相關基因TSC1、SPRED2和CCND2均被發現存在新的IPA調控。研究團隊進一步通過濕實驗分別對TSC1和SPRED2的IPA轉錄本的功能進行了探究,發現TSC1的IPA轉錄本可產生截斷蛋白,但該截斷蛋白與TSC1全長蛋白相比失去了抑製S6磷酸化的能力,這意味著TSC1的IPA轉錄本產生的截斷蛋白不能像TSC1全長蛋白一樣抑製mTOR信號通路。算法預測和實驗驗證均表明SPRED2的IPA轉錄本會產生非編碼RNA,它與SPRED2全長轉錄本相比也失去了抑製肺癌細胞增殖的能力。此外,通過分析公共數據庫,作者發現與細胞衰老相關的剪接因子(PTBP1/2、HNRNPC、U2AF1和U2AF2)以及與m6A修飾相關的因子(YTHDC1和METTL3)會調控內含子poly(A)位點的使用,提示IPA存在於眾多的生物學過程中並可能發揮重要作用。
万博英超狼队网官方网 及人類表型組研究院倪挺課題組博士生趙昭昭負責本研究的算法開發及生信分析部分,博士生許秋實負責實驗驗證部分,倪挺教授和万博体育分 魏剛博士為論文共同通訊作者。上海科技大學張力燁教授和狗万外围充值 胡躍清教授為該研究提供了寶貴建議。該研究獲得國家重點研發計劃課題、國家自然科學基金項目及上海市首批市級科技重大專項“國際人類表型組計劃(一期)”的支持。
論文鏈接:https://genome.cshlp.org/content/31/11/2095.long