- +1
《自然》刊發中國36個民族泛基因組參考圖譜,助解復雜疾病遺傳因素
·研究表示,當基因個體來自代表性不足的中國少數民族群體時,我們會新發現一些基因序列,并找到一些缺失序列,這意味著我們或許會找到揭示人類進化的新線索,同時了解復雜疾病中的遺傳因素。
6月14日,中國泛基因組聯盟(Chinese Pangenome Consortium,CPC)發表了中國36個民族的泛基因組參考圖譜——CPC序列。這項研究初步構建了我國人群的泛基因組參考圖譜,揭示了中國人的基因組中隱藏著此前從未揭示過的基因序列。相關論文《A pangenome reference of 36 Chinese populations》已在《自然》(Nature)雜志發表,這也是中國學者領導的人群基因組研究首次登上《自然》。
相較于來自單一個體的基因組,泛基因組參考圖譜范圍更廣泛,包含了一個物種或群體中所有基因組的全集。此次的CPC序列結合了來自中國36個少數民族的58例樣本,證實了高質量的群體特異性基因組在遺傳和醫學應用中的必要性,幫助我們更全面地理解東亞人群,尤其是中國人群的基因組變異。

中國泛基因組聯盟發表中國36個民族的泛基因組參考圖譜——CPC序列。圖片來源:《自然》
研究人員表示:“人類基因組學正在經歷一個重要的轉變——從過去單一的參考序列發展為更加全面的泛基因組形式。眾所周知,在基因組研究中需要提高不同祖先背景的代表性,但與歐洲人相比,在亞洲人中進行的基因組研究數量還是較少,這也是為什么在種族群體間,基因組變異存在著相當大的差異。”
據悉,中國泛基因組聯盟(CPC)由復旦大學徐書華教授和西安交通大學葉凱教授聯合國內26家單位發起。在第一期研究計劃中,CPC對代表中國36個族群的58個樣本采用最新的基因組測序技術進行了深度測序,結合最新的單倍型基因組組裝方法,獲取了116個高質量單倍型基因組,并以圖基因組的方式構建了高質量中國人群參考泛基因組。
此次的CPC序列確定了1590萬個基因小變異和78072個基因結構變異,其中590萬個小變異和34223個結構變異未在最近發布的pangenome(一種新興的基因組分析模式)文獻中報道。約500萬個堿基對新序列存在于95%以上的單倍型中,被視為中國人群基因組核心序列,并被認為可能與中國人群特有的生物學功能或表型特征相關。
研究表示,當基因個體來自代表性不足的中國少數民族群體時,我們會新發現一些基因序列,并找到一些缺失序列。缺失的參考序列中富含古代遺傳的等位基因(一對染色體上相同位點的兩個基因)和基因,這些序列變異與角化(指細胞在特定條件下發生變化,從而使其形態和功能發生改變)、紫外線輻射反應、DNA修復、免疫反應等有關,這意味著我們或許會找到揭示人類進化的新線索,同時了解復雜疾病中的遺傳因素。
研究人員表示,在基因組序列比對中,使用特定種群的參考可以提高比對質量。“我們的CPC序列無疑提供了對亞洲人群,特別是中國人基因組變異的更全面的了解。” 在連續性和基本水平精度方面,CPC序列與當前的人類參考基因組版本——GRCh38旗鼓相當,甚至更勝一籌。與人類泛基因組參考聯盟(Human Pangenome Reference Consortium,HPRC)的圖譜相比,CPC參考圖譜提高了東亞樣本短讀長的完美比對率(在短基因序列長度的情況下,CPC的比對效果相似性更高)。
“在本次研究中,我們還找到了3629個受CPC特異性(只在CPC序列中表達)古代基因滲透段(現代人類基因組中滲入的古代DNA片段)影響的基因,其中1211個具有潛在功能性影響。這些基因在外源糖醛酸化(脂溶性物質反應)、類黃酮(維生素P)代謝過程,以及抗壞血酸和醛酸(肝臟用來解毒的重要物質)代謝過程中發揮著作用。它們同時還與多種疾病相關,例如結直腸癌、乳腺癌、神經系統疾病等。”
此外,該研究確定了相當大比例的古代起源序列,其中還有一些此前未被HPRC數據充分覆蓋的古代序列,研究人員強調:人類泛基因組參考聯盟的下一步工作中有必要包含更多不同的亞洲血統樣本。
不過,研究也指出,當前評估工具仍存在局限性,例如,在測序過程出現裝配錯誤的情況下,評估軟件無法確定正確的裝配。此外,雖然長讀長測序技術已經迅速發展,但由于成本問題,短讀長測序依然是基因組學研究的主要手段。而目前,由美國加州大學圣克魯斯基因研究所(University of California Santa Cruz Genomics Institute)的Benedict Paten研究團隊開發的短讀長測序映射工具Giraffe,在處理局部復雜的基因區域時還存在一些問題。隨著泛基因組圖譜的簡化,完美匹配(覆蓋圖譜每個頂點的匹配)的讀長比例持續下降,這表明基因組圖譜的多樣性也在減少。在將短讀長測序映射到泛基因組上時,如何實現高效且準確的映射仍然是一個亟待解決的問題。
“我們的計劃是生成500個個體的單倍型序列,這些序列將具有高質量、分階段和染色體水平的特征,覆蓋56個官方承認的民族,以及一些以前工作從未很好覆蓋的未識別民族,例如夏爾巴人(Sherpa)、刀郎人(Dolan)、克里雅人(Keriyan)、僜人(Deng)和羅布人( Lop Nur)。此外,我們還在進一步對CPC基因組中的功能元件(如基因、調控元件和轉錄異構體)進行全面注釋。”研究人員說,“我們期待中國泛基因組聯盟作為全球人類基因組學力量的重要組成部分,為構建高質量的泛基因組參考文獻,并將其應用于各種基礎和臨床研究項目做出巨大貢獻。”
據悉,此項研究由復旦大學、西安交通大學、中國醫學科學院等26家單位聯合完成。復旦大學徐書華教授、西安交通大學葉凱教授、中國醫學科學院褚嘉祐教授和復旦大學陸艷副教授為論文的共同通訊作者。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司