我的祖源成分是怎么得出来的?
什么是祖源成分分析?
分子人类学(Molecular Anthropology)是人类学的一个新兴分支,主要利用分子水平的遗传信息,比如基因数据,来分析人类起源和演化等问题。
祖源成分(ancestry composition)分析,是其中一个重要的研究方向。研究者利用人体22对常染色体测序获得的DNA数据,可以从遗传角度区分不同地区和民族。
各色的祖源成分分析,会把你在各色测序获得的DNA数据(大约65万基因位点)和各色建立的不同地区人群标准参考数据库进行比较,获得你与各个地区人群相似程度的比例,从而推测你可能的祖源组成。
基因位点频率不同地区有差异
不同地区、不同人种和不同民族在基因上的差异表现在——在一些位点上,不同的基因类型分布频率不一样。
例如,影响人是否有腋臭的基因位点是rs17822931,在这个点基因型为C的人,体味更重一些。
rs17822931在世界不同地区的频率差异很大,比如在非洲有99%的人都携带C也就是体味比较重,在美洲和欧洲携带C的比例是86%,而在东亚携带C的比例只有22%,大部分东亚人携带是T。
所以如果一个人rs17822931测序结果为TT,从概率上来讲,他更可能是一个东亚人。
所以用很多类似rs17822931的点,即在不同地区,不同人群中基因类型频率分布有差异的位点, 我们就可以推测你祖先的地域来源构成。
为什么优先考虑地域而不是民族划分?
目前各色提供的祖源解读,是我们根据各色用户的基因数据和地理、民族信息,以及国外多个公开数据库,比如1000 Genomes Project,HapMap Project等基因组数据库推导得出的,涉及十四类祖源成分。推导使用的是美国加利福尼亚大学洛杉矶分校相关人员研发的,最广泛使用的专门计算祖源成分的软件——ADMIXTURE。
已有的对中国人群的分子人类学研究表明,居住地域相近的人群,在遗传学上往往更为接近。无论是汉族,还是其他少数民族,都可以被分为广义上的南北两个群落。
例如,中国的汉族可以大致分为南北两支,北方汉族主要分布在江苏以北、黄河中下游。而南方汉族可分为东南沿海的南方汉族和西南地区的汉族,典型南方汉族居住在福建、广东、台湾等地,而西南地区的汉族则大概分布在云贵川、湖南、湖北。
研究发现,北方汉族和北方少数民族的祖源成分的相似性,要明显大于北方汉族与南方汉族之间的相似性。同样地,西南地区的汉族,和彝族、土家族等当地少数民族十分接近,甚至高于和东南沿海(广东、福建等地)的南方汉族的相似性。
由于少数民族与当地汉族常年混居,已经在祖源成分上颇为接近,因此,我们的第一版祖源成分分析,将汉族与当地少数民族遗传特征,共同视为该地区祖源成分的参照数据。
除了南北方人祖源成分差异之外,中国人基因类型的另一分布规律是,欧洲(高加索)人种的祖源成分,自新疆北部向东南沿海呈现出递减的趋势。其中新疆地区的几个少数民族欧洲特征尤其明显。
目前各色尚缺乏足够的藏族人口数据。但以往数据表明,藏族祖源成分与北方汉族更为接近,而与南方汉族有较大差异,有研究者推测,藏族更可能是史前迁徙到高原地区的北方人,由于一直生活在高寒地区,因此与南方人基因交流较少。
数据才是最重要的
相比于国外,国内的祖源成分分析结果还不够细致和精准。主要原因是国内目前还没有较好的祖源参考数据库。尤其中国是一个多民族聚居和融合的国度,并且历史上人口曾经多次迁移和融合,近现代也有大量人口流动,这对构建一个庞大、准确且丰富的祖源数据库是一个重大挑战。
在数千名用户的支持下,各色已经迈出了探索祖先历史的第一步。未来,随着数据的不断增加和细化,你们还将继续改变整个中国祖源的研究现状。为了能加快祖源数据库的建设,我们期待你可以告诉我们更加全面的祖源信息,这会让你看到的结论越来越准确。
这些行为就可以帮到各色祖源研究:
(1)报告自己、父母、祖父母和外祖父母的出生地信息;
(2)报告自己家族明确的迁移历史;
各色感谢你的贡献,一旦解读结果有更新版本,我们会第一时间通知你。
参考研究
杜若甫, & 肖春杰. (1998). 用 38 个基因座的基因频率计算中国人群间遗传距离. 中国科学: C 辑, 28(1), 83-89.
肖春杰. (2000). 中国人群基因频率的主成分分析. 中国科学: C 辑, 30(4), 434-442.
Alexander, D. H., Novembre, J., & Lange, K. (2009). Fast model-based estimation of ancestry in unrelated individuals. Genome research, 19(9), 1655-1664.
Chakraborty, R., & Smouse, P. E. (1988). Recombination of haplotypes leads to biased estimates of admixture proportions in human populations. Proceedings of the National Academy of Sciences, 85(9), 3071-3074.
Qu, H. Q., Li, Q., Xu, S., McCormick, J. B., Fisher-Hoch, S. P., Xiong, M., … & Jin, L. (2012). Ancestry informative marker set for han Chinese population. G3: Genes, Genomes, Genetics, 2(3), 339-341.