2010年,研究人员发表了第一个来自古人类的基因组序列,使用了大约4000年前生活在格陵兰岛的一名男子的几绺头发。在此后的13年里,科学家已经从1万多名古人身上生成了基因组数据,而且没有放缓的迹象。
美国哈佛医学院人口遗传学家DavidReich说:“我们已经走到了这一步,对此我真的感到震惊。”他的团队维护着一个已发表的古人类基因组数据库,名为艾伦古DNA资源,本月一项发表于预印本网站bioRxiv的研究对该数据库进行了描述。
(资料图片)
在2010年之前,古DNA研究主要集中在有限的DNA片段上,比如大约16500个碱基对长的线粒体基因组,或者人类基因组中近31亿个碱基对的短片段。DNA测序技术的进步使得解码整个古基因组成为可能。最初,这个过程是劳动密集型的,依赖于发现真正的古DNA稀有样本。结果,科学家花了好几年时间才从十几个个体中获得基因组数据。
自2018年以来,得益于DNA测序和提取技术的进步,研究人员每年都能获得数千名古人类的基因组数据。对于许多样本,研究人员对一组100万个DNA碱基进行测序(这些碱基因人而异),而不是对整个基因组进行测序,因为后者的成本昂贵得多。
上一个冰河时代结束后12000年以来更近期的古人类样本也推动了该研究领域的发展,相比更古老的人类遗骸,这些样本数量更多,DNA质量更高。
绝大多数古人类基因组来自生活在欧亚大陆西部的人,这一地区包括欧洲、俄罗斯和中东。自2012年以来,大多数基因组来自欧洲和俄罗斯,尽管自2015年以来这一比例略有下降。
同时,古人类基因组来自其他区域的比例越来越高——特别是东亚、大洋洲和非洲。Reich说,鉴于非洲在人类历史上的中心地位,非洲古人类基因组比例的增多尤为重要。上个月,一个团队发表了迄今最大规模的非洲古基因组研究,Reich是团队成员之一。
墨西哥国立自治大学古人类基因组学家Maríaávila-Arcos说,古人类基因组的数量和全球多样性可能正在增长,但这是由少数实验室推动的。“他们跨越一个区域到另一个区域来解决这些重大问题,并尽可能多地对基因组进行测序。”
随着古基因组学变得越来越全球化,ávila-Arcos希望研究人员生成更少数量的基因组,保留宝贵的样本。“我们需要转变对数字的关注和痴迷。”她说。
根据Reich的说法,数据库中近80%的古人类基因组序列来自3个机构,他的团队贡献了近一半的序列,其他机构分别位于哥本哈根大学以及2个马克斯·普朗克研究所。
Reich表示,在世界上代表性不足的地区建立研究古基因组学的能力是“极其重要”的。
相关论文信息:https://doi.org/10.1101/2023.04.06.535797