「魔方祖源」App,随时随地查找家族资料

扫码打开「魔方祖源」App

Science主刊创新算法Twigstats,青铜期以来种族混合比例估算精度大幅提升!

最近比较忙,最近半年多发布的几组古DNA数据都没顾得上整合下。当然,动力不足,还一个很重要的原因是,经典的f2混合估算,对于远古基因流的噪音是无解的,这造成青铜期以后,各古代族群之间的混合模式几乎是无解的。

比如,想估算,盎格鲁撒克逊人,有多少北欧血统日耳曼系族群血统和多少英伦本地土著族群的血统,以往基于经典的f2算法,推断的混合比例不在正常的 0 和 1 之间(3.031811),并且标准误差甚至高达60.95149,根本无法提供任何有意义的推断。放在东方背景,因为古DNA样本很少,情况就更糟糕,远古基因流造成不同区域族群在低分辨率混合算法下变得高度模糊,比如,不排除远古基因流噪音的当前情形下,相对汉族等汉藏语族,新石器时代的中原人显然更接近西北地区的土族和内蒙古南部地区的蒙古族等现代蒙古语族人群。这显然是不合乎逻辑的,更可能的情况是,新石器期中原古人与现代南部蒙古语族的血统组成,旧石器晚期南北hunters的混合比例恰好非常接近,而并不意味着现代蒙古族语族才是古中原人嫡系后裔。

刚刚,Science主刊《中世纪早期欧洲的高分辨率基因组历史》(PMID-39743601)提供最新的算法,研究者开发的工具Twigstats,是一种时间分层祖先分析方法,它可以通过关注近期的融合将统计功效提高一个数量级,同时不受特定人群漂移的影响。为解决远古基因流的噪音提供了一种可能的解决方案。

具体而言,还是看盎格鲁撒克逊的案例,使用500代谱系修正后的f2算法,混合比例进入了合理区间0-1,即0.3812473,也就是说,英格兰撒克逊人,携带38%的斯堪的纳维亚早期铁骑时代古人基因组,62%为爱尔兰青铜期古人基因组,标准误大幅缩减到0.175。当然,误差还是比较大,有必要测试不同的年代谱系,筛选最低标准误下的混合估算值。

#Use a cutoff of 500 generations
f2_blocks <- f2_blocks_from_Relate(file_anc, file_mut, poplabels, file_map, t = 500)
f4_ratio(f2_blocks, popX="England_Saxon.SG", popI="Ireland_BA.SG", pop1="Britain.IronRoman.SG", pop2="Scandinavian_Peninsula_EIA(I).SG", popO="YRI")
#>   popO          popI                 pop1                             pop2
#> 1  YRI Ireland_BA.SG Britain.IronRoman.SG Scandinavian_Peninsula_EIA(I).SG
#>               popX       val        se
#> 1 England_Saxon.SG 0.3812473 0.1750409


相信,未来新刊发的新文献,将大大提升青铜期后古代人群混合结构的分析精度。

2 条评论
热门最新

不明觉厉😀总之技术向的要支持😀


添加评论

点赞

WA

wangbing

更正:爱尔兰青铜期古人基因组是作为的内群,对比组是Britain.IronRoman.SG(不列颠铁器时代和罗马时期群体)和Scandinavian_Peninsula_EIA(I).SG(斯堪的纳维亚早期铁器时代群体)。

添加评论

点赞