中国壮族群体父系单倍群及民族血统构成情况简介
壮族是我国人口最多的少数民族,民族语言为壮语,属汉藏语系壮侗语族壮傣语支。在我国境内的壮族总人口约为 1693 万(六普数据)。主要聚居在南方的各省市自治区,范围东起广东省连山壮族瑶族自治县,西至云南省文山壮族苗族自治州,北达贵州省黔东南苗族侗族自治州从江县,南抵北部湾,其中广西壮族自治区是壮族的主要分布区。此外,在越南等国家和地区也有其分布,被识别为岱依族和侬族。
23魔方祖源研究部对祖源数据库中的壮族群体的数据做一轮清洗和统计,以高区分度的视角下看我国壮族群体的父系类型以及民族血统的构成情况。
统计对象:民族问卷栏目中填写为「壮族」的样本。
数据清洗方法:对所有填写为「壮族」的样本进行基因关系计算,如果样本出现了 2-3 级基因关系亲属对的,则选择保留其中的一个男性样本;如果出现的 2-3 级 基因关系亲属,民族为非壮族的,则视为有晚近的跨民族通婚,则剔除此样本。由此获得了排除近亲关系,无晚近跨民族通婚历史的壮族男性样本 801 个,以此口径进行统计。
统计结果如下:
一、壮族的民族血统构成情况:(%)
可以看到我国的壮族群体,平均有三成以上的壮傣成分,该成分也是壮族群体和其他非壮傣群体区分度较大的特征成分。
二、壮族群体的父系单倍群构成情况:
我们对这 801 名男性壮族的父系单倍群类型进行了统计,发现 801 个样本分成了 207 个父系类型,父系单倍群多样性相对较高。在单倍群大类分型中,可以看到 O-M268 占比最高,占到了壮族群体的 52.93%。
我们筛选了壮族群体较为常见的如下类型进行详细介绍:
1. D-MF2279 类型,占到了壮族群体人口的 1.75%,为壮族群体的常见的父系类型之一。
根据23魔方的研究显示,D-MF2279 的最近共祖时间约在 2530 年前(春秋时期),人口占到中国男性总人口的 0.17%,主要分布于广西以及其相邻省市,该类型可以占到广西当地人口的 2.12%,此外在贵州、广东等省约有 0.50% 左右的分布。该类型在广西梧州一带约占当地人口的 8% 左右。
2. O-CTS4040*,为壮族群体的常见的父系类型之一,占到了壮族群体人口的 2.12%。经细化研究,发现该类型实际为 O-CTS4040 下游的 O-MF56251 分支,其最近共祖时间约在 3370 年前,初步估计该类型人口占到了中国男性总人口的 0.11%,主要分布于广西以及其相邻省市,该类型可以占到广西当地人口的 1.58%,此外在贵州 3.26%、广东和宁夏约有 2% 左右的分布。该类型在广西河池、来宾一带约占当地人口的 5~6% 左右。
3. O-CTS651,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 6.62%。该类型的最近共祖时间约在 4890 年前,人口占到中国男性总人口的 0.49%,广泛分布于南方各地。该类型可以占到广西当地人口的 3.14%、贵州 1.61%、广东 1.00%、海南 0.97%、重庆 0.85%、江西 0.75%、福建 0.74%、四川 0.74%。在广西的百色、防城港、来宾,以及贵州黔西南、海南儋州等地,该类型可以占到当地人口的 5%~10% 左右的比例。其中在其 O-Z23917 类型下游,存在一个共祖 1180 年前的广西壮族黄氏家族。
4. O-Z23762 类型,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 14.36%。该类型最近共祖时间约在 1970 年前,人口约占中国男性人口的 0.32%。该类型占到广西当地人口的 7%,其中在广西河池,该类型占到当地人口的 32%,此外在来宾、柳州两地,该类型占到当地人口的 17% 以上,据23魔方的研究,此类型对应为壮族特色的韦氏家族。
5. O-F923 类型,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 9.11%。该类型的最近共祖时间约在 4350 年前,人口占到中国男性总人口的 0.78%,主要分布于华南。该类型可以占到广西当地人口的 7.01%、广东 3.38%、云南和海南的 1.70%。在广西的梧州、崇左、南宁、贺州、百色,以及广东的云浮、海南的儋州等地,该类型可以占到当地人口的 10% 左右。据23魔方的研究,此类型下游 O-MF60643 类型可以对应为分布于岭南的莫氏家族。
6. O-F789 类型,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 9.74%。该类型的最近共祖时间约在 6320 年前,人口占到中国男性总人口的 0.79%,主要分布于广西以及相邻地区。该类型可以占到广西当地人口的 5.76%、云南 4.13%、贵州 2.41%、重庆 1.49%、四川的 1.32%。在广西的崇左该类型可以占到当地人口的 25% 左右。该类型在南亚和东南亚地区也有广泛的分布。
7. O-SK1730 类型,为壮族群体的较大的父系类型之一,占到了壮族群体人口的 8.24%。该类型的最近共祖时间约共祖于 2670 年前,人口占到中国男性总人口的 1.09%。主要分布于华南地区,该类型可以占到广西当地人口的 9.7%、广东 0.51%、海南 2.28%、云南 1.53%、贵州的 1.19%。据23魔方的研究,此类型下游 O-MF31768 类型可以对应为主体分布于壮族的覃氏家族。
8. O-FGC61038 类型,为壮族群体的常见的父系类型之一,占到了壮族群体人口的 0.87%。该类型的最近共祖时间约共祖于 1630 年前,人口占到中国男性总人口的 0.03%。主要分布于广西地区,该类型可以占到广西当地人口的 0.64%、贵州的 0.10%。据23魔方的研究,此类型可以对应为主体分布于壮族和瑶族群体的潘氏家族。
此外,C-AM00848、O-FGC61038、O-F4229、O-F838、O-MF117418、O-Y26367、O-Y37861、O-MF59333、O-CTS7228、O-Z3010、O-Z23392、O-F619、O-Z23327、N-Y24355 等类型在壮族群体里也占有一定的比例。
附图:壮族群体父系总体构成情况