自然环境对人类生存空间的影响是认识过去“人地关系”的重要方面,也是多学科关注的热点问题。古代先民对栖息地的选择是对多种环境因子综和考量的结果,并且满足当时社会经济的需求。传统的基于gis数据提取分析的方法可以展示出单一环境要素对人类定居的影响,却不能客观的展示不同环境要素对人类定居影响的权重。而考古预测模型(archeological predictive model)可以定量化描述先民定居点和生存环境之间的关系,目前主要依赖的算法为逻辑回归和最大熵模型。近年来人工智能和机器学习方法的兴起可以为考古预测模型的研究提供了新的思路,但暂未得到广泛应用,其应用潜力还未得到检验。
基于此,我院董广辉教授课题组联合地理信息系统团队以自然环境差异大,新石器至青铜时代人类活动转变明显的青藏高原东北部作为研究区,使用多种机器学习模型,探讨不同文化人群对自然环境的选择策略,并预测了研究区内的考古遗址分布概率和不同文化的分布范围。本研究以研究区内考古遗址点的文化属性(包括仰韶-马家窑ys-mjy、齐家qj、卡约-辛店-诺木洪kxn)和模拟的随机点(代表“无遗址”点)作为分类变量(因变量);多种环境要素(包括了地形、植被、土地适宜性、水文、土壤、气候等六类16种环境因子)作为预测变量。构建监督的随机森林模型用于考古概率分布预测;非监督的自组织映射(self-organizing maps)模型和随机森林产生的重要性排序用于解释不同文化人群的环境选择差异,技术路线图如图1所示。
图1 技术路线图
模型的分类结果经过了袋外法、留出法(80%为训练集,20%为验证集)、10折交叉验证等方法的评估,并对产生的遗址概率分布图进行了kvamme增益验证。结果表明:(1)随机森林在预测考古遗址概率分布时具有很好的预测效果(kvamme增益g=0.89,越接近1表明模型预测性能越好)。模型产生的变量重要性排序表明海拔、耕地适宜性、气候和土壤侵蚀等级是影响人类环境选择最重要的因素。(2)som映射结果结合气候背景和生业模式研究揭示了不同文化人群环境选择策略及驱动机制:青藏高原东北部新石器-青铜时代先民的生存环境策略呈现出梯度模式,并受到气候环境和生业模式的影响。仰韶-马家窑人群生活在低海拔、适宜的水热条件下,符合当时先民粟黍农业种植和狩猎野生动物的社会发展;齐家时期先民对牛羊等牧业经济的适应抵抗住了气候的恶化,并成为新石器向青铜时代过渡的重要阶段;卡约-辛店-诺木洪文化时期的先民对外来作物(牛羊、大小麦等)的大规模吸收支持其突破了原有的生存环境限制,并登上更高海拔,适应更复杂的高原环境。
图2.随机森林模型对所有考古遗址分布范围的预测(a);以及对不同文化时期文化分布范围的预测(c-d).
图3.不同文化时期气候背景变化(a)及生业模式变化(b-c)
近期研究成果以“gis and machine learning models target dynamic settlement patterns and their driving mechanisms from the neolithic to bronze age in the northeastern tibetan plateau”为题发表在国际知名期刊remote sensing上,博士生李刚为第一作者,博士生董佳佳为通讯作者。该工作由国家自然科学基金国际(地区)合作与交流项目(no. 42261144670),第二次青藏高原综合科学考察研究项目(2019qzkk0601),云南省董广辉专家工作站项目(202305af150183),欧洲研究委员会项目(european research council,erc-2019-adg-883700-tram)共同资助。