蒸散发(Evapotranspiration,ET)是连接地表能量平衡、碳水循环的关键纽带,也是农业灌溉调控、干旱监测、流域水资源管理的核心参量。如何准确估算蒸散发,始终是大气科学、水文学和生态学等的前沿科学问题。传统物理模型虽机理清晰,但常受制于模型结构和参数化不确定性。近年来基于人工智能的机器学习模型迅速发展,成为了蒸散发估算的重要技术手段。这类模型数据拟合能力强,但缺乏对物理机理的明确表达,属于典型的 “黑箱” 模型,因此常存在泛化能力弱、物理一致性不足、可解释性差等问题。在这一背景下,如何推动机器学习方法从只会拟合数据向既懂数据、又懂物理机理的跨越,成为提升遥感估算蒸散发可信度和应用价值的关键突破口。
本研究提出了面向蒸散发遥感估算的物理约束机器学习新方法,基于H2O自动机器学习(AutoML)框架,分别构建并系统对比了无约束模型、输入数据约束模型(引入物理模型ET估算值作为输入特征)和损失函数约束模型(将物理方程嵌入深度学习损失函数中)。研究结果表明,物理约束能够明显提升机器学习模型在极端环境条件、小样本情况、空间外推场景的可靠性。其中,基于Penman-Monteith方程构建的损失函数约束模型(DLL_PM)综合表现最优,不仅在站点尺度保持较高精度,而且在流域尺度验证中也表现出更强优势。通过机器学习训练过程的可视化,研究进一步揭示了输入数据约束通过增强物理特征的重要性来提升物理一致性,而损失函数约束则通过大幅修正神经网络权重与偏置来保持物理一致性。这些发现深化了对物理约束与机器学习有效耦合方式的理解,也为变化环境下大尺度碳水循环评估提供了新的技术路径。
该项成果以“Development and validation of physically constrained machine learning for improving remote sensing-based evapotranspiration estimation”为题,发表在Remote Sensing of Environment期刊(2026,341,115460)。
黑河流域是我国第二大内陆河流域,从上游到下游涵盖森林、草地、农田、湿地、灌丛、荒漠等多种地表类型,是遥感模型发展与验证的理想试验区。本研究利用了黑河流域15个涡动相关通量站的长期观测数据(约93站年),涉及黑河流域主要的下垫面类型,并融合MODIS植被参数、全天候地表温度数据、WRF 再分析气象资料等,为模型开发和评估提供了扎实的数据基础(图1)。

图1 黑河流域植被类型以及所用通量站点空间分布
本研究首先通过AutoML自动筛选出最优的机器学习(梯度提升模型,GBM)与深度学习(深度神经网络,DNN)模型。在此基础上,设计了三类模型。(1)无约束模型(MLU、DLU):即AutoML筛选的最优模型,仅使用与ET相关的解释变量(如地表温度、叶面积指数等)估算ET;(2)输入数据约束模型(MLI、DLI):额外引入双层地表能量平衡模型(TSEB)或S型互补关系模型(SGC)的ET估算值作为输入特征;(3)损失函数约束模型(DLL):将地表能量平衡方程(SEB)或Penman-Monteith方程(PM)嵌入DL损失函数,创新性地通过推算空气动力学导度和表面导度来添加物理约束(图2)。

图2 自动机器学习训练、模型优选以及物理约束添加流程
站点尺度交叉验证(75%训练,25%验证)结果显示,所有模型RMSE均低于0.60 mm/d,精度优于同期物理模型(TSEB、SGC)。物理约束对深度学习模型的提升更为明显,RMSE降低了0.09-0.13 mm/d(图3)。在站点尺度独立验证中,物理约束改善了模型的空间外推能力,PM方程约束的深度学习模型(DLL_PM)比相应无约束模型RMSE降低了0.47 mm/d(图4)。

图3 站点尺度无约束(a、d)、输入数据约束(b-c、e-f)、损失函数约束(g-h)模型的交叉验证结果(2008-2022年,75%数据训练,25%数据验证)

图4 站点尺度无约束(a、d)、输入数据约束(b-c、e-f)、损失函数约束(g-h)模型的独立验证结果(2008-2022年,上、中、下游分别去掉垭口、大满、荒漠站
在极端环境条件下(如高温、干旱、低植被覆盖等),物理约束模型展现出更强的鲁棒性(图5)。样本量由75%降至25%时,物理约束尤其缓解了深度学习模型的性能下降,证明了其在数据稀缺场景下的优势(图6)。

图5 站点尺度无约束、输入数据约束、损失函数约束模型在不同环境条件的精度:(a-b)风速;(c-d)气温;(e-f)湿度;(g-h)叶面积指数;(i-j)净辐射; (i-j)土壤水分,左右两列分别对应相应的机器学习和深度学习模型

图6 训练样本量由75%下降到25%时无约束、输入数据约束、损失函数约束模型的精度差异比较
在流域尺度,本研究基于水量平衡ET的直接验证与比较了最优的无约束模型(MLU)、输入数据约束模型(MLI_SGC)、损失函数约束模型(DLL_PM)与ETMonitor、PML-V2两种主流遥感产品。结果显示DLL_PM模型在流域上、中、下游的MAPE分别为25.4%、28.9%和48.7%,精度略优于其他两种模型与主流遥感产品(图7)。

图7 基于水量平衡ET验证本文模型与两种主流遥感产品精度:(a)MLU;(b)MLI_SGC;(c)DLL_PM;(d)ETMonitor;(f)PML-V2
基于广义三帽法(TCH)的间接验证也表明DLL_PM具有最低的相对不确定性(24.2%)(图8)。时空分析结果表明,DLL_PM在年际变化和空间分布上与水量平衡ET、降水高度一致,能够捕捉生态输水工程、灌溉方式转变等典型事件对ET的影响(图9)。

图8 基于TCH方法评估本文模型与两种主流遥感产品的相对不确定性:(a)MLU;(b)MLI_SGC;(c)DLL_PM;(d)ETMonitor;(f)PML-V2

图9 MLU、MLI_SGC、DLL_PM与ETMonitor、PML-V2两种主流遥感产品的时间一致性分析:(a)全流域,(b-c)上、中、下游
借助特征重要性分析和神经网络权重/偏置分析,本研究进一步对机器/深度学习训练过程进行可视化,揭示了物理约束的作用机制:输入数据约束通过增强物理特征的重要性提升物理一致性,而损失函数约束则通过大幅修正神经网络权重与偏置来保持物理一致性(图10)。
![]()

图10 机器/深度学习训练过程可视化分析:(a-b)机器学习特征重要性分析;(c-d)深度学习特征重要性分析;(e-f)深度学习神经网络权重/偏置分析
综上,本研究面向蒸散发遥感估算,开发并验证了物理约束机器学习新方法,推动了机器学习从只会拟合数据向既懂数据、又懂物理机理的跨越,深化了对物理约束与机器学习有效耦合方式的理解。本研究推荐采用将物理方程嵌入损失函数的物理约束策略,其在实际应用中不依赖其他物理模型的实时输入,同时也保障了估算结果的高精度与物理一致性。本研究的方法论有望进一步推广到碳水耦合过程的多任务学习中,并结合预训练微调机制,为变化环境下大尺度碳水循环评估提供新的技术路径。
北京师范大学地理科学学部博士生韦家兴(现为博士后)为论文第一作者,刘绍民教授为通讯作者。共同作者还包括来自安徽师范大学、美国哥伦比亚大学、清华大学、中国科学院地理科学与资源研究所、意大利佛罗伦萨大学、武汉大学以及新疆大学的研究人员。研究得到了国家重点研发计划(2023YFF1303503)的资助。