> 技术文档 > 基于ENMeval包的MaxEnt模型参数优化总结

基于ENMeval包的MaxEnt模型参数优化总结


MaxEnt模型参数优化

  • 1. MaxEnt模型优化:增加RM,降低模型过拟合风险,简易模型,平滑响应曲线,增强模型可解释性和转移性(生物入侵)
  • 2. 默认参数:FC=LQHP,RM=1
    • 2.1. 基于优化的 MaxEnt 模型预测气候变化下松褐天牛在我国的潜在适生区——林业科学
    • 2.2. 气候变化对木姜子属五种植物分布的影响——生态学报
  • 3. 默认参数:FC=LQHPT,RM=1
    • 3.1. 基于 MaxEnt 模型预测近现代和未来草地早熟禾的适宜分布区——草地学报
    • 3.2. 基于 MaxEnt模型的黄花刺茄在北方农牧交错带潜在适生区分析——草地学报
    • 3.3. Maxent模型复杂度对物种潜在分布区预测的影响——生物多样性
    • 3.4. Analysis of the distribution pattern of Chinese Ziziphus jujuba underclimate change based on optimized biomod2 and MaxEnt models——Ecological Indicators
  • 4. 总而言之

1. MaxEnt模型优化:增加RM,降低模型过拟合风险,简易模型,平滑响应曲线,增强模型可解释性和转移性(生物入侵)

  在物种分布模型(SDM)构建过程中,特别是使用最大熵模型(MaxEnt)时,正则化乘数(Regularization Multiplier, RM) 和 特征组合(Feature Classes, FC) 是两个对模型预测性能至关重要的可调参数。RM 通过控制模型复杂度的惩罚强度来影响拟合过程:较高的 RM 值会施加更强的正则化惩罚,倾向于生成更简单、泛化能力更强的模型,从而有助于降低过拟合风险。 FC 则决定了模型可以使用的环境变量特征转换类型(如线性 L、二次项 Q、铰链 H、乘积 P、阈值 T 等),选择恰当的 FC 集合能更有效地捕捉物种与环境变量间的复杂关系,显著影响模型的表现力和预测精度。

  由于环境变量之间常存在一定程度的多重共线性,这可能导致模型参数估计不稳定并增加过拟合风险。因此,在建模前进行环境变量筛选是必要的步骤,旨在减少冗余信息、简化模型结构并提升模型的稳健性。

  那么,如何科学地确定最优的 RM 和 FC 组合参数呢?这是模型调优的关键问题。参考相关文献,参数组合的评估通常基于 MaxEnt 模型在特定组合下运行后产生的多个验证指标,主要包括:

  • AUC (Area Under the ROC Curve):衡量模型整体区分存在点与背景点的能力。

  • AUC.diff (AUCtrain - AUCtest):反映模型在训练集和测试集上表现的差异,是过拟合程度的重要指示器(差值越大,过拟合风险越高)。

  • OR10 (Omission Rate at 10% training presence):评估模型对训练样本分布点的拟合优度。(训练区遗漏率)

  • delta.AICc (Difference in corrected Akaike Information Criterion):该指标被广泛认为是综合评估模型拟合优度与复杂度的核心标准。 delta.AICc > 2 通常表明相对于默认参数设置的模型,当前评估的模型具有显著更优的拟合效果与复杂度平衡,暗示默认参数可能并非最优选择,需考虑其他参数组合。

  关于 MaxEnt 模型的默认参数设置,文献中存在细微差异。主流观点普遍接受默认参数组合为 FC = LQHPT 和 RM = 1。 然而,也有部分研究指出或使用 FC = LQHP 和 RM = 1 作为默认设置 (个人认为后者比较靠谱)。鉴于这种不一致性,建议在实际研究或软件应用中,明确参考所使用 MaxEnt 软件版本(如 MaxEnt 软件本身或 dismo 等 R 包)的官方文档说明,或明确引用支持所采用默认参数组合的权威文献,以确保参数设置的准确性和可重复性。

  以下给出相关论文的认为的模型默认参数和相关结果:


2. 默认参数:FC=LQHP,RM=1

2.1. 基于优化的 MaxEnt 模型预测气候变化下松褐天牛在我国的潜在适生区——林业科学

基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结

2.2. 气候变化对木姜子属五种植物分布的影响——生态学报

基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结

3. 默认参数:FC=LQHPT,RM=1

3.1. 基于 MaxEnt 模型预测近现代和未来草地早熟禾的适宜分布区——草地学报

基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结

3.2. 基于 MaxEnt模型的黄花刺茄在北方农牧交错带潜在适生区分析——草地学报

基于ENMeval包的MaxEnt模型参数优化总结

基于ENMeval包的MaxEnt模型参数优化总结

3.3. Maxent模型复杂度对物种潜在分布区预测的影响——生物多样性

基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结

3.4. Analysis of the distribution pattern of Chinese Ziziphus jujuba underclimate change based on optimized biomod2 and MaxEnt models——Ecological Indicators

基于ENMeval包的MaxEnt模型参数优化总结
基于ENMeval包的MaxEnt模型参数优化总结

4. 总而言之

MaxEnt默认参数以预测“现实分布”为目标,易产生过度拟合,导致模型在“潜在分布”转移场景下预测不可靠;通过优化可降低复杂度、抑制过拟合、提升转移能力。

具体展开为 4 点:

  1. 目标差异
    默认参数源于早期对 266 个物种的测试,以刻画“现实分布”为目的;而在入侵生物学等研究中,需要将模型转移到新区域预测“潜在分布”,二者目标不一致。

  2. 过拟合风险
    MaxEnt 采用复杂机器学习算法,默认参数在训练区表现虽好,但对采样偏差敏感,易过拟合,使模型在新区域预测能力骤降。

  3. 转移能力不足
    过拟合导致模型仅在低阈值时表现尚可,一旦外推至入侵地或其他时空场景,遗漏率升高、预测失真

  4. 优化收益
    通过 ENMeval 调参(增加 RM、简化特征组合),选取 AICc 最低的简洁模型,能够:

    • 平滑响应曲线,更贴合生理生态意义;
    • 降低 AUC.diff、OR10 等指标,减少过拟合;
    • 显著提升模型在新区域的转移与预测精度。

因此,“降低复杂度、提高转移可靠性” 是进行 MaxEnt 参数优化的根本动因。

电子烟行业资讯