任务详情
步骤1:收集分析数据,探索输入变量(根长、茎长、根表面积和根体积)与目标值(胁迫程度)之间的潜在关系;步骤2:使用3倍标准偏差(3δ)方法检测离群值、缺失值或非数值数据;步骤3:将处理后的数据随机分成两部分:80%用于训练,20%用于测试;步骤4:对于训练集,分别采用4种优化算法对RF模型进行超参数优化,在训练过程中,将训练数据随机分割,采用5-重交叉验证方法,以平均均方根误差(RMSE)作为控制函数,寻找超参数的最优组合;步骤5:将测试集导入步骤4中输出的各最优预测模型,并横向比较生成的预测结果;步骤6:对最佳模型进行敏感性分析,求解各输入变量的相对重要性,并将结果与步骤1中发现的潜在关系进行比较。