基于数据填补的煤自燃温度预测模型

TD752; 现有煤自燃温度预测模型的建立大多基于较为完整的指标气体样本数据,但指标气体数据受仪器或人为因素影响,往往存在数据缺失现象,导致煤自燃温度预测准确率较低和过拟合等问题.针对上述问题,提出了将K近邻算法(KNN)、随机森林(RF)、决策树(DT)及基于粒子群优化的支持向量回归等填补算法(PSO?SVR)应用于缺失值填补,缺失数据和填补后的数据通过RF、SVR和极限梯度提升树(XGBoost)算法分别进行训练,并通过PSO算法优化参数,构建了基于数据填补的RF、XGBoost和SVR煤自燃温度预测模型.利用煤自然发火实验选取CO,CO2,CH4,C2H6,O2作为指标气体,并设计整体缺...

Full description

Saved in:
Bibliographic Details
Published in工矿自动化 Vol. 49; no. 1; pp. 28 - 98
Main Authors 翟小伟, 罗金雷, 张羽琛, 宋波波, 郝乐, 周妤婕
Format Journal Article
LanguageChinese
Published 陕西高校青年创新团队 矿山应急救援创新团队,陕西 西安 710054 2023
西安科技大学 陕西省煤火灾害防控重点实验室,陕西 西安 710054
西安科技大学 安全科学与工程学院,陕西 西安 710054
Subjects
Online AccessGet full text
ISSN1671-251X
DOI10.13272/j.issn.1671-251x.2022090032

Cover

More Information
Summary:TD752; 现有煤自燃温度预测模型的建立大多基于较为完整的指标气体样本数据,但指标气体数据受仪器或人为因素影响,往往存在数据缺失现象,导致煤自燃温度预测准确率较低和过拟合等问题.针对上述问题,提出了将K近邻算法(KNN)、随机森林(RF)、决策树(DT)及基于粒子群优化的支持向量回归等填补算法(PSO?SVR)应用于缺失值填补,缺失数据和填补后的数据通过RF、SVR和极限梯度提升树(XGBoost)算法分别进行训练,并通过PSO算法优化参数,构建了基于数据填补的RF、XGBoost和SVR煤自燃温度预测模型.利用煤自然发火实验选取CO,CO2,CH4,C2H6,O2作为指标气体,并设计整体缺失率为10%,20%,30%和CO,CO2缺失率为40%,50%,60%共6种随机数据缺失,采用平均绝对误差百分比(MAPE)作为填补效果评价指标,采用MAPE、判断系数R2和均方根误差(RMSE)作为模型性能评价指标,对4种填补算法和3种预测模型进行对比.对比分析结果表明:在6种数据缺失情况下,DT填补算法填补效果优于其他3种算法,在CO,CO2存在较多缺失值时,RF算法的填补值与实际值的MAPE偏大;在不调参的情况下,XGBoost模型虽然在训练集效果极好,但极易过拟合,而SVR模型预测效果极差,无法满足预测要求;在6种数据缺失情况下,基于DT填补算法的PSO?SVR、RF与PSO?RF煤自燃温度预测模型的MAPE均在4%左右,基于DT填补算法的RF模型无需优化就能较好地预测出煤自燃温度,具有良好的稳定性.
ISSN:1671-251X
DOI:10.13272/j.issn.1671-251x.2022090032