基于数据填补的煤自燃温度预测模型

TD752; 现有煤自燃温度预测模型的建立大多基于较为完整的指标气体样本数据,但指标气体数据受仪器或人为因素影响,往往存在数据缺失现象,导致煤自燃温度预测准确率较低和过拟合等问题.针对上述问题,提出了将K近邻算法(KNN)、随机森林(RF)、决策树(DT)及基于粒子群优化的支持向量回归等填补算法(PSO?SVR)应用于缺失值填补,缺失数据和填补后的数据通过RF、SVR和极限梯度提升树(XGBoost)算法分别进行训练,并通过PSO算法优化参数,构建了基于数据填补的RF、XGBoost和SVR煤自燃温度预测模型.利用煤自然发火实验选取CO,CO2,CH4,C2H6,O2作为指标气体,并设计整体缺...

Full description

Saved in:

Bibliographic Details
Published in	工矿自动化 Vol. 49; no. 1; pp. 28 - 98
Main Authors	翟小伟, 罗金雷, 张羽琛, 宋波波, 郝乐, 周妤婕
Format	Journal Article
Language	Chinese
Published	陕西高校青年创新团队矿山应急救援创新团队,陕西西安 710054 2023 西安科技大学陕西省煤火灾害防控重点实验室,陕西西安 710054 西安科技大学安全科学与工程学院,陕西西安 710054
Subjects	K近邻填补算法基于粒子群优化的支持向量回归填补算法煤自燃数据缺失填补决策树回归填补算法随机森林填补算法指标气体温度预测
Online Access	Get full text
ISSN	1671-251X
DOI	10.13272/j.issn.1671-251x.2022090032

Cover

More Information
Summary:	TD752; 现有煤自燃温度预测模型的建立大多基于较为完整的指标气体样本数据,但指标气体数据受仪器或人为因素影响,往往存在数据缺失现象,导致煤自燃温度预测准确率较低和过拟合等问题.针对上述问题,提出了将K近邻算法(KNN)、随机森林(RF)、决策树(DT)及基于粒子群优化的支持向量回归等填补算法(PSO?SVR)应用于缺失值填补,缺失数据和填补后的数据通过RF、SVR和极限梯度提升树(XGBoost)算法分别进行训练,并通过PSO算法优化参数,构建了基于数据填补的RF、XGBoost和SVR煤自燃温度预测模型.利用煤自然发火实验选取CO,CO2,CH4,C2H6,O2作为指标气体,并设计整体缺失率为10%,20%,30%和CO,CO2缺失率为40%,50%,60%共6种随机数据缺失,采用平均绝对误差百分比(MAPE)作为填补效果评价指标,采用MAPE、判断系数R2和均方根误差(RMSE)作为模型性能评价指标,对4种填补算法和3种预测模型进行对比.对比分析结果表明:在6种数据缺失情况下,DT填补算法填补效果优于其他3种算法,在CO,CO2存在较多缺失值时,RF算法的填补值与实际值的MAPE偏大;在不调参的情况下,XGBoost模型虽然在训练集效果极好,但极易过拟合,而SVR模型预测效果极差,无法满足预测要求;在6种数据缺失情况下,基于DT填补算法的PSO?SVR、RF与PSO?RF煤自燃温度预测模型的MAPE均在4%左右,基于DT填补算法的RF模型无需优化就能较好地预测出煤自燃温度,具有良好的稳定性.
ISSN:	1671-251X
DOI:	10.13272/j.issn.1671-251x.2022090032