一种基于半监督学习的地理加权回归方法
地理加权回归方法在小样本数据下回归分析精度往往不高。半监督学习是一种利用未标记样本参与训练的机器学习方法,可以有效地提升少量有标记样本的学习性能。基于此本文提出了一种基于半监督学习的地理加权回归方法,其核心思想是利用有标记样本建立回归模型来训练未标记样本,再选择置信度高的结果扩充有标记样本,不断训练,以提高回归性能。本文采用模拟数据和真实数据进行试验,以均方误差提升百分比作为性能评价指标,将SSLGWR与GWR、COREG对比分析。模拟数据试验中,SSLGWR在3种不同配置下性能分别提升了39.66%、11.92%和0.94%。真实数据试验中,SSLGWR在3种不同配置下性能分别提升了8.94...
Saved in:
Published in | 测绘学报 Vol. 46; no. 1; pp. 123 - 129 |
---|---|
Main Author | |
Format | Journal Article |
Language | Chinese |
Published |
中国测绘科学研究院政府地理信息系统研究中心,北京100830%中国测绘科学研究院政府地理信息系统研究中心,北京,100830
2017
辽宁工程技术大学测绘与地理科学学院,辽宁阜新123000 |
Subjects | |
Online Access | Get full text |
ISSN | 1001-1595 |
DOI | 10.11947/j.AGCS.2017.20150470 |
Cover
Summary: | 地理加权回归方法在小样本数据下回归分析精度往往不高。半监督学习是一种利用未标记样本参与训练的机器学习方法,可以有效地提升少量有标记样本的学习性能。基于此本文提出了一种基于半监督学习的地理加权回归方法,其核心思想是利用有标记样本建立回归模型来训练未标记样本,再选择置信度高的结果扩充有标记样本,不断训练,以提高回归性能。本文采用模拟数据和真实数据进行试验,以均方误差提升百分比作为性能评价指标,将SSLGWR与GWR、COREG对比分析。模拟数据试验中,SSLGWR在3种不同配置下性能分别提升了39.66%、11.92%和0.94%。真实数据试验中,SSLGWR在3种不同配置下性能分别提升了8.94%、3.36%和5.87%。SSLGWR结果均显著优于GWR和COGWR。试验证明,半监督学习方法能利用未标记数据提升地理加权回归模型的性能,特别是在有标记样本数量较少时作用显著。 |
---|---|
Bibliography: | geographically weighted regressiom semi-supervised learning; SSLGWR; population distribution 11-2089/P ZHAO Yangyang1,2, LIU Jiping1,2, XU Shenghua2, ZHANG Fuhao2, YANG Yi2(1. School of Mapping and Geographical Science, Liaoning Technical University, Fuxin 123000, China; 2. Chinese Academy of Surveying and Mapping, Beijing 100830, China) Geographically weighted regression (GWR) approach will be affected by the quantity of label data. However, it is difficult to get labeled data but easy to get the unlabeled data in applications. Therefore it is indispensable to find an useful way that can use the unlabeled data to improve the regression results. As we know semi-supervised learning is a class of supervised learning tasks and techniques that also make use of unlabeled data for training typically a small amount of labeled data with a large amount of unlabeled data. So this article develops a semi-supervised-learning geographically weighted regression (SSLGWR). Firstly it builds the GWR model by labeled data. Then t |
ISSN: | 1001-1595 |
DOI: | 10.11947/j.AGCS.2017.20150470 |