构造性覆盖算法的SMOTE过采样方法
TP18; 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点.合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一.近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能.然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题.此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视.针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE.CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法.在12个典型的不平衡数据集上验证CMOTE算法的性能.实验结果表明,CMOT...
Saved in:
Published in | 计算机科学与探索 Vol. 14; no. 6; pp. 975 - 984 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | Chinese |
Published |
安徽大学 计算机科学与技术学院,合肥,230601
01.06.2020
|
Subjects | |
Online Access | Get full text |
ISSN | 1673-9418 |
DOI | 10.3778/j.issn.1673-9418.1905091 |
Cover
Abstract | TP18; 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点.合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一.近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能.然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题.此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视.针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE.CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法.在12个典型的不平衡数据集上验证CMOTE算法的性能.实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力. |
---|---|
AbstractList | TP18; 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点.合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一.近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能.然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题.此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视.针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE.CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法.在12个典型的不平衡数据集上验证CMOTE算法的性能.实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力. |
Author | 严远亭 吴增宝 朱原玮 张以文 张燕平 |
AuthorAffiliation | 安徽大学 计算机科学与技术学院,合肥,230601 |
AuthorAffiliation_xml | – name: 安徽大学 计算机科学与技术学院,合肥,230601 |
Author_FL | ZHU Yuanwei ZHANG Yanping ZHANG Yiwen WU Zengbao YAN Yuanting |
Author_FL_xml | – sequence: 1 fullname: YAN Yuanting – sequence: 2 fullname: ZHU Yuanwei – sequence: 3 fullname: WU Zengbao – sequence: 4 fullname: ZHANG Yiwen – sequence: 5 fullname: ZHANG Yanping |
Author_xml | – sequence: 1 fullname: 严远亭 – sequence: 2 fullname: 朱原玮 – sequence: 3 fullname: 吴增宝 – sequence: 4 fullname: 张以文 – sequence: 5 fullname: 张燕平 |
BookMark | eNo9jbtKA0EUQKeIYIz5B1vBXe-d504pIT4gksJYh9ndGckqE3AUtUsR3C8wgoKk0s7GQqz8m93kLwwoVgdOcc4Gafixt4RsIcRMqWS3iEch-BilYpHmmMSoQYDGBmn-u3XSDmGUguCcopJJk-xUL9PlZF5N3hav9_XzrH5_rD4e6qfpyXF_0F18l8uyrOaf1exrpTfJmjMXwbb_2CKn-91B5zDq9Q-OOnu9KCBwHaWUcnAccp5l0hhnKEeRAQjtciFZrjPGLFhgaYLaUiZSh6mQChGlSIxlLbL9270x3hl_NizG15d-dRwWoTi_vbsKFCiABNDsB1TiVZI |
ClassificationCodes | TP18 |
ContentType | Journal Article |
Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
DBID | 2B. 4A8 92I 93N PSX TCJ |
DOI | 10.3778/j.issn.1673-9418.1905091 |
DatabaseName | Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
DocumentTitle_FL | Constructive Covering Algorithm-Based SMOTE Over-sampling Method |
EndPage | 984 |
ExternalDocumentID | jsjkxyts202006009 |
GrantInformation_xml | – fundername: The National Natural Science Foundation of China under Grant Nos. 61806002, 61673020, 61872002; the Doc-toral Scientific Research Startup Foundation of Anhui University |
GroupedDBID | 2B. 4A8 92I 93N ALMA_UNASSIGNED_HOLDINGS M~E PSX TCJ |
ID | FETCH-LOGICAL-s1049-b2240f40d4cc6aafa2415c0059fd563d9c33e0e03b819e235bf1b567111658ae3 |
ISSN | 1673-9418 |
IngestDate | Thu May 29 04:00:17 EDT 2025 |
IsPeerReviewed | true |
IsScholarly | true |
Issue | 6 |
Keywords | 过采样技术 不平衡数据 合成少数类过采样技术(SMOTE) 构造性覆盖算法(CCA) |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-s1049-b2240f40d4cc6aafa2415c0059fd563d9c33e0e03b819e235bf1b567111658ae3 |
PageCount | 10 |
ParticipantIDs | wanfang_journals_jsjkxyts202006009 |
PublicationCentury | 2000 |
PublicationDate | 2020-06-01 |
PublicationDateYYYYMMDD | 2020-06-01 |
PublicationDate_xml | – month: 06 year: 2020 text: 2020-06-01 day: 01 |
PublicationDecade | 2020 |
PublicationTitle | 计算机科学与探索 |
PublicationTitle_FL | Journal of Frontiers of Computer Science & Technology |
PublicationYear | 2020 |
Publisher | 安徽大学 计算机科学与技术学院,合肥,230601 |
Publisher_xml | – name: 安徽大学 计算机科学与技术学院,合肥,230601 |
SSID | ssib054421768 ssib002040941 ssib002423894 ssib051375751 ssib023646573 ssib036438069 ssib002040926 |
Score | 2.214999 |
Snippet | TP18;... |
SourceID | wanfang |
SourceType | Aggregation Database |
StartPage | 975 |
Title | 构造性覆盖算法的SMOTE过采样方法 |
URI | https://d.wanfangdata.com.cn/periodical/jsjkxyts202006009 |
Volume | 14 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwpV3NbtQwEI5KuXBBIED8q0L4BFmS2I7to7PrVYVUONBKvVVJNgG10iKxWwl6QJWo2CegSCChnuDGhQPixNvstm_BjONNUn6kApfVZDKe8XjWmc-7ntjzbkPGymPJI58NBPNZXAa-SiX38yyD7JkyoUq7y_dBvLzG7q_z9YVTr1q7lrbHWSff-W1dyb9EFXgQV6yS_YvI1kqBATTEFz4hwvB5ohgTExNliGTEKNyyoAPkICGIkUQDHRMjiEqIsoQ2RAmUSShR3N7S0PzRysNVgy2SPpHCKhOWiFFlYglQkKi6aRvTWlOG6PCYBdUlibYcMAK3ONE97JFhJJFEGttTaBWhTMKAmMfeiWjuegSakKNJ8-rIuQGrF7SoPmpBdaYR4UQFqBlNRzhOSIBsry2SdO2ogf7EWrSOuuTsfgyJgmbTlv36OkVSWQWGJD3LYXbYnZ93_mNUNIawEtb9lowiSqErUdc5JyVakRH2HM_CwrfetLJMLKivmEs88zTEWtOtnVNUdbSMgyeqOlHv58xHhZA286GBTm2gA3gPIWGT7es9mJujza3nL8YjHEboHhbBno6EsHsdVl6aBsPBY16116B4zY4VQwPorR_qeCBBzBtMDJdUBnGNmXlIBf7XV18zBqviqmR13utqxx26dO9PDtkau2GZDh-34ODqOe-sW8ct6WpSnvcWdp5c8O5OP-wd7R5Mdz8dfnw9e78_-_x2-uXN7N2enWCH3ydHk8n04Ot0_xuwL3prfbPaXfbdcST-KIR1tJ8h-i1ZMGB5HqdpmSL4zbF6uxzwmA5UTmkRFAHNAGUXEeVZGWY8FiG-4UqmBb3kLQ6fDovL3hJTISvAk0jlA8ZpKWVGU1iIBCUgdlgRXfFuOe823ONmtPFLvK6eROiad6aZJ9e9xfGz7eIGwOhxdtOG-Qd0UYrD |
linkProvider | ISSN International Centre |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E6%9E%84%E9%80%A0%E6%80%A7%E8%A6%86%E7%9B%96%E7%AE%97%E6%B3%95%E7%9A%84SMOTE%E8%BF%87%E9%87%87%E6%A0%B7%E6%96%B9%E6%B3%95&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8E%A2%E7%B4%A2&rft.au=%E4%B8%A5%E8%BF%9C%E4%BA%AD&rft.au=%E6%9C%B1%E5%8E%9F%E7%8E%AE&rft.au=%E5%90%B4%E5%A2%9E%E5%AE%9D&rft.au=%E5%BC%A0%E4%BB%A5%E6%96%87&rft.date=2020-06-01&rft.pub=%E5%AE%89%E5%BE%BD%E5%A4%A7%E5%AD%A6+%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6%9C%AF%E5%AD%A6%E9%99%A2%2C%E5%90%88%E8%82%A5%2C230601&rft.issn=1673-9418&rft.volume=14&rft.issue=6&rft.spage=975&rft.epage=984&rft_id=info:doi/10.3778%2Fj.issn.1673-9418.1905091&rft.externalDocID=jsjkxyts202006009 |
thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjkxyts%2Fjsjkxyts.jpg |