构造性覆盖算法的SMOTE过采样方法

TP18; 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点.合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一.近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能.然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题.此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视.针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE.CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法.在12个典型的不平衡数据集上验证CMOTE算法的性能.实验结果表明,CMOT...

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 Vol. 14; no. 6; pp. 975 - 984
Main Authors 严远亭, 朱原玮, 吴增宝, 张以文, 张燕平
Format Journal Article
LanguageChinese
Published 安徽大学 计算机科学与技术学院,合肥,230601 01.06.2020
Subjects
Online AccessGet full text
ISSN1673-9418
DOI10.3778/j.issn.1673-9418.1905091

Cover

Abstract TP18; 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点.合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一.近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能.然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题.此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视.针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE.CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法.在12个典型的不平衡数据集上验证CMOTE算法的性能.实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力.
AbstractList TP18; 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点.合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一.近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能.然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题.此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视.针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE.CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法.在12个典型的不平衡数据集上验证CMOTE算法的性能.实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力.
Author 严远亭
吴增宝
朱原玮
张以文
张燕平
AuthorAffiliation 安徽大学 计算机科学与技术学院,合肥,230601
AuthorAffiliation_xml – name: 安徽大学 计算机科学与技术学院,合肥,230601
Author_FL ZHU Yuanwei
ZHANG Yanping
ZHANG Yiwen
WU Zengbao
YAN Yuanting
Author_FL_xml – sequence: 1
  fullname: YAN Yuanting
– sequence: 2
  fullname: ZHU Yuanwei
– sequence: 3
  fullname: WU Zengbao
– sequence: 4
  fullname: ZHANG Yiwen
– sequence: 5
  fullname: ZHANG Yanping
Author_xml – sequence: 1
  fullname: 严远亭
– sequence: 2
  fullname: 朱原玮
– sequence: 3
  fullname: 吴增宝
– sequence: 4
  fullname: 张以文
– sequence: 5
  fullname: 张燕平
BookMark eNo9jbtKA0EUQKeIYIz5B1vBXe-d504pIT4gksJYh9ndGckqE3AUtUsR3C8wgoKk0s7GQqz8m93kLwwoVgdOcc4Gafixt4RsIcRMqWS3iEch-BilYpHmmMSoQYDGBmn-u3XSDmGUguCcopJJk-xUL9PlZF5N3hav9_XzrH5_rD4e6qfpyXF_0F18l8uyrOaf1exrpTfJmjMXwbb_2CKn-91B5zDq9Q-OOnu9KCBwHaWUcnAccp5l0hhnKEeRAQjtciFZrjPGLFhgaYLaUiZSh6mQChGlSIxlLbL9270x3hl_NizG15d-dRwWoTi_vbsKFCiABNDsB1TiVZI
ClassificationCodes TP18
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.3778/j.issn.1673-9418.1905091
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitle_FL Constructive Covering Algorithm-Based SMOTE Over-sampling Method
EndPage 984
ExternalDocumentID jsjkxyts202006009
GrantInformation_xml – fundername: The National Natural Science Foundation of China under Grant Nos. 61806002, 61673020, 61872002; the Doc-toral Scientific Research Startup Foundation of Anhui University
GroupedDBID 2B.
4A8
92I
93N
ALMA_UNASSIGNED_HOLDINGS
M~E
PSX
TCJ
ID FETCH-LOGICAL-s1049-b2240f40d4cc6aafa2415c0059fd563d9c33e0e03b819e235bf1b567111658ae3
ISSN 1673-9418
IngestDate Thu May 29 04:00:17 EDT 2025
IsPeerReviewed true
IsScholarly true
Issue 6
Keywords 过采样技术
不平衡数据
合成少数类过采样技术(SMOTE)
构造性覆盖算法(CCA)
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1049-b2240f40d4cc6aafa2415c0059fd563d9c33e0e03b819e235bf1b567111658ae3
PageCount 10
ParticipantIDs wanfang_journals_jsjkxyts202006009
PublicationCentury 2000
PublicationDate 2020-06-01
PublicationDateYYYYMMDD 2020-06-01
PublicationDate_xml – month: 06
  year: 2020
  text: 2020-06-01
  day: 01
PublicationDecade 2020
PublicationTitle 计算机科学与探索
PublicationTitle_FL Journal of Frontiers of Computer Science & Technology
PublicationYear 2020
Publisher 安徽大学 计算机科学与技术学院,合肥,230601
Publisher_xml – name: 安徽大学 计算机科学与技术学院,合肥,230601
SSID ssib054421768
ssib002040941
ssib002423894
ssib051375751
ssib023646573
ssib036438069
ssib002040926
Score 2.214999
Snippet TP18;...
SourceID wanfang
SourceType Aggregation Database
StartPage 975
Title 构造性覆盖算法的SMOTE过采样方法
URI https://d.wanfangdata.com.cn/periodical/jsjkxyts202006009
Volume 14
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwpV3NbtQwEI5KuXBBIED8q0L4BFmS2I7to7PrVYVUONBKvVVJNgG10iKxWwl6QJWo2CegSCChnuDGhQPixNvstm_BjONNUn6kApfVZDKe8XjWmc-7ntjzbkPGymPJI58NBPNZXAa-SiX38yyD7JkyoUq7y_dBvLzG7q_z9YVTr1q7lrbHWSff-W1dyb9EFXgQV6yS_YvI1kqBATTEFz4hwvB5ohgTExNliGTEKNyyoAPkICGIkUQDHRMjiEqIsoQ2RAmUSShR3N7S0PzRysNVgy2SPpHCKhOWiFFlYglQkKi6aRvTWlOG6PCYBdUlibYcMAK3ONE97JFhJJFEGttTaBWhTMKAmMfeiWjuegSakKNJ8-rIuQGrF7SoPmpBdaYR4UQFqBlNRzhOSIBsry2SdO2ogf7EWrSOuuTsfgyJgmbTlv36OkVSWQWGJD3LYXbYnZ93_mNUNIawEtb9lowiSqErUdc5JyVakRH2HM_CwrfetLJMLKivmEs88zTEWtOtnVNUdbSMgyeqOlHv58xHhZA286GBTm2gA3gPIWGT7es9mJujza3nL8YjHEboHhbBno6EsHsdVl6aBsPBY16116B4zY4VQwPorR_qeCBBzBtMDJdUBnGNmXlIBf7XV18zBqviqmR13utqxx26dO9PDtkau2GZDh-34ODqOe-sW8ct6WpSnvcWdp5c8O5OP-wd7R5Mdz8dfnw9e78_-_x2-uXN7N2enWCH3ydHk8n04Ot0_xuwL3prfbPaXfbdcST-KIR1tJ8h-i1ZMGB5HqdpmSL4zbF6uxzwmA5UTmkRFAHNAGUXEeVZGWY8FiG-4UqmBb3kLQ6fDovL3hJTISvAk0jlA8ZpKWVGU1iIBCUgdlgRXfFuOe823ONmtPFLvK6eROiad6aZJ9e9xfGz7eIGwOhxdtOG-Qd0UYrD
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E6%9E%84%E9%80%A0%E6%80%A7%E8%A6%86%E7%9B%96%E7%AE%97%E6%B3%95%E7%9A%84SMOTE%E8%BF%87%E9%87%87%E6%A0%B7%E6%96%B9%E6%B3%95&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8E%A2%E7%B4%A2&rft.au=%E4%B8%A5%E8%BF%9C%E4%BA%AD&rft.au=%E6%9C%B1%E5%8E%9F%E7%8E%AE&rft.au=%E5%90%B4%E5%A2%9E%E5%AE%9D&rft.au=%E5%BC%A0%E4%BB%A5%E6%96%87&rft.date=2020-06-01&rft.pub=%E5%AE%89%E5%BE%BD%E5%A4%A7%E5%AD%A6+%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6%9C%AF%E5%AD%A6%E9%99%A2%2C%E5%90%88%E8%82%A5%2C230601&rft.issn=1673-9418&rft.volume=14&rft.issue=6&rft.spage=975&rft.epage=984&rft_id=info:doi/10.3778%2Fj.issn.1673-9418.1905091&rft.externalDocID=jsjkxyts202006009
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjkxyts%2Fjsjkxyts.jpg