基于地统计学与支持向量回归的QSAR建模

基于主成分分析(PCA)、地统计学(GS)和支持向量回归(SVR),提出了一种新的定量构效关系(QSAR)个体化预测方法——Weight-PCA-GS-SVR.其基本思路是:先以PCA降维并消除自变量间的信息冗余,继以SVR经非线性主成分筛选去除与因变量无关的主成分,再以保留主成分计算样本间的加权距离,然后以高维GS确定公用变程;每一个待测样本都以自身为中心从训练集中找出加权距离小于公用变程的私有k个近邻,以SVR训练建模完成个体化预测.Weight-PCA-GS-SVR从行、列两个方向对模型进行了优化,为自变量提供了一种新的加权方法,为解决最优k近邻选择难题提供了新的思路,并具有SVR原来的...

Full description

Saved in:
Bibliographic Details
Published inWuli huaxue xuebao Vol. 25; no. 8; pp. 1587 - 1592
Main Author 陈渊 袁哲明 周玮 熊兴耀
Format Journal Article
LanguageChinese
Published 湖南农业大学,湖南省作物种质创新与资源利用重点实验室,长沙,410128%四川大学化学工程学院,成都,610065%湖南农业大学生物安全科学技术学院,长沙,410128%湖南农业大学,湖南省作物种质创新与资源利用重点实验室,长沙,410128 2009
湖南农业大学生物安全科学技术学院,长沙,410128
Subjects
Online AccessGet full text
ISSN1000-6818

Cover

More Information
Summary:基于主成分分析(PCA)、地统计学(GS)和支持向量回归(SVR),提出了一种新的定量构效关系(QSAR)个体化预测方法——Weight-PCA-GS-SVR.其基本思路是:先以PCA降维并消除自变量间的信息冗余,继以SVR经非线性主成分筛选去除与因变量无关的主成分,再以保留主成分计算样本间的加权距离,然后以高维GS确定公用变程;每一个待测样本都以自身为中心从训练集中找出加权距离小于公用变程的私有k个近邻,以SVR训练建模完成个体化预测.Weight-PCA-GS-SVR从行、列两个方向对模型进行了优化,为自变量提供了一种新的加权方法,为解决最优k近邻选择难题提供了新的思路,并具有SVR原来的优点.经3个化合物活性实例数据集验证,新方法在所有参比模型中预测精度最高,且明显优于文献报道结果,Weight-PCA-GS-SVR在QSAR等回归预测领域有较广泛的应用前景.
Bibliography:11-1892/06
O641
Quantitative structure-activity relationship
Individual prediction
Geostatistics
Support vector regression
Quantitative structure-activity relationship; Geostatistics; Support vector regression; Principal component analysis; Individual prediction
Principal component analysis
ISSN:1000-6818