Support Vector Machines and logistic regression to predict temporal artery biopsy outcomes

Support vector machines (SVM) is a newer statistical method that has been reported to be advantageous to traditional logistic regression for clinical classification. We determine if SVM can better predict the results of temporal artery biopsy (TABx) for giant cell arteritis compared to logistic regr...

Full description

Saved in:
Bibliographic Details
Published inCanadian journal of ophthalmology Vol. 54; no. 1; pp. 116 - 118
Main Authors Ing, Edsel, Su, Wanhua, Schonlau, Matthias, Torun, Nurhan
Format Journal Article
LanguageEnglish
Published England Elsevier Inc 01.02.2019
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Support vector machines (SVM) is a newer statistical method that has been reported to be advantageous to traditional logistic regression for clinical classification. We determine if SVM can better predict the results of temporal artery biopsy (TABx) for giant cell arteritis compared to logistic regression. A database of 530 TABx patients with 10 covariates was used and randomly split into training and test sets. The area under the receiving operating curve (AUC), misclassification rate (MCR), and false negative rate (FN) were compared for SVM and logistic regression. AUC and MCR were used to tune the SVM. The SVM model with optimal AUC had gamma = 0.01267 and cost = 26.466, with 133 support vectors. The AUC/MCR/FN for logistic regression and SVM respectively were 0.827/0.184/0.524 and 0.825/0.168/0.571. In our dataset of 530 TABx subjects, SVM did not offer any distinct advantage over the logistic regression prediction model. Les machines à vecteurs de support (SVM, pour support vector machines) représentent une méthode statistique récente qui serait supérieure à la régression logistique classique pour réaliser une classification clinique. Nous avons entrepris de déterminer si une SVM peut prédire plus efficacement les résultats de la biopsie de l'artère temporale (BAT) que la régression logistique dans le diagnostic de l'artérite à cellules géantes (ACG). On a eu recours à une base de données regroupant 530 patients soumis à une BAT et affichant 10 covariables, puis aléatoirement réparti ces patients en deux groupes : ensemble d'apprentissage et ensemble de test. On a comparé la surface sous la courbe (SSC), le taux de classification incorrecte (MCR, pour misclassification rate) et le taux de faux négatifs (FN) obtenus par SVM et par régression logistique. La SSC et le MCR ont servi à mettre au point la SVM. Le modèle de SVM doté d'une SSC optimale donnait un résultat gamma de 0,01267 à un coût de 26,466, pour un ensemble de 133 vecteurs de support. Les SSC/MCR/FN de la régression logistique et de la SVM se chiffraient respectivement à 0,827/0,184/0,524 et à 0,825/0,168/0,571. Dans notre cohorte de 530 patients soumis à une BAT, la SVM n'offrait aucun avantage net par rapport au modèle de prédiction reposant sur la régression logistique.
Bibliography:ObjectType-Article-1
SourceType-Scholarly Journals-1
ObjectType-Feature-2
content type line 23
ISSN:0008-4182
1715-3360
1715-3360
DOI:10.1016/j.jcjo.2018.05.006