Diabetes prediction using the multilayer perceptron algorithm: an analysis of the diabetes dataset

Introducción La diabetes es una enfermedad crónica caracterizada por altos niveles de glucosa en la sangre, lo que puede conducir a graves complicaciones de salud si no se trata. Según la Organización Mundial de la Salud, aproximadamente 422 millones de adul-tos en todo el mundo tenían diabetes en 2...

Full description

Saved in:

Bibliographic Details
Published in	Medwave Vol. 23; no. S1; p. eUTA060
Main Authors	Arias T., Susana A., Hidalgo Morales, Kattyta
Format	Journal Article
Language	English
Published	01.09.2023
Online Access	Get full text

Cover

Loading…

More Information
Summary:	Introducción La diabetes es una enfermedad crónica caracterizada por altos niveles de glucosa en la sangre, lo que puede conducir a graves complicaciones de salud si no se trata. Según la Organización Mundial de la Salud, aproximadamente 422 millones de adul-tos en todo el mundo tenían diabetes en 2014, y se espera que este número aumente a 642 millones para 2040. El diagnóstico y la intervención temprana pueden ayudar a prevenir las complicaciones asociadas con la diabetes, lo que hace que el diagnóstico preciso y eficiente sea un objetivo crítico para los proveedores de atención médica. En los últimos años, los algoritmos de aprendizaje automático como MLP se han mostrado prometedores para predecir la probabilidad de diagnóstico de diabetes en función de las características del paciente. El conjunto de datos de diabetes propor-ciona un recurso valioso para explorar la aplicación de MLP en el diagnóstico de diabetes (Dweekat & Lam, 2023; Lopez-Rodriguez, Sanchez-Ortiz, Reynoso-Camacho, Riesgo-Escovar, & Loarca-Piña, 2023). El perceptrón multicapa (MLP) es un tipo de red neuronal que se puede usar para tareas de clasificación y regresión, y se ha aplicado a muchos conjuntos de datos médicos para predecir resultados como el diagnóstico de enfermedades, la respuesta al tratamiento y la supervivencia del paciente (Nipa et al., 2023; Safar, Salih, & Murshid, 2023) (Chawla, 2023). El dataset este conjunto de datos proviene originalmente del Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales. El objetivo es predecir en base a medidas di-agnósticas si un paciente tiene diabetes. Se impusieron varias restricciones a la selección de estas instancias de una base de datos más grande. En particular, todos los pacientes aquí son mujeres de al menos 21 años de herencia indígena pima. Embarazos: Número de veces embarazadas Glucosa: concentración de glucosa en plasma a las 2 horas en una prueba de toler-ancia oral a la glucosa Presión arterial: presión arterial diastólica (mm Hg) Grosor de la piel: Grosor del pliegue cutáneo del tríceps (mm) Insulina: insulina sérica de 2 horas (mu U/ml) IMC: Índice de masa corporal (peso en kg/(altura en m)^2) DiabetesPedigreeFunction: función de pedigrí de diabetes Edad: Edad (años) Resultado: variable de clase (0 o 1) Objetivos 1. Predecir la diabetes mediante el uso de algoritmos de inteligencia artificial. 2. Utilizar datasets para experimentar con algoritmos de inteligencia artificial. Método Preprocesamiento de datos: antes de usar MLP, el conjunto de datos médicos debe procesarse previamente para manejar los datos faltantes, normalizar las carac-terísticas y estandarizar los datos para mejorar la precisión del algoritmo. Elección de la arquitectura: es necesario elegir la arquitectura del MLP, incluida la cantidad de capas, la cantidad de neuronas por capa, la función de activación y la tasa de aprendizaje. La arquitectura óptima depende del tamaño y la complejidad del conjunto de datos y de la tarea en cuestión. Entrenamiento del MLP: una vez que los datos se procesan previamente y se elige la arquitectura, el MLP se puede entrenar en el conjunto de datos. Esto implica in-troducir los datos en el MLP, calcular el error entre la salida pronosticada y la salida real y ajustar los pesos de las neuronas utilizando retropropagación para minimizar el error. Prueba y validación: la precisión del MLP se puede evaluar utilizando un conjun-to de prueba que está separado del conjunto de entrenamiento. El rendimiento del algoritmo se puede medir utilizando métricas como precisión, sensibilidad, especi-ficidad, precisión, recuperación y puntuación F1. Hacer predicciones: una vez que se entrena y valida el MLP, se puede usar para hacer predicciones en nuevas instancias. Por ejemplo, si la información médica de un paciente se ingresa en el MLP, puede predecir la probabilidad de diagnóstico de la enfermedad, la respuesta al tratamiento o la supervivencia del paciente. Principales resultados En general, MLP puede ser una herramienta poderosa para predecir la presencia o ausencia de diabetes en pacientes y puede proporcionar a los proveedores de atención médica información valiosa para el tratamiento y la intervención. Sin embargo, es importante considerar cuidadosamente la arquitectura y el pre-procesamiento de los datos para lograr una alta precisión e interpretabilidad. Nuestros resultados muestran que MLP es un algoritmo efectivo para predecir la presencia de diabetes, logrando una precisión de hasta el 82% . Nuestro estu-dio destaca la importancia del preprocesamiento de datos para lograr una alta pre-cisión y demuestra el potencial de MLP como una herramienta valiosa para predecir y prevenir la diabetes. Conclusiones En conclusión, nuestro estudio demuestra la eficacia de MLP para predecir la pres-encia de diabetes en función de las características de los pacientes. Hacemos hin-capié en la importancia de seleccionar cuidadosamente los parámetros del algoritmo y los métodos de preprocesamiento de datos para lograr resultados precisos e inter-pretables. MLP proporciona una vía prometedora para mejorar el diagnóstico y la prevención de la diabetes, y la investigación adicional puede explorar el uso de otras máquinas. Nuestro estudio también analizó el impacto de diferentes hiperparámetros, como el número de capas y neuronas, la función de activación y la tasa de aprendizaje, en la precisión del MLP (Kangra & Singh, 2023). Estos hallazgos resaltan la importancia de una cuidadosa selección y ajuste de los hiperparámetros para lograr resultados precisos e interpretables. En general, nuestro estudio contribuye al creciente cuerpo de investigación sobre el uso de algoritmos de aprendizaje automático en el di-agnóstico médico y destaca el potencial de MLP como una herramienta valiosa para predecir y prevenir la diabetes. La investigación futura puede explorar el uso de otros algoritmos y conjuntos de datos de aprendizaje automático para mejorar la predicción y el control de la diabetes.
ISSN:	0717-6384 0717-6384
DOI:	10.5867/medwave.2023.S1.UTA060