Sistema de detección de talasemia a partir de datos de hemogramas utilizando algoritmos de inteligencia artificial /

La talasemia es una hemoglobinopatía que básicamente consiste en alteraciones en la molécula de hemoglobina, esta condición es detectada inicialmente a partir de un hemograma, que compila las cantidades de algunos elementos sanguíneos y los compara con valores de referencia. Debido a la variabi...

Descripción completa

Detalles Bibliográficos
Autor principal: Hernández Chacón, Leonardo 1996- (Autor/a)
Otros Autores: Coto Jiménez, Marvin 1980- (Director/a del TFG)
Formato: Tesis Libro
Lenguaje:Spanish
Publicado: 2022.
Materias:
Descripción
Sumario:La talasemia es una hemoglobinopatía que básicamente consiste en alteraciones en la molécula de hemoglobina, esta condición es detectada inicialmente a partir de un hemograma, que compila las cantidades de algunos elementos sanguíneos y los compara con valores de referencia. Debido a la variabilidad de estos parámetros, la existencia de una significativa similitud con los parámetros de pacientes con anemia ferropriva y en ocasiones la ausencia de síntomas puede resultar en un diagnóstico inicial incorrecto. Se debe hacer un diagnóstico diferencial entre talasemia y anemia ferropriva, una alternativa es con unaelectroforesis de hemoglobina. Sin embargo, esto típicamente ocurre luego de que se da un diagnóstico incorrecto y el paciente no presenta mejora con el tratamiento. La tarea de comparar parámetros con datos de referencia es un problema típico del reconocimiento de patrones, por lo tanto esta tesis busca sentar un precedente en la aplicación de algoritmos de reconocimiento de patrones en el diagnóstico de pacientes talasémicos. Se obtuvo una base de datos suministrada por el CIHATA correspondiente a pacientes referidos para una electroforesis de hemoglobina, esta fue luego filtrada para eliminar las entradas incompletas e información irrelevante y se preprocesó para alimentar los algoritmos de reconocimiento de patrones. Luego con estos datos se implementaron los algoritmos de regresión logística, K vecinos más cercanos, máquinas de soporte vectorial, árbol de decisión y Naive Bayes, siguiendo una estrategia de validación cruzada anidada. El mejor modelo fue el de K vecinos más cercanos, con una precisión de 81% y una exhaustividad de 63%, sin embargo, se dieron algunas recomendaciones para poder incrementar las métricas de desempeño en futuras versiones de esta investigación.
Thalassemia is a hemoglobinopathy that consists of alterations in the hemoglobin molecule. This condition is initially detected from a complete blood count, which compiles the count of some blood elements and compares them with reference values. Due to the variability of these parameters, the existence of a significant similarity with the parameters of patients with iron deficiency anemia and the absence of symptoms can result in an incorrect initial diagnosis. For a differential diagnosis between thalassemia and iron deficiency anemia it is necessary to perform a hemoglobin electrophoresis. However, this typically occurs after an incorrect diagnosis is given and the patients do not show improvement to treatment. The task of comparing parameters with reference data is a typical pattern recognition problem, therefore this thesis seeks to establish a precedent in the application of pattern recognition algorithms in the diagnosis of thalassemia patients. A database supplied by CIHATA corresponding to patients referred for hemoglobin electrophoresis was obtained, this was then filtered to eliminate incomplete entries and irrelevant information, and it was preprocessed to feed the pattern recognition algorithms. Then, with these data, the logistic regression algorithms, K nearest neighbors, support vector machines, decision tree and Naive Bayes were implemented, following a nested cross-validation strategy. The best model was that of K nearest neighbors, with an accuracy of 81% and a recall of 63%, however, and some recommendations were given to be able to increase the performance metrics in future versions of this research.
Descripción Física:xi, 60 hojas : diagramas (principalmente a color).