Desarrollo de un modelo basado en algoritmos de minería de datos para la recomendación de pruebas de detección temprana de lesiones premalignas con tendencia a desarrollar cáncer de cérvix según la caracterización de los factores de riesgo de la paciente /

En esta tesis se realizó un proceso de minería de datos mediante el análisis y la caracterización de los factores de riesgo para el cáncer de cérvix, con el objetivo de desarrollar un modelo que realice la recomendación sobre el tipo de prueba que debe hacerse el paciente, para una detección tempran...

Descripción completa

Detalles Bibliográficos
Autor principal: Cedeño Batista, Gloris Denisse (autor)
Otros Autores: Cedeño Herrera, Edwin Juvenal (asesor)
Formato: Tesis Libro
Lenguaje:Spanish
Materias:
Descripción
Sumario:En esta tesis se realizó un proceso de minería de datos mediante el análisis y la caracterización de los factores de riesgo para el cáncer de cérvix, con el objetivo de desarrollar un modelo que realice la recomendación sobre el tipo de prueba que debe hacerse el paciente, para una detección temprana de lesiones premalignas que puedan evolucionar a esta patología. Se determinaron tres tipos de algoritmos de modelado según la estructura de los datos en el dataset, Árbol de Decisión, LMT y Random Forest, bajo los cuales se sometieron los datos previamente preparados y acondicionados, para determinar su eficiencia con respecto a la precisión. En la hipótesis se plantea que el valor de precisión esperada es del 80% o superior. En este estudio se utilizó un dataset público que contiene 858 instancias, las cuales fueron recolectadas en el Hospital Universitario de Caracas, Venezuela. El resultado esperado es que, mediante el modelo extraído de los datos, se pudiera predecir con una alta precisión si se debe realizar una prueba de citología, una biopsia o una colposcopia. El análisis se realizó en forma individual para la prueba de citología; y se tomó en cuenta como atributo calculado la aplicación o resultado de esta, para predecir la aplicación de las pruebas biopsia y colposcopia. Los resultados obtenidos muestran que el algoritmo que generó el modelo con mayor precisión fue Random Foresi, con una media mínima del 97% para las tres pruebas evaluadas. Es importante destacar que el porcentaje de error del algoritmo se redujo conforme a la especialización de la prueba a recomendar, siendo Colposcopia en la que se presentó mayor precisión con un promedio de 99.45%. Es relevante mencionar que todas las instancias clasificadas incorrectamente fueron asignadas a la categoría SI (es decir, sí aplicar prueba); por lo tanto, en un escenario hipotético, donde el modelo se utilice como una herramienta de asistencia para médicos, este porcentaje de error no sería obstáculo significativo para la detección de lesiones premalignas.
Descripción Física:242 páginas : ilustracion a color, tablas ; 28 cm