Predicción del coeficiente de distribución (log DpH) n-octanol/agua con Modelos de Machine Learning /

El coeficiente de distribución (log DpH) en n-octanol/agua es un descriptor de la lipofilicidad de las moléculas, característica relevante en la química medicinal, toxicología y en otras áreas de la química. Este coeficiente, toma en cuenta la distribución de la molécula neutra e ionizada e...

Descripción completa

Detalles Bibliográficos
Autor principal: López Pérez, Kenneth Geovanny 1998- (Autor/a)
Otros Autores: Zamora Ramírez, William J. 1984- (Director/a del TFG)
Formato: Tesis Libro
Lenguaje:Spanish
Publicado: San Pedro de Montes de Oca, [San José, Costa Rica], 2022.
Materias:
Acceso en línea:Ver documento en repositorio
LEADER 03421nam a2200313 a 4500
001 000688505
005 20250210090831.0
008 221121s2022 cr a grm ||||||spa d
040 |a  Sistema de Bibliotecas de Universidad de Costa Rica  
099 9 |a TFG 46908 
100 1 |a López Pérez, Kenneth Geovanny  |d 1998-  |e Autor/a 
245 1 0 |a Predicción del coeficiente de distribución (log DpH) n-octanol/agua con Modelos de Machine Learning /  |c Kenneth Geovanny López Pérez ; William Zamora Ramírez, director. 
260 |a San Pedro de Montes de Oca, [San José, Costa Rica],  |c 2022. 
300 |a 130 hojas :  |b ilustraciones (principalmente a color), gráficos (algunos a color). 
502 |a Tesis (licenciatura en química)--Universidad de Costa Rica. Facultad de Ciencias. Escuela de Química, 2022 
520 3 |a El coeficiente de distribución (log DpH) en n-octanol/agua es un descriptor de la lipofilicidad de las moléculas, característica relevante en la química medicinal, toxicología y en otras áreas de la química. Este coeficiente, toma en cuenta la distribución de la molécula neutra e ionizada en cada fase; por lo que dependerá del coeficiente de partición del compuesto neutro (log PN), del coeficiente del compuesto ionizado (log PI) y de la constante de equilibrio ácida (pKa). Estos tres valores se pueden utilizar para calcular el coeficiente de distribución a cualquier pH de interés. Los modelos de Machine Learning (ML) se basan en el aprendizaje automático a partir de observaciones para luego realizar clasificación o predicción de otras observaciones. Son una de las herramientas in silico con más auge en los últimos años en la predicción de propiedades físicas y químicas, como lo es el log D. Existen gran cantidad de algoritmos de ML para la predicción del log D7.4, por ser el pH fisiológico. En este trabajo se utilizaron algoritmos de ML para predecir individualmente el coeficiente de partición del compuesto neutro (log PN), del coeficiente del compuesto ionizado (log PI) y de la constante de equilibrio ácida (pKa). Las predicciones individuales de las propiedades se sometieron validaciones cruzadas y externas para elegir el mejor modelo de predicción para cada una. En el caso de la predicción de log PI el algoritmo con mejor desempeño fue de Random Forest (RF); para log PN y pKa fue XGBoosting. Luego se integraron los tres y se obtuvieron predicciones del coeficiente de distribución (log DpH) a diferentes valores de pH para un set de prueba. Para el set de prueba se obtuvo un RMSE de 0.76 y de 0.96 para un set de validación externa unidades de log D. La evidencia obtenida sugiere que el desempeño del modelo propuesto es comparable y mejor en algunos casos que softwares de licencia consolidados en la predicción del log D. 
650 0 7 |a PREDICCIONES  |x MODELOS MATEMATICOS 
650 0 7 |a APRENDIZAJE POR MAQUINAS  |x MODELOS MATEMATICOS 
650 0 7 |a MOLECULAS 
650 0 7 |a ALGORITMOS (COMPUTADORAS) 
700 1 |a Zamora Ramírez, William J.  |d 1984-  |e Director/a del TFG 
856 4 1 |u https://repositorio.sibdi.ucr.ac.cr/handle/123456789/21280  |y Ver documento en repositorio 
900 |a 2022-O 
904 |a Escuela de Química 
907 |a Facultad de Ciencias 
919 |a Ciencias Básicas 
916 |a Centro Catalográfico 
949 |a MBA -YAS 
921 |a proyecto fin de carrera