Selección de parámetros en máquinas de soporte vectorial para identificación de polaridad /

La clasificación de texto es una herramienta que permite categorizar la información generada utilizando lenguaje natural, en particular, las redes sociales como facebook o twitter generan gran cantidad de información en tiempo real que puede servir como insumo a una amplia variedad de procesos. D...

Descripción completa

Detalles Bibliográficos
Autor principal: Sanabria Rodríguez, Marco Aurelio 1984- (Autor/a)
Otros Autores: Casasola Murillo, Edgar Enrique 1968- (Director/a del TFG)
Formato: Tesis Libro
Lenguaje:Spanish
Publicado: [San José], Costa Rica, 2016.
Materias:
Acceso en línea:Ver documento en repositorio
LEADER 03496nam a2200337 a 4500
001 000568701
005 20250107071743.0
008 170619s2016 cr a frm ||||||spa d
040 |a  Sistema de Bibliotecas de Universidad de Costa Rica  
099 9 |a TFG 41145 
100 1 |a Sanabria Rodríguez, Marco Aurelio  |d 1984-  |e Autor/a 
245 1 0 |a Selección de parámetros en máquinas de soporte vectorial para identificación de polaridad /  |c Marco Aurelio Sanabria Rodríguez ; director Edgar Casasola Murillo. 
260 |a [San José], Costa Rica,  |c 2016. 
300 |a viii, 77 hojas :  |b ilustraciones en blanco y negro. 
502 |a Tesis (maestría académica en computación e informática)--Universidad de Costa Rica. Sistema de Estudios de Posgrado, 2016 
520 3 |a La clasificación de texto es una herramienta que permite categorizar la información generada utilizando lenguaje natural, en particular, las redes sociales como facebook o twitter generan gran cantidad de información en tiempo real que puede servir como insumo a una amplia variedad de procesos. Desafortunadamente, convertir la cantidad masiva de información generada por estos medios, aún tiene mucho camino por recorrer. Debido a que esta información es de carácter subjetivo, informal y no estructurada, se recurre a diversas técnicas de inteligencia artificial y Procesamiento del lenguaje natural (NLP) con el fin de identificar y extraer opiniones, y para determinar el valor subjetivo (polaridad positiva o negativa) que carga el texto. Específicamente, para determinar la polaridad de un opinión, se ha recurrido a modelos de clasificación de texto. En particular las máquinas de soporte vectorial (C-SVM) con función de kerifel RBF, gozan popularidad entre los investigadores del área por sus buenos resultados [firmino et al., 2013, Kaya et al., 2012]. Las C-SVM deben ser entrenadas para que aprendan a clasificar textos, lo cuál involucra un proceso de selección de parámetros, el cual posee un impacto significativo en la precisión del modelo. En investigación comparamos, utilizando las métricas de precisión, exhaustividad y valor-F, el uso de valores por defecto de la herramienta LIBSVM contra dos algoritmos de selección automatizada de parámetros: El algoritmo de búsqueda en malla: de amplio uso entre los investigadores [Carrizosa et al., 2014, Devos et al.,, 2009, Li et al., 2010b, Li et al., 2010a, Lin and Liu, 207, Lin et al., 2008, Muan nandi, 2007, Wei-Chih and Yu, 2009], se caracteriza por ser exhaustivo y brindar una alta precisión pero con una cantidad significativa de cálculos que implica un alto consumo de tiempo y recursos computacionales. El algoritmo de lobo gris: creado en 2014 por Mirjalili [Mirjalili, et al., 2014]... 
650 0 7 |a ALGORITMOS (COMPUTADORAS) 
650 0 7 |a APRENDIZAJE POR MAQUINAS 
650 0 7 |a MAQUINAS DE VECTORES DE SOPORTE 
650 0 7 |a PROCESAMIENTO DEL LENGUAJE NATURAL (CIENCIAS DE LA COMPUTACION) 
650 0 7 |a FUNCIONES DE KERNEL 
650 0 7 |a MINERIA DE DATOS 
650 0 7 |a INTELIGENCIA ARTIFICIAL 
700 1 |a Casasola Murillo, Edgar Enrique  |d 1968-  |e Director/a del TFG 
856 4 1 |u https://repositorio.sibdi.ucr.ac.cr/handle/123456789/8759  |y Ver documento en repositorio 
909 |a Maestría Académica en Computación e Informática 
900 |a 2018-O 
916 |a Centro Catalográfico 
949 |a AM-CMM 
919 |a Ingeniería 
921 |a tesis de maestría