Desarrollo de una aplicación de lenguaje conversacional para el Robot NAO H25

En la actualidad existen muchas formas de interactuar con robots por medio de diferentes interfaces hombre-máquina tradicionales como: palancas de mando, teclados, botones o pantallas táctiles. Estas interfaces requieren de un entrenamiento previo, para adquirir ciertas destrezas. Existen pocas inte...

Descripción completa

Detalles Bibliográficos
Autor principal: Quintero V., José D. (autor)
Otros Autores: Asprilla, Rafael (asesor)
Formato: Tesis Libro
Lenguaje:Spanish
Materias:
Descripción
Sumario:En la actualidad existen muchas formas de interactuar con robots por medio de diferentes interfaces hombre-máquina tradicionales como: palancas de mando, teclados, botones o pantallas táctiles. Estas interfaces requieren de un entrenamiento previo, para adquirir ciertas destrezas. Existen pocas interfaces que permitan interactuar de forma intuitiva, como lo hacemos con la voz. Se pueden dar órdenes mediante palabras clave, pero este tipo de interfaces no son implementadas comúnmente en robots. La implementación de interfaces humano-robot mediante lenguaje natural, facilitaría la asignación de instrucciones a robots tradicionales y abriría puertas a una gran cantidad de aplicaciones, especialmente para los robots humanoides. En este trabajo proponemos la creación de un sistema de conversación natural humano-robot experimental, integrado en un robot humanoide, para promover la investigación y desarrollo de sistemas de este tipo y explorar los retos que conlleva la implementación los mismos. Para la implementación de este sistema (agente conversacional) se creó un comportamiento o "behavior" en un robot NAO H25, el cual utiliza una interfaz de reconocimiento de la voz del usuario para convertirla en texto. El texto es luego procesado por un intérprete de archivos de lenguaje de etiquetas de inteligencia artificial (AIML - Artificial Linguistic Internet Computer Entity), el cual empareja el texto de entrada con una base de conocimientos en el idioma español y produce una respuesta. Esta respuesta es insertada en un sintetizador de voz, el cual produce una salida de voz con la respuesta. Esta secuencia se repite varias veces produciendo una conversación. Se definieron métricas, métodos subjetivos (opinión del usuario) y métodos objetivos de evaluación del sistema (información recolectada durante la ejecución). Durante los períodos de prueba del sistema, se llevaban bitácoras en forma de archivos, en los cuales se registraban las conversaciones llevadas a cabo y se corroboraba con la grabación externa de las mismas. Adicionalmente, se registraron los tiempos de ejecución de cada etapa del proceso. Estos datos fueron utilizados posteriormente para la evaluación objetiva y, en algunos casos, se requirió la programación de scripts para el cálculo de algunas métricas y para el formato de los datos. El resultado final fue un programa de agente conversacional funcional, aunque no con el rendimiento necesario para mantener una conversación en tiempo real, y con algunas limitaciones. Llegamos a la conclusión de que es posible la elaboración de sistemas de conversación en tiempo real, si se realizan optimizaciones en aspectos específicos, que mejoren la usabilidad del sistema y el tiempo de respuesta. Se señalan además qué factores afectan o no directamente el desempeño del sistema y se sugieren formas de mejorar en implementaciones futuras.
Notas:"Trabajo de graduación para optar por el título de Licenciado en Ingeniería en Informática". - Página del título.
"Octube 2015". - Página del título.
Descripción Física:xvii, 87 páginas : ilustraciones color ; 28 cm