Contrucciòn de un detector de malware utilizando machine learning siguiendo la metodologìa del IPMA /

La elaboración de esta monografía comprendió un estudio completo de cómo podemos utilizar el Aprendizaje de Máquina (machine learning) para la detección de código malicioso debido a que este representa uno de los grandes problemas en la actualidad tanto para las organizaciones como para las p...

Full description

Bibliographic Details
Format: Thesis Book
Language:Spanish
Published: Panamá : Universidad Tecnològica de Panamà, 2019
Subjects:
Description
Summary:La elaboración de esta monografía comprendió un estudio completo de cómo podemos utilizar el Aprendizaje de Máquina (machine learning) para la detección de código malicioso debido a que este representa uno de los grandes problemas en la actualidad tanto para las organizaciones como para las personas. Los aspectos importantes considerados para realizar la construcción de un detector la malware utilizando aprendizaje de máquina, comenzó por la definición de las características que queríamos evaluar, la selección del algoritmo a utilizar lo que conllevo a evaluar cada uno de ellos para escoger el que mejor se ajustara al objetivo propuesto. La construcción del detector de malware conllevo a la utilización de una máquina virtual a la cual se le instalo la librería de Sklearn de Phyton, la selección de muestras fue obtenida desde fuentes gratis como virustotal, tekdefense y Majorgeeks. Se realizo la selección de características aplicando "hashing de caracterìsticas" para reducir lo más posible las característica a utilizar, pero sin perder fuerza en la extracción al aplicar el algoritmo Random Forest, lo que nos permitió construir un modelo robusto con la finalidad de detectar código malicioso que cumplieran con al menos un 50% dentro del análisis. Las pruebas realizadas arrojaron para muchos de los casos una detección de hasta un 75% para los códigos que representaban amenazas siendo el punto de referencias 50%, de igual manera en las pruebas de códigos que no representaban una amenaza se obtuvieron falsos positivos al detectar un . exe de Notepad como malicioso. Si bien el detector construido realizo detecciones importantes por encima de lo esperado el mismo debe ser afinado para reducir lo más posible los falsos positivos que pueden ser encontrados.
Physical Description:71 hojas : ilustraciones ; 28 cm. + 1 disco de computadora (4 3/4 plg.)