Modelo de minería de datos, enfocado a contenido digital en los medios de comunicación para el Grupo EPASA /

La minería de datos es el proceso de clasificación de grandes conjuntos de datos para encontrar información relevante y aprovechable para una finalidad especifica. Todas las compañías cuentan con datos; sin embargo, en muchos casos no se obtiene de estos grandes beneficios, puesto que no son analiza...

Descripción completa

Detalles Bibliográficos
Autor principal: Martínez Vallecilla, William (sustentante)
Formato: Tesis Libro
Lenguaje:Spanish
Publicado: Panamá : Universidad Tecnológica de Panamá, 2019
Materias:
Descripción
Sumario:La minería de datos es el proceso de clasificación de grandes conjuntos de datos para encontrar información relevante y aprovechable para una finalidad especifica. Todas las compañías cuentan con datos; sin embargo, en muchos casos no se obtiene de estos grandes beneficios, puesto que no son analizados. CRISP-DM es una metodología, que permite desarrollar modelos de minería de datos mediante fases las cuales son: comprensión del negocio, comprensión de los datos, preparación de datos, modelado, evaluación y distribución estas fases no son rígidas, es decir se puede pasar de una fase final a una fase inicial para hacer ajustes necesarios en el proyecto. Se aplicó esta metodología en el contenido digital generado por medios de comunicación, el objetivo fue desarrollar un modelo que uso algoritmos de aprendizaje automático para ofrecer a los usuarios que visitan los sitios web, contenido basado en sus habitos de navegacion. El resultado de la aplicación del modelo es un incremento en el consumo por parte de los usuarios del contenido digital, que es una variable que afecta directamente los ingresos económicos de este tipo de compañías. Adicionalmente hay un valor agregado para los usuarios que es la individualización, es decir no a todas las personas les gusta las mismas cosas, entonces por qué ofrecer a todos los usuarios el mismo contenido, todos los seres humanos tenemos diferentes preferencias y el machine learning permite que se pueda presentar contenido recomendado según los hábitos de consumo de cada usuario. El principal software usado para el desarrollo del modelo fue el lenguaje de programación Python, que además cuenta con un buen número de librerías útiles para hacer ciencia de datos, aplicando la metodología CRISP-DM. De este proceso de minería de datos se pudo concluir las ventajas competitivas y los beneficios que puede obtener una compañía al aplicarlo, por otra parte, el ingeniero de software requiere de otras áreas de especialización (estadística, matemáticas y herramientas de ciencia de datos) para realizar este tipo de proyectos.
Data mining is the process of classifying large data sets to find relevant and usable information for a specific purpose. All companies have data; however, in many cases, these great benefits are not obtained, since they are not analyzed. CRISP-DM is a methodology that allows developing data mining models through phases which are: business understanding, data comprehension, data preparation, modeling, evaluation and distribution. These phases are not rigid, that is, you can pass from a final phase to an initial phase to make necessary adjustments in the project. This methodology was applied to digital content generated by communication media, the objective was to develop a model that uses automatic learning algorithms to offer users who visit websites, content based on their browsing habits. The result of the application of the model is an increase in the consumption by the users of digital content, which is a variable that directly affects the economic income of this type of company. Additionally, there is an added value for users that is individualization, that is, not all people like the same things, so why offer all users the same content, humans have different preferences and machine learning allows that recommended content can be presented according to the consumption habits of each user. The main software used for the development of the model was the Python programming language, which also has a good number of libraries useful for data science, applying the CRISP-DM methodology. From this process of data mining it was possible to conclude the competitive advantages and the benefits that a company can obtain when applying it, on the other hand, the software engineer requires other areas of specialization (statistics, mathematics and data science tools) to perform this type of projects.
Descripción Física:xix, 198 páginas : ilustraciones, gráficas, tablas ; 28 cm
Bibliografía:Incluye referencia bibliográfica, página 186-188.
Acceso:No se presta a domicilio.