Please use this identifier to cite or link to this item: https://hdl.handle.net/11000/26781

Clasificación de textos mediante algoritmos de Machine Learning


Thumbnail

View/Open:
 SinghKaur_Sukhwinder.pdf

1,12 MB
Adobe PDF
Share:
Title:
Clasificación de textos mediante algoritmos de Machine Learning
Authors:
Singh Kaur, Sukhwinder
Tutor:
Sainz-Pardo Auñón, José Luis
Editor:
Universidad Miguel Hernández de Elche
Department:
Departamentos de la UMH::Estadística, Matemáticas e Informática
Issue Date:
2021-06
URI:
http://hdl.handle.net/11000/26781
Abstract:
El presente trabajo se centra en el estudio de algunos algoritmos que se engloban bajo el concepto de Machine Learning aplicados a la clasificación de textos, y hacer una comparativa entre ellos en cuanto a la eficacia y precisión a la hora de realizar las agrupaciones en cada uno de los casos. El primero de ellos consiste en la clasificación de los emails, si son spam o no, y el segundo se centra en la clasificación de las noticias en sus correspondientes categorías. Los algoritmos que se han elegido son el de Naive Bayes y el de Support Vector Machine. Tras el correspondiente análisis de los resultados se llegaron a varias conclusiones. Primero de todo, hay que destacar la necesidad e importancia de un correcto preprocesamiento de los datos. Si se lleva a cabo de una forma correcta y recomendable, las diferencias en los resultados finales son notables. Segundo, según el tipo de datos y de acuerdo con la forma de prepararlos, existen funciones que se pueden adaptar mejor al modelo que otras, y de esta forma influir de una manera directa sobre los resultados deseados. Por último, indicar que de entre los modelos que se emplearon para la resolución de los casos, aquel que mejor se adaptó y que realizó las clasificaciones con una mayor precisión fue el de Support Vector Machine.
Keywords/Subjects:
machine learning
algoritmos
Knowledge area:
CDU: Ciencias sociales: Demografía. Sociología. Estadística: Estadística
Type of document:
application/pdf
Access rights:
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Appears in Collections:
TFG - Estadística Empresarial



Creative Commons ???jsp.display-item.text9???