Procesamiento del lenguaje natural: Desarrollo de aplicaciones para inteligencia competitiva

Ortuño Lorente, José Manuel

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/11000/8272

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	Sainz-Pardo, José Luis	-
dc.contributor.author	Ortuño Lorente, José Manuel	-
dc.contributor.other	Departamentos de la UMH::Estadística, Matemáticas e Informática	es
dc.date.accessioned	2021-09-14T15:02:54Z	-
dc.date.available	2021-09-14T15:02:54Z	-
dc.date.created	2019-12	-
dc.date.issued	2019-12-12	-
dc.identifier.uri	http://hdl.handle.net/11000/8272	-
dc.description.abstract	La combinación entre el crecimiento que ha experimentado la red durante los últimos años y los avances en la capacidad de computación de los ordenadores han desembocado en una nueva revolución de la información. Cada día en la red se generan volúmenes enormes de datos de toda clase. La mayor parte de ellos son desaprovechados y almacenados en grandes servidores en espera de la aparición de una forma de aprovecharlos y explotarlos. Dentro de estos datos, encontramos que muchos de ellos son textos con información que podría ser valiosa para multitud de usos, esa es la razón por la cual cada día surgen nuevos métodos para analizar y procesarlos. Al análisis y procesamiento de texto se le conoce como análisis de texto. Una de las tareas que se desarrollan en el análisis de texto es la organización y clasificación de textos. Existen diversas herramientas y técnicas para abordar esta cuestión como las redes neuronales o los árboles de decisión, entre otros, pero en el presente trabajo nos centraremos en una herramienta conocida como clasificador Naïve Bayes. Esta herramienta destaca por su sencillez y los buenos resultados frente a otras técnicas como las mencionadas anteriormente. El objetivo de este trabajo es doble: por una parte, nos centraremos en el desarrollo de una aplicación que nos permita clasificar cualquier tipo de texto del que desconozcamos su categoría en otras categorías conocidas mediante la aplicación del clasificador Naïve Bayes; y por otra parte, iremos más allá desarrollando un crawler que, a partir de una serie de enlaces aportados por el usuario, identifique las URLs que contiene las mismas creando copias del texto plano de las sucesivas páginas para posteriormente clasificarlas. A lo largo del presente trabajo se expondrá todo el marco teórico que envuelve a dichas herramientas con el objetivo de comprender tanto la capacidad que tienen dichas técnicas como las limitaciones que presentan las mismas. Además, exploraremos sus aplicaciones prácticas. Las aplicaciones desarrolladas serán mostradas en profundidad, con una explicación sobre sus características, estructura y código, para posteriormente 5 someterla a pruebas con datos reales, clasificando noticias, la detección de Spam en mensajes de SMS y la obtención de un listado de webs que traten una categoría dada. El objeto de estas pruebas no será otro que el de estudiar el rendimiento de las aplicaciones y su capacidad para hacer clasificaciones correctas.	es
dc.format	application/pdf	es
dc.format.extent	73	es
dc.language.iso	spa	es
dc.publisher	Universidad Miguel Hernández de Elche	es
dc.rights	info:eu-repo/semantics/openAccess	es
dc.subject	clasificación de textos	es
dc.subject	clasificador Naïve Bayes	es
dc.subject	procesamiento de lenguaje natural	es
dc.subject	Python	es
dc.subject	crawler	es
dc.subject	scraping	es
dc.subject.other	CDU::3 - Ciencias sociales::31 - Demografía. Sociología. Estadística	es
dc.subject.other	CDU::6 - Ciencias aplicadas::65 - Gestión y organización. Administración y dirección de empresas. Publicidad. Relaciones públicas. Medios de comunicación de masas	es
dc.title	Procesamiento del lenguaje natural: Desarrollo de aplicaciones para inteligencia competitiva	es
dc.type	info:eu-repo/semantics/bachelorThesis	es
Aparece en las colecciones: TFG - Estadística Empresarial

Ver/Abrir:
TFG-Ortuño Lorente, José Manuel.pdf
624,68 kB
Adobe PDF
Compartir:

Mostrar el registro sencillo del ítem Ver estadísticas

La licencia se describe como: Atribución-NonComercial-NoDerivada 4.0 Internacional.