Please use this identifier to cite or link to this item: https://hdl.handle.net/11000/8272
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorSainz-Pardo Auñón, José Luis-
dc.contributor.authorOrtuño Lorente, José Manuel-
dc.contributor.otherDepartamentos de la UMH::Estadística, Matemáticas e Informáticaes
dc.date.accessioned2021-09-14T15:02:54Z-
dc.date.available2021-09-14T15:02:54Z-
dc.date.created2019-12-12-
dc.date.issued2019-12-12-
dc.identifier.urihttp://hdl.handle.net/11000/8272-
dc.description.abstractLa combinación entre el crecimiento que ha experimentado la red durante los últimos años y los avances en la capacidad de computación de los ordenadores han desembocado en una nueva revolución de la información. Cada día en la red se generan volúmenes enormes de datos de toda clase. La mayor parte de ellos son desaprovechados y almacenados en grandes servidores en espera de la aparición de una forma de aprovecharlos y explotarlos. Dentro de estos datos, encontramos que muchos de ellos son textos con información que podría ser valiosa para multitud de usos, esa es la razón por la cual cada día surgen nuevos métodos para analizar y procesarlos. Al análisis y procesamiento de texto se le conoce como análisis de texto. Una de las tareas que se desarrollan en el análisis de texto es la organización y clasificación de textos. Existen diversas herramientas y técnicas para abordar esta cuestión como las redes neuronales o los árboles de decisión, entre otros, pero en el presente trabajo nos centraremos en una herramienta conocida como clasificador Naïve Bayes. Esta herramienta destaca por su sencillez y los buenos resultados frente a otras técnicas como las mencionadas anteriormente. El objetivo de este trabajo es doble: por una parte, nos centraremos en el desarrollo de una aplicación que nos permita clasificar cualquier tipo de texto del que desconozcamos su categoría en otras categorías conocidas mediante la aplicación del clasificador Naïve Bayes; y por otra parte, iremos más allá desarrollando un crawler que, a partir de una serie de enlaces aportados por el usuario, identifique las URLs que contiene las mismas creando copias del texto plano de las sucesivas páginas para posteriormente clasificarlas. A lo largo del presente trabajo se expondrá todo el marco teórico que envuelve a dichas herramientas con el objetivo de comprender tanto la capacidad que tienen dichas técnicas como las limitaciones que presentan las mismas. Además, exploraremos sus aplicaciones prácticas. Las aplicaciones desarrolladas serán mostradas en profundidad, con una explicación sobre sus características, estructura y código, para posteriormente 5 someterla a pruebas con datos reales, clasificando noticias, la detección de Spam en mensajes de SMS y la obtención de un listado de webs que traten una categoría dada. El objeto de estas pruebas no será otro que el de estudiar el rendimiento de las aplicaciones y su capacidad para hacer clasificaciones correctas.es
dc.formatapplication/pdfes
dc.format.extent73es
dc.language.isospaes
dc.publisherUniversidad Miguel Hernández de Elchees
dc.rightsinfo:eu-repo/semantics/openAccesses
dc.subjectclasificación de textoses
dc.subjectclasificador Naïve Bayeses
dc.subjectprocesamiento de lenguaje naturales
dc.subjectPythones
dc.subjectcrawleres
dc.subjectscrapinges
dc.subject.otherCDU::3 - Ciencias sociales::31 - Demografía. Sociología. Estadísticaes
dc.subject.otherCDU::6 - Ciencias aplicadas::65 - Gestión y organización. Administración y dirección de empresas. Publicidad. Relaciones públicas. Medios de comunicación de masases
dc.titleProcesamiento del lenguaje natural: Desarrollo de aplicaciones para Inteligencia Competitivaes
dc.typeinfo:eu-repo/semantics/bachelorThesises
Appears in Collections:
TFG - Estadística Empresarial


Thumbnail

View/Open:
 TFG-Ortuño Lorente, José Manuel.pdf
624,68 kB
Adobe PDF
Share:


Creative Commons ???jsp.display-item.text9???