Please use this identifier to cite or link to this item: https://hdl.handle.net/11000/26559

Desarrollo de una aplicación web para realizar Web Scraping sobre tablas de datos


Thumbnail

View/Open:
 TFG-Sánchez Bonillo, Jorge.pdf

4,03 MB
Adobe PDF
Share:
Title:
Desarrollo de una aplicación web para realizar Web Scraping sobre tablas de datos
Authors:
Sánchez Bonillo, Jorge
Tutor:
Rodríguez Sala, Jesús Javier
Univerity:
Universidad Miguel Hernández de Elche
Department:
Departamentos de la UMH::Ingeniería de Computadores
Issue Date:
2021-03-05
Abstract:
En la actualidad la cantidad de datos que hay en la web es incalculable y muchos de estos datos están incrustados en tablas formateadas en páginas web. En muchas ocasiones es necesario extraer estos datos para investigaciones, archivo u otras necesidades. En la actualidad hay diferentes herramientas que permiten la extracción de datos, pero muchas de ellas están muy limitadas a la hora de modificar o visualizar datos de diferentes maneras. Esta aplicación viene a suplir algunas de esas necesidades que no cubren las herramientas actuales, a través de una aplicación web con una interfaz sencilla y un lenguaje claro y conciso, de modo que pueda hacer uso de la misma cualquier usuario sin conocimientos técnicos previos. La aplicación ha sido desarrollada principalmente mediante el lenguaje de programación Python y haciendo uso del framework Flask, además de otros lenguajes como puede ser HTML o CSS. Las tecnologías utilizadas son actualmente punteras en el mercado laboral y ha sido una de las razones por las que decidí realizar el proyecto con estas tecnologías. En cuanto al desarrollo de la aplicación, te permite raspar las tablas de datos incrustadas en una página web, seleccionar la tabla entre todas las disponibles y realizar modificaciones o visualizar información relativa a ella antes de descargar la tabla en un fichero con formato CSV.
Keywords/Subjects:
Web Scraping
CSV
preprocesamiento de datos
Type of document:
application/pdf
Access rights:
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Appears in Collections:
TFG-Ingeniería Informática en Tecnologías de la Información (ELCHE)



Creative Commons ???jsp.display-item.text9???