Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/11000/26559

Desarrollo de una aplicación web para realizar Web Scraping sobre tablas de datos


Vista previa

Ver/Abrir:
 TFG-Sánchez Bonillo, Jorge.pdf

4,03 MB
Adobe PDF
Compartir:
Título :
Desarrollo de una aplicación web para realizar Web Scraping sobre tablas de datos
Autor :
Sánchez Bonillo, Jorge
Tutor:
Rodríguez Sala, Jesús Javier
Editor :
Universidad Miguel Hernández de Elche
Departamento:
Departamentos de la UMH::Ingeniería de Computadores
Fecha de publicación:
2021-03-05
URI :
http://hdl.handle.net/11000/26559
Resumen :
En la actualidad la cantidad de datos que hay en la web es incalculable y muchos de estos datos están incrustados en tablas formateadas en páginas web. En muchas ocasiones es necesario extraer estos datos para investigaciones, archivo u otras necesidades. En la actualidad hay diferentes herramientas que permiten la extracción de datos, pero muchas de ellas están muy limitadas a la hora de modificar o visualizar datos de diferentes maneras. Esta aplicación viene a suplir algunas de esas necesidades que no cubren las herramientas actuales, a través de una aplicación web con una interfaz sencilla y un lenguaje claro y conciso, de modo que pueda hacer uso de la misma cualquier usuario sin conocimientos técnicos previos. La aplicación ha sido desarrollada principalmente mediante el lenguaje de programación Python y haciendo uso del framework Flask, además de otros lenguajes como puede ser HTML o CSS. Las tecnologías utilizadas son actualmente punteras en el mercado laboral y ha sido una de las razones por las que decidí realizar el proyecto con estas tecnologías. En cuanto al desarrollo de la aplicación, te permite raspar las tablas de datos incrustadas en una página web, seleccionar la tabla entre todas las disponibles y realizar modificaciones o visualizar información relativa a ella antes de descargar la tabla en un fichero con formato CSV.
Palabras clave/Materias:
Web Scraping
CSV
preprocesamiento de datos
Área de conocimiento :
CDU: Ciencias aplicadas: Ingeniería. Tecnología
Tipo documento :
application/pdf
Derechos de acceso:
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Aparece en las colecciones:
TFG-Ingeniería Informática en Tecnologías de la Información (ELCHE)



Creative Commons La licencia se describe como: Atribución-NonComercial-NoDerivada 4.0 Internacional.