Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/11000/26559
Desarrollo de una aplicación web para realizar Web Scraping sobre tablas de datos
Título : Desarrollo de una aplicación web para realizar Web Scraping sobre tablas de datos |
Autor : Sánchez Bonillo, Jorge |
Tutor: Rodríguez Sala, Jesús Javier |
Editor : Universidad Miguel Hernández de Elche |
Departamento: Departamentos de la UMH::Ingeniería de Computadores |
Fecha de publicación: 2021-03-05 |
URI : http://hdl.handle.net/11000/26559 |
Resumen :
En la actualidad la cantidad de datos que hay en la web es incalculable y muchos de estos
datos están incrustados en tablas formateadas en páginas web. En muchas ocasiones es
necesario extraer estos datos para investigaciones, archivo u otras necesidades. En la
actualidad hay diferentes herramientas que permiten la extracción de datos, pero muchas
de ellas están muy limitadas a la hora de modificar o visualizar datos de diferentes
maneras.
Esta aplicación viene a suplir algunas de esas necesidades que no cubren las herramientas
actuales, a través de una aplicación web con una interfaz sencilla y un lenguaje claro y
conciso, de modo que pueda hacer uso de la misma cualquier usuario sin conocimientos
técnicos previos.
La aplicación ha sido desarrollada principalmente mediante el lenguaje de programación
Python y haciendo uso del framework Flask, además de otros lenguajes como puede ser
HTML o CSS. Las tecnologías utilizadas son actualmente punteras en el mercado laboral y
ha sido una de las razones por las que decidí realizar el proyecto con estas tecnologías.
En cuanto al desarrollo de la aplicación, te permite raspar las tablas de datos incrustadas en
una página web, seleccionar la tabla entre todas las disponibles y realizar modificaciones o
visualizar información relativa a ella antes de descargar la tabla en un fichero con formato
CSV.
|
Palabras clave/Materias: Web Scraping CSV preprocesamiento de datos |
Área de conocimiento : CDU: Ciencias aplicadas: Ingeniería. Tecnología |
Tipo documento : application/pdf |
Derechos de acceso: info:eu-repo/semantics/openAccess Attribution-NonCommercial-NoDerivatives 4.0 Internacional |
Aparece en las colecciones: TFG-Ingeniería Informática en Tecnologías de la Información (ELCHE)
|
La licencia se describe como: Atribución-NonComercial-NoDerivada 4.0 Internacional.