Please use this identifier to cite or link to this item: https://hdl.handle.net/11000/38954

Comparativa de herramientas de gestión de calidad de datos.


Thumbnail

View/Open:
 TFG_48730274J_BelmontePovedaCarolinaIsabel.pdf

2,1 MB
Adobe PDF
Share:
Title:
Comparativa de herramientas de gestión de calidad de datos.
Authors:
Belmonte Poveda, Carolina Isabel
Tutor:
Polotskaya, Kristina
Editor:
Universidad Miguel Hernández de Elche
Department:
Departamentos de la UMH::Estadística, Matemáticas e Informática
Issue Date:
2025
URI:
https://hdl.handle.net/11000/38954
Abstract:
La calidad de los datos es clave para el éxito empresarial, al influir directamente en las decisiones estratégicas y operativas. Sin embargo, la presencia de datos incompletos, erróneos o inconsistentes puede generar altos costos, afectar la eficiencia operativa y distorsionar las decisiones. Este trabajo tiene como objetivo principal evaluar y comparar diferentes herramientas de gestión de calidad mediante un análisis estadístico. Se seleccionan herramientas representativas, tanto de código abierto (OpenRefine y Talend Open Studio) como comerciales (IBM InfoSphere QualityStage y Ataccama ONE). Debido a restricciones de acceso, el análisis empírico se ha centrado en las dos primeras, que han sido aplicadas sobre un conjunto de datos con errores simulados para medir su eficacia. El trabajo adopta un enfoque mixto, combinando métricas estadísticas objetivas (porcentaje de errores corregidos, registros eliminados, tiempos de procesamiento) con una evaluación cualitativa de la experiencia de uso. Los resultados muestran que ambas herramientas mejoran notablemente la calidad de los datos respecto al archivo original, aunque presentan diferencias significativas en su enfoque: OpenRefine es más adecuado para tareas manuales y exploración puntual, mientras que Talend resulta más eficaz en procesos automatizados y estructurados. Como conclusión, se demuestra que la elección de la herramienta depende del contexto, los recursos disponibles y los objetivos del análisis. El trabajo aporta, además, un marco replicable para futuras comparativas, contribuyendo al desarrollo de buenas prácticas en calidad del dato.
Keywords/Subjects:
calidad de datos
limpieza de datos
openrefine
talend open studio
análisis estadístico
herramientas ETL
Knowledge area:
CDU: Ciencias sociales: Demografía. Sociología. Estadística
Type of document:
info:eu-repo/semantics/bachelorThesis
Access rights:
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Appears in Collections:
TFG - Estadística Empresarial



Creative Commons ???jsp.display-item.text9???