Título : Comparativa de herramientas de gestión de calidad de datos. |
Autor : Belmonte Poveda, Carolina Isabel |
Tutor: Polotskaya, Kristina |
Editor : Universidad Miguel Hernández de Elche |
Departamento: Departamentos de la UMH::Estadística, Matemáticas e Informática |
Fecha de publicación: 2025 |
URI : https://hdl.handle.net/11000/38954 |
Resumen :
La calidad de los datos es clave para el éxito empresarial, al influir directamente en las decisiones estratégicas y operativas. Sin embargo, la presencia de datos incompletos, erróneos o inconsistentes puede generar altos costos, afectar la eficiencia operativa y distorsionar las decisiones.
Este trabajo tiene como objetivo principal evaluar y comparar diferentes herramientas de gestión de calidad mediante un análisis estadístico. Se seleccionan herramientas representativas, tanto de código abierto (OpenRefine y Talend Open Studio) como comerciales (IBM InfoSphere QualityStage y Ataccama ONE). Debido a restricciones de acceso, el análisis empírico se ha centrado en las dos primeras, que han sido aplicadas sobre un conjunto de datos con errores simulados para medir su eficacia.
El trabajo adopta un enfoque mixto, combinando métricas estadísticas objetivas (porcentaje de errores corregidos, registros eliminados, tiempos de procesamiento) con una evaluación cualitativa de la experiencia de uso. Los resultados muestran que ambas herramientas mejoran notablemente la calidad de los datos respecto al archivo original, aunque presentan diferencias significativas en su enfoque: OpenRefine es más adecuado para tareas manuales y exploración puntual, mientras que Talend resulta más eficaz en procesos automatizados y estructurados.
Como conclusión, se demuestra que la elección de la herramienta depende del contexto, los recursos disponibles y los objetivos del análisis. El trabajo aporta, además, un marco replicable para futuras comparativas, contribuyendo al desarrollo de buenas prácticas en calidad del dato.
|
Palabras clave/Materias: calidad de datos limpieza de datos openrefine talend open studio análisis estadístico herramientas ETL |
Área de conocimiento : CDU: Ciencias sociales: Demografía. Sociología. Estadística |
Tipo de documento : info:eu-repo/semantics/bachelorThesis |
Derechos de acceso: info:eu-repo/semantics/openAccess Attribution-NonCommercial-NoDerivatives 4.0 Internacional |
Aparece en las colecciones: TFG - Estadística Empresarial
|