Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/11000/28027

Árboles de clasificación: de lo clásico a lo óptimo. Desarrollo e implementación de una formulación de árbol óptimo


Vista previa

Ver/Abrir:
 TFG-Navarro Sellés, Ana.pdf

1,15 MB
Adobe PDF
Compartir:
Título :
Árboles de clasificación: de lo clásico a lo óptimo. Desarrollo e implementación de una formulación de árbol óptimo
Autor :
Navarro Sellés, Ana
Tutor:
Leal, Marina  
Editor :
Universidad Miguel Hernández de Elche
Departamento:
Departamentos de la UMH::Estadística, Matemáticas e Informática
Fecha de publicación:
2022-06
URI :
https://hdl.handle.net/11000/28027
Resumen :
En este trabajo, se aborda el desarrollo de un árbol de clasificación óptimo utilizando optimización entera mixta (MIO) y su posterior implementación en R. Actualmente, se usan lo que se conoce como árboles de clasificación clásicos para hacer predicciones sobre un conjunto de datos que contiene una serie de variables explicativas y una variable que indica la clase de cada individuo del conjunto. Se considera que se puede seguir el proceso de predecir la clase de los individuos mediante un modelo en forma de árbol. Este tipo de árboles parten de un nodo raíz en el que se concentran todos los individuos, que se van repartiendo a través de lo que se denomina nodos rama dependiendo del valor de las variables predictoras del individuo para, finalmente, acabar en un nodo hoja que definirá la clase que se le asigna, según la clase más común entre los individuos que hayan caído en él. Sin embargo, estos árboles requieren de podas para conseguir evitar sobreajustes, además, se toman las decisiones de forma local, no teniendo en cuenta cómo estas decisiones influyen en el resto del modelo. Si se considera el problema de crear un árbol como un problema de optimización, es lógico pensar en utilizar la optimización MIO, ya que se trata de un problema repleto de decisiones discretas (en qué nodo hoja cae cada observación, qué variable se usa para hacer una partición, etc.). La MIO nos permite desarrollar un árbol en un solo paso y en que se toman las decisiones considerando cómo estas afectan al resto del árbol. En el trabajo se ha programado un árbol óptimo que ha devuelto unos resultados correctos y que permite tomar todas las decisiones relacionadas con el árbol en un solo paso, sin necesidad de poda. Se han añadido dos nuevas restricciones válidas al planteamiento original del problema en el que se ha basado el trabajo.
Palabras clave/Materias:
optimización entera mixta
clasificación
árboles de decisión
Área de conocimiento :
CDU: Ciencias sociales: Demografía. Sociología. Estadística: Estadística
Tipo documento :
application/pdf
Derechos de acceso:
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Aparece en las colecciones:
TFG - Estadística Empresarial



Creative Commons La licencia se describe como: Atribución-NonComercial-NoDerivada 4.0 Internacional.