Please use this identifier to cite or link to this item: https://hdl.handle.net/11000/28027

Árboles de clasificación: de lo clásico a lo óptimo. Desarrollo e implementación de una formulación de árbol óptimo


Thumbnail

View/Open:
 TFG-Navarro Sellés, Ana.pdf

1,15 MB
Adobe PDF
Share:
Title:
Árboles de clasificación: de lo clásico a lo óptimo. Desarrollo e implementación de una formulación de árbol óptimo
Authors:
Navarro Sellés, Ana
Tutor:
Leal, Marina  
Editor:
Universidad Miguel Hernández de Elche
Department:
Departamentos de la UMH::Estadística, Matemáticas e Informática
Issue Date:
2022-06
URI:
https://hdl.handle.net/11000/28027
Abstract:
En este trabajo, se aborda el desarrollo de un árbol de clasificación óptimo utilizando optimización entera mixta (MIO) y su posterior implementación en R. Actualmente, se usan lo que se conoce como árboles de clasificación clásicos para hacer predicciones sobre un conjunto de datos que contiene una serie de variables explicativas y una variable que indica la clase de cada individuo del conjunto. Se considera que se puede seguir el proceso de predecir la clase de los individuos mediante un modelo en forma de árbol. Este tipo de árboles parten de un nodo raíz en el que se concentran todos los individuos, que se van repartiendo a través de lo que se denomina nodos rama dependiendo del valor de las variables predictoras del individuo para, finalmente, acabar en un nodo hoja que definirá la clase que se le asigna, según la clase más común entre los individuos que hayan caído en él. Sin embargo, estos árboles requieren de podas para conseguir evitar sobreajustes, además, se toman las decisiones de forma local, no teniendo en cuenta cómo estas decisiones influyen en el resto del modelo. Si se considera el problema de crear un árbol como un problema de optimización, es lógico pensar en utilizar la optimización MIO, ya que se trata de un problema repleto de decisiones discretas (en qué nodo hoja cae cada observación, qué variable se usa para hacer una partición, etc.). La MIO nos permite desarrollar un árbol en un solo paso y en que se toman las decisiones considerando cómo estas afectan al resto del árbol. En el trabajo se ha programado un árbol óptimo que ha devuelto unos resultados correctos y que permite tomar todas las decisiones relacionadas con el árbol en un solo paso, sin necesidad de poda. Se han añadido dos nuevas restricciones válidas al planteamiento original del problema en el que se ha basado el trabajo.
Keywords/Subjects:
optimización entera mixta
clasificación
árboles de decisión
Knowledge area:
CDU: Ciencias sociales: Demografía. Sociología. Estadística: Estadística
Type of document:
application/pdf
Access rights:
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Appears in Collections:
TFG - Estadística Empresarial



Creative Commons ???jsp.display-item.text9???