Please use this identifier to cite or link to this item:
https://hdl.handle.net/11000/28027
Árboles de clasificación: de lo clásico a lo óptimo. Desarrollo e implementación de una formulación de árbol óptimo
Title: Árboles de clasificación: de lo clásico a lo óptimo. Desarrollo e implementación de una formulación de árbol óptimo |
Authors: Navarro Sellés, Ana |
Tutor: Leal, Marina |
Editor: Universidad Miguel Hernández de Elche |
Department: Departamentos de la UMH::Estadística, Matemáticas e Informática |
Issue Date: 2022-06 |
URI: https://hdl.handle.net/11000/28027 |
Abstract:
En este trabajo, se aborda el desarrollo de un árbol de clasificación óptimo utilizando
optimización entera mixta (MIO) y su posterior implementación en R.
Actualmente, se usan lo que se conoce como árboles de clasificación clásicos para hacer
predicciones sobre un conjunto de datos que contiene una serie de variables explicativas
y una variable que indica la clase de cada individuo del conjunto. Se considera que se
puede seguir el proceso de predecir la clase de los individuos mediante un modelo en
forma de árbol.
Este tipo de árboles parten de un nodo raíz en el que se concentran todos los individuos,
que se van repartiendo a través de lo que se denomina nodos rama dependiendo del valor
de las variables predictoras del individuo para, finalmente, acabar en un nodo hoja que
definirá la clase que se le asigna, según la clase más común entre los individuos que hayan
caído en él.
Sin embargo, estos árboles requieren de podas para conseguir evitar sobreajustes, además,
se toman las decisiones de forma local, no teniendo en cuenta cómo estas decisiones
influyen en el resto del modelo.
Si se considera el problema de crear un árbol como un problema de optimización, es
lógico pensar en utilizar la optimización MIO, ya que se trata de un problema repleto de
decisiones discretas (en qué nodo hoja cae cada observación, qué variable se usa para
hacer una partición, etc.).
La MIO nos permite desarrollar un árbol en un solo paso y en que se toman las decisiones
considerando cómo estas afectan al resto del árbol.
En el trabajo se ha programado un árbol óptimo que ha devuelto unos resultados correctos
y que permite tomar todas las decisiones relacionadas con el árbol en un solo paso, sin
necesidad de poda. Se han añadido dos nuevas restricciones válidas al planteamiento
original del problema en el que se ha basado el trabajo.
|
Keywords/Subjects: optimización entera mixta clasificación árboles de decisión |
Knowledge area: CDU: Ciencias sociales: Demografía. Sociología. Estadística: Estadística |
Type of document: application/pdf |
Access rights: info:eu-repo/semantics/openAccess Attribution-NonCommercial-NoDerivatives 4.0 Internacional |
Appears in Collections: TFG - Estadística Empresarial
|
???jsp.display-item.text9???