Resumen:
La clasificación es una tarea del reconocimiento de patrones que permite asignar una clase a un nuevo objeto o patrón. Para asignar la clase al patrón los algoritmos de clasificación deben generar un modelo de clasificación. El modelo de clasificación se genera con base en una muestra de datos. Sin embargo, algunos algoritmos de clasificación no generan un modelo de clasificación para generalizar la información de la muestra de datos. Los algoritmos que pertenecen a este enfoque tienen el nombre de algoritmos de aprendizaje perezoso. La regla del vecino más cercano o por sus siglas en ingles Nearest Neighbor (NN) pertenece a este tipo de algoritmos. El algoritmo NN usa toda la muestra de datos para clasificar nuevos patrones. No obstante, el usar toda la muestra de datos genera varios problemas por el tamaño de la muestra de datos y patrones ruidosos.
Para tratar de solucionar estos problemas se han propuesto métodos de selección de prototipos y Generación de Prototipos (GP). La selección de prototipos tratara de encontrar un subconjunto de patrones representativos de la muestra de datos. Mientras, la GP además de seleccionar patrones de la muestra de datos generara nuevos patrones. La GP obtiene mejores resultados que la selección de prototipos, porque puede que dentro de la muestra de datos no se tengan los patrones representativos para generar la muestra de prototipos. Estos métodos trataran de reducir el número de patrones de la muestra de datos tratando de mantener la clasificación o mejorarla para nuevos patrones.
Para mantener o mejorar la clasificación de nuevos patrones se han propuesto diferentes métodos de GP. Los primeros métodos de GP se enfocaban en la fusión de patrones cercanos y con la misma clase. Estos métodos no requerían de una selección de patrones representativos de la muestra de datos. En cambio, otros métodos de GP requieren de una selección de una submuestra prototipos representativos. La submuestra de prototipos representativa es movida dentro del espacio de características para posicionarla en el mejor lugar. También, se tienen métodos de GP que no requieren de una selección de prototipos y no fusionan patrones de la ME. Estos métodos de GP usan enfoques evolutivos para generar y posicionar los prototipos dentro de la muestra de datos. Sin embargo, los métodos de GP evolutivos no usan los Algoritmos Genéticos (AG) y solo se han usado para la selección de prototipos representativos.
El método propuesto busca demostrar que un AG puede generar una submuestra de prototipos representativa con una métrica que evalúa los prototipos durante la generación para conocer la capacidad del método propuesto. Para realizar la generación de prototipos se usan 14 muestra de datos de diferentes tamaños, número de clases y número de características. Además, los resultados del método propuesto se comparan con 18 métodos de GP del estado del arte usando la métrica de exactitud. La comparación de los resultados obtenidos por el método propuesto revela que las submuestras de prototipos obtenidas en
algunos casos mantienen y en otros casos mejoran la clasificación de nuevos patrones. En esta tesis se demuestra la capacidad del método propuesto para generar prototipos representativos.