¡Esta es una revisión vieja del documento!
Machine learning
Algoritmos de clasificación, desarrollo e implementación de estos.
Aprendizaje
Tipos de aprendizaje
Aprendizaje supervisado
Aprendizaje no supervisado
El proceso
El proceso de aprendizaje consiste en entrenar algoritmos, esto significa encontrar los parámetros más adecuados para redes neuronales, SVM… Lo que se hace es separar los datos que tenemos en datos de entrenamiento y de aprendizaje (estos deberían ser un tercio o un cuarto) y lanzar el algoritmo con los de entrenamiento hasta encontrar los parámetros. Una vez se tienen se probarían con los de test para asegurarnos que funciona. Si el algoritmo la clava con los de entrenamiento pero falla mucho con los de test diremos que está sobreentrenado, que hay overfitting.
Evaluación de los modelos
Cross-Validation
Tipos de error
Algoritmos de clasificación
KNN
Neural Networks
Notas
Tips & tricks
Preparación de los datos
Si las clases de las que dispones estuviesen desbalanceadas para el entrenamiento, es decir, que hubiesen muchos más elementos de una clase que de otra. Un truco para no perder información y que no se realice un aprendizage mejor para unas que para otras es duplicar aleatoriamente los individuos de las clases con menos para igualarlas.
Pueden existir problemas, como por ejemplo la identificación de carácteres escritos a mano, en la que la información se nos presente de una forma difícil de tratar para el aprendizaje (rgb de píxels…) y tengamos que hacer “feature extraction” (tratar los píxels como una imágen y encontrar nuevas variables como por ejemplo número de agujeros, euler number, verticalidad…) y realizar el aprendizaje con estas nuevas características.