¡Esta es una revisión vieja del documento!
Algoritmos de clasificación, desarrollo e implementación de estos.
El proceso de aprendizaje consiste en entrenar algoritmos, esto significa encontrar los parámetros más adecuados para redes neuronales, SVM… Lo que se hace es separar los datos que tenemos en datos de entrenamiento y de aprendizaje (estos deberían ser un tercio o un cuarto) y lanzar el algoritmo con los de entrenamiento hasta encontrar los parámetros. Una vez se tienen se probarían con los de test para asegurarnos que funciona. Si el algoritmo la clava con los de entrenamiento pero falla mucho con los de test diremos que está sobreentrenado, que hay overfitting.
A partir de una distribución bidimensional podemos estudiar la causa-efecto de dos variables (cómo influye una sobre la otra). Por ejemplo, cantidad de lluvia y producción agrícola, aumento de precio y demanda de un producto… Para ello, a partir de una representación gráfica en un sistema de coordenadas encontraremos un “diagrama de dispersión”, será regresión lineal cuando la función es lineal (pendiente y ordenada (y = ax + b)), la recta del gráfico resultante será la recta de regresión. Esto nos permite, además, predecir un valor para una x que no esté en la distribución.
Para modelar la probabilidad de un evento que ocurre en función de otros factores. Usa la función logit.