¡Esta es una revisión vieja del documento!
Este apartado está muy relacionado con Estadística.
Agregar: http://en.wikipedia.org/wiki/Accuracy_and_precision
Correspondería a hacer la media de todos las variables.
El método Cross Validation consiste en dividir un conjunto de datos en k grupos y en realizar k iteraciones donde el modelo, en cada una de ellas, usa k-1 de estos subgrupos como datos de entrenamiento y el resto como test para calcular el ratio de error en la clasificación para cada una de las combinaciones. El valor de estimación de la calidad del modelo vendrá dada por la media de estos ratios.
Un modelo es una expresión simbólica en forma de igualdad o ecuación. Se utiliza para indicar qué variables intervienen en la respuesta.
Las estimaciones que realiza son siempre iguales a los datos de entrada iniciales y no predice correctamente los nuevos.
A partir de una distribución bidimensional podemos estudiar la causa-efecto de dos variables (cómo influye una sobre la otra). Por ejemplo, cantidad de lluvia y producción agrícola, aumento de precio y demanda de un producto… Para ello, a partir de una representación gráfica en un sistema de coordenadas encontraremos un “diagrama de dispersión”, será regresión lineal cuando la función es lineal (pendiente y ordenada (y = ax + b)), la recta del gráfico resultante será la recta de regresión. Esto nos permite, además, predecir un valor para una x que no esté en la distribución.
Para modelar la probabilidad de un evento que ocurre en función de otros factores. Usa la función logit.