Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa | ||
|
numbers:statistics [2011/04/30 12:07] alfred |
numbers:statistics [2020/05/09 09:25] (actual) |
||
|---|---|---|---|
| Línea 1: | Línea 1: | ||
| ====== Estadística ====== | ====== Estadística ====== | ||
| - | Este apartado está muy relacionado con [[ai:datos]]. | ||
| ===== Conceptos ===== | ===== Conceptos ===== | ||
| Línea 42: | Línea 41: | ||
| * **Frecuencia absoluta**: El número de veces que encontramos un valor en el tamaño de la muestra. | * **Frecuencia absoluta**: El número de veces que encontramos un valor en el tamaño de la muestra. | ||
| * **Frecuencia relativa**: La proporción del valor de una variable (frecuencia absoluta / tamaño de la muestra). | * **Frecuencia relativa**: La proporción del valor de una variable (frecuencia absoluta / tamaño de la muestra). | ||
| + | |||
| + | |||
| Línea 83: | Línea 84: | ||
| Es lo que utilizamos para determinar la fluctuación de los datos. Es la raíz cuadrada positiva de la varianza: \\ | Es lo que utilizamos para determinar la fluctuación de los datos. Es la raíz cuadrada positiva de la varianza: \\ | ||
| <m>S = sqrt{S²}</m> | <m>S = sqrt{S²}</m> | ||
| + | La desviación estándar es simplemente el "promedio" esperado con respecto a la media aritmética. Por ejemplo, las muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) tienen una media de 7. Sus desviaciones típicas son 8,08, 5,77 y 1,15, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7. \\ \\ | ||
| + | Podríamos decir que si, por ejemplo, en una clase el conjunto normal de notas está entre el 4 y el 7 la desviación (y por tanto la varianza) sería más pequeña que si las notas están repartidas entre el 2 y 8. Aún así es preferible el uso de la varianza ya que su valor está en las mismas unidades que los datos. Además, si los datos están estandarizados es más intuitivo su uso. | ||
| + | |||
| ==== Estandarizar valores ==== | ==== Estandarizar valores ==== | ||
| Línea 119: | Línea 123: | ||
| ==== Propiedades de la probabilidad ==== | ==== Propiedades de la probabilidad ==== | ||
| + | |||
| Línea 124: | Línea 129: | ||
| ==== Probabilidad condicionada e independencia de sucesos ==== | ==== Probabilidad condicionada e independencia de sucesos ==== | ||
| - | Es la probabilidad de que ocurra un suceso A sabiendo que también sucede un B, se escribe ''P(A|B)'' y se lee //la probabilidad de A dado B//. No tiene por qué haber una relación entre A y B, ni en tiempo (no tiene por qué suceder ninguno antes) o por causa, A puede causar B, viceversa o simplemente pueden no tener relación alguna. \\ | + | La **probabilidad condicional** se expresa como ''P(A|B)'' y equivale a decir "la probabilidad de que ocurra A sabiendo que ocurre (o ha ocurrido o va a ocurrir o está ocurriendo) B", es decir, "dando B qué probabilidad hay de que ocurra A", se escribe ''P(A|B)'' y se lee //la probabilidad de A dado B//. No tiene por qué haber una relación entre A y B, ni en tiempo (no tiene por qué suceder ninguno antes) o por causa, A puede causar B, viceversa o simplemente pueden no tener relación alguna. \\ |
| Se expresa como: \\ | Se expresa como: \\ | ||
| <m>P(A|B) = {P(A inter B)} / {P(B)} </m> \\ \\ \\ \\ | <m>P(A|B) = {P(A inter B)} / {P(B)} </m> \\ \\ \\ \\ | ||
| Línea 186: | Línea 191: | ||
| * <m>P(overline{B}|A) = {(0.9 · 0.02)} / {0.1 · 0.97 + 0.9 · 0.02} = 0.157</m> | * <m>P(overline{B}|A) = {(0.9 · 0.02)} / {0.1 · 0.97 + 0.9 · 0.02} = 0.157</m> | ||
| Lo que hace es dar la probabilidad de A dado B a partir de la probabilidad de B dado A. Es decir, sabiendo la probabilidad de tener un dolor de cabeza cuando se tiene gripe, se podría saber la probabilidad de tener gripe si se tiene un dolor de cabeza. | Lo que hace es dar la probabilidad de A dado B a partir de la probabilidad de B dado A. Es decir, sabiendo la probabilidad de tener un dolor de cabeza cuando se tiene gripe, se podría saber la probabilidad de tener gripe si se tiene un dolor de cabeza. | ||
| + | |||
| + | |||
| ===== Distribuciones ===== | ===== Distribuciones ===== | ||
| + | Una distribución es una función que nos da la probabilidad de que un valor concreto para una variable pueda ocurrir. Las distribuciones tiene una forma concreta, según esta son discretas o continuas. \\ | ||
| + | La función que siguen una distribución es denominada **función de densidad**. | ||
| + | ==== Tipos ==== | ||
| + | |||
| + | === Discretas === | ||
| + | * **Binomial**: Los ensayos son independientes y la probabilidad de éxisto es fija, además únicamente tiene dos posibles resultados: éxito (p) o fracaso (1-p). | ||
| + | * **De Poisson**: A partir de la frecuencia de un evento estudia la probabilidad de que ocurran otros durante cierto periodo de tiempo. | ||
| + | |||
| + | === Continuas === | ||
| + | Aquellas que pueden tomar cualquier valor existente dentro de un intervalo. | ||
| + | * **Normal**: o gausiana, en una serie de echos podemos ver los más frecuentes en el centro y los menos a los distintos lados del gráfico. Se define a partir de μ (la media) y σ (la desviación típica (σ² es la varianza)). | ||
| + | * **De Pearson o χ²** | ||
| + | * **t de Student**: Cuando la muestra es pequeña. | ||
| + | * **De Laplace** | ||
| + | |||
| ==== Normal ==== | ==== Normal ==== | ||
| Línea 197: | Línea 219: | ||
| + | ===== Intervalos de confianza ===== | ||
| + | Podemos escribir la probabilidad de la forma... \\ | ||
| + | ''P(L ≤ Θ ≤ U) = 1 - ∝'' \\ | ||
| + | , donde //L// y //U// son funciones para los datos y Θ el parámetro. Quiere decir que el valor de Θ estará entre //L// y //U// en un ''100·(1-∝)''% de las veces que se haga el experimento. | ||