Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa | ||
|
numbers:statistics [2011/04/29 16:28] alfred |
numbers:statistics [2020/05/09 09:25] (actual) |
||
|---|---|---|---|
| Línea 2: | Línea 2: | ||
| ===== Conceptos ===== | ===== Conceptos ===== | ||
| + | |||
| + | |||
| Línea 13: | Línea 15: | ||
| * **Variable aleatoria**: Es una variable que toma valores numéricos a partir de un experimento aleatorio. Su valor no está determinado por una causa concreta. | * **Variable aleatoria**: Es una variable que toma valores numéricos a partir de un experimento aleatorio. Su valor no está determinado por una causa concreta. | ||
| * **Distribución**: Es una función que nos da la probabilidad de que un valor concreto para una variable aleatoria pueda ocurrir. | * **Distribución**: Es una función que nos da la probabilidad de que un valor concreto para una variable aleatoria pueda ocurrir. | ||
| + | * **Función de densidad**: La función que sigue una distirbución. | ||
| ==== Conjuntos ==== | ==== Conjuntos ==== | ||
| Línea 38: | Línea 41: | ||
| * **Frecuencia absoluta**: El número de veces que encontramos un valor en el tamaño de la muestra. | * **Frecuencia absoluta**: El número de veces que encontramos un valor en el tamaño de la muestra. | ||
| * **Frecuencia relativa**: La proporción del valor de una variable (frecuencia absoluta / tamaño de la muestra). | * **Frecuencia relativa**: La proporción del valor de una variable (frecuencia absoluta / tamaño de la muestra). | ||
| + | |||
| + | |||
| Línea 79: | Línea 84: | ||
| Es lo que utilizamos para determinar la fluctuación de los datos. Es la raíz cuadrada positiva de la varianza: \\ | Es lo que utilizamos para determinar la fluctuación de los datos. Es la raíz cuadrada positiva de la varianza: \\ | ||
| <m>S = sqrt{S²}</m> | <m>S = sqrt{S²}</m> | ||
| + | La desviación estándar es simplemente el "promedio" esperado con respecto a la media aritmética. Por ejemplo, las muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) tienen una media de 7. Sus desviaciones típicas son 8,08, 5,77 y 1,15, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7. \\ \\ | ||
| + | Podríamos decir que si, por ejemplo, en una clase el conjunto normal de notas está entre el 4 y el 7 la desviación (y por tanto la varianza) sería más pequeña que si las notas están repartidas entre el 2 y 8. Aún así es preferible el uso de la varianza ya que su valor está en las mismas unidades que los datos. Además, si los datos están estandarizados es más intuitivo su uso. | ||
| + | |||
| ==== Estandarizar valores ==== | ==== Estandarizar valores ==== | ||
| Línea 115: | Línea 123: | ||
| ==== Propiedades de la probabilidad ==== | ==== Propiedades de la probabilidad ==== | ||
| + | |||
| Línea 120: | Línea 129: | ||
| ==== Probabilidad condicionada e independencia de sucesos ==== | ==== Probabilidad condicionada e independencia de sucesos ==== | ||
| - | Es la probabilidad de que ocurra un suceso A sabiendo que también sucede un B, se escribe ''P(A|B)'' y se lee //la probabilidad de A dado B//. No tiene por qué haber una relación entre A y B, ni en tiempo (no tiene por qué suceder ninguno antes) o por causa, A puede causar B, viceversa o simplemente pueden no tener relación alguna. \\ | + | La **probabilidad condicional** se expresa como ''P(A|B)'' y equivale a decir "la probabilidad de que ocurra A sabiendo que ocurre (o ha ocurrido o va a ocurrir o está ocurriendo) B", es decir, "dando B qué probabilidad hay de que ocurra A", se escribe ''P(A|B)'' y se lee //la probabilidad de A dado B//. No tiene por qué haber una relación entre A y B, ni en tiempo (no tiene por qué suceder ninguno antes) o por causa, A puede causar B, viceversa o simplemente pueden no tener relación alguna. \\ |
| Se expresa como: \\ | Se expresa como: \\ | ||
| <m>P(A|B) = {P(A inter B)} / {P(B)} </m> \\ \\ \\ \\ | <m>P(A|B) = {P(A inter B)} / {P(B)} </m> \\ \\ \\ \\ | ||
| Línea 154: | Línea 163: | ||
| Se diría que la probabilidad de entrar en una carrera u otra sería: <m>P(A_1), P(A_2), P(A_3)</m>, para arquitectura, medicina y economía respectivamente y el acabar los estudios sería <m>P(B_1), P(B_2)</m> según si es acabarlos o no. \\ | Se diría que la probabilidad de entrar en una carrera u otra sería: <m>P(A_1), P(A_2), P(A_3)</m>, para arquitectura, medicina y economía respectivamente y el acabar los estudios sería <m>P(B_1), P(B_2)</m> según si es acabarlos o no. \\ | ||
| Aprobar los estudios de arquitectura sería pues: <m>P(A_1 inter B_1)</m>. Y aprobar los estudios habiendo hecho arquitectura <m>P(B_1 | A_1)</m>. Por lo tanto: <m>P(A_i inter B_j) = P(A_i) · P(B_j | A_i)</m> | Aprobar los estudios de arquitectura sería pues: <m>P(A_1 inter B_1)</m>. Y aprobar los estudios habiendo hecho arquitectura <m>P(B_1 | A_1)</m>. Por lo tanto: <m>P(A_i inter B_j) = P(A_i) · P(B_j | A_i)</m> | ||
| + | |||
| + | |||
| Línea 179: | Línea 190: | ||
| {{numbers:statistics:0_54.gif|}} | {{numbers:statistics:0_54.gif|}} | ||
| * <m>P(overline{B}|A) = {(0.9 · 0.02)} / {0.1 · 0.97 + 0.9 · 0.02} = 0.157</m> | * <m>P(overline{B}|A) = {(0.9 · 0.02)} / {0.1 · 0.97 + 0.9 · 0.02} = 0.157</m> | ||
| + | Lo que hace es dar la probabilidad de A dado B a partir de la probabilidad de B dado A. Es decir, sabiendo la probabilidad de tener un dolor de cabeza cuando se tiene gripe, se podría saber la probabilidad de tener gripe si se tiene un dolor de cabeza. | ||
| + | |||
| + | |||
| + | |||
| + | ===== Distribuciones ===== | ||
| + | Una distribución es una función que nos da la probabilidad de que un valor concreto para una variable pueda ocurrir. Las distribuciones tiene una forma concreta, según esta son discretas o continuas. \\ | ||
| + | La función que siguen una distribución es denominada **función de densidad**. | ||
| + | ==== Tipos ==== | ||
| + | |||
| + | === Discretas === | ||
| + | * **Binomial**: Los ensayos son independientes y la probabilidad de éxisto es fija, además únicamente tiene dos posibles resultados: éxito (p) o fracaso (1-p). | ||
| + | * **De Poisson**: A partir de la frecuencia de un evento estudia la probabilidad de que ocurran otros durante cierto periodo de tiempo. | ||
| + | |||
| + | === Continuas === | ||
| + | Aquellas que pueden tomar cualquier valor existente dentro de un intervalo. | ||
| + | * **Normal**: o gausiana, en una serie de echos podemos ver los más frecuentes en el centro y los menos a los distintos lados del gráfico. Se define a partir de μ (la media) y σ (la desviación típica (σ² es la varianza)). | ||
| + | * **De Pearson o χ²** | ||
| + | * **t de Student**: Cuando la muestra es pequeña. | ||
| + | * **De Laplace** | ||
| + | |||
| + | ==== Normal ==== | ||
| + | {{numbers:statistics:campana_gauss1.gif|}} | ||
| + | === El teorema del límite central === | ||
| + | Dice que cuando el número de variables aleatorias es suficientemente grande la distribución que siguen los experimentos es normal. | ||
| + | ===== Intervalos de confianza ===== | ||
| + | Podemos escribir la probabilidad de la forma... \\ | ||
| + | ''P(L ≤ Θ ≤ U) = 1 - ∝'' \\ | ||
| + | , donde //L// y //U// son funciones para los datos y Θ el parámetro. Quiere decir que el valor de Θ estará entre //L// y //U// en un ''100·(1-∝)''% de las veces que se haga el experimento. | ||