Herramientas de usuario

Herramientas del sitio


numbers:statistics

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
numbers:statistics [2011/10/14 11:44]
alfred
numbers:statistics [2020/05/09 09:25] (actual)
Línea 1: Línea 1:
 ====== Estadística ====== ====== Estadística ======
-Este apartado está muy relacionado con [[ai:​datos]]. 
  
 ===== Conceptos ===== ===== Conceptos =====
Línea 42: Línea 41:
   * **Frecuencia absoluta**: El número de veces que encontramos un valor en el tamaño de la muestra.   * **Frecuencia absoluta**: El número de veces que encontramos un valor en el tamaño de la muestra.
   * **Frecuencia relativa**: La proporción del valor de una variable (frecuencia absoluta / tamaño de la muestra).   * **Frecuencia relativa**: La proporción del valor de una variable (frecuencia absoluta / tamaño de la muestra).
 +
  
  
Línea 84: Línea 84:
 Es lo que utilizamos para determinar la fluctuación de los datos. Es la raíz cuadrada positiva de la varianza: \\ Es lo que utilizamos para determinar la fluctuación de los datos. Es la raíz cuadrada positiva de la varianza: \\
 <m>S = sqrt{S²}</​m>​ <m>S = sqrt{S²}</​m>​
-La desviación estándar es simplemente el "​promedio"​ esperado con respecto a la media aritmética. Por ejemplo, las muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) tienen una media de 7. Sus desviaciones típicas son 8,08, 5,77 y 1,15, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.+La desviación estándar es simplemente el "​promedio"​ esperado con respecto a la media aritmética. Por ejemplo, las muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) tienen una media de 7. Sus desviaciones típicas son 8,08, 5,77 y 1,15, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7. \\ \\  
 +Podríamos decir que si, por ejemplo, en una clase el conjunto normal de notas está entre el 4 y el 7 la desviación (y por tanto la varianza) sería más pequeña que si las notas están ​ repartidas entre el 2 y 8. Aún así es preferible el uso de la varianza ya que su valor está en las mismas unidades que los datos. Además, si los datos están estandarizados es más intuitivo su uso. 
  
 ==== Estandarizar valores ==== ==== Estandarizar valores ====
Línea 189: Línea 191:
   * <​m>​P(overline{B}|A) = {(0.9 · 0.02)} / {0.1 · 0.97 + 0.9 · 0.02} = 0.157</​m>​   * <​m>​P(overline{B}|A) = {(0.9 · 0.02)} / {0.1 · 0.97 + 0.9 · 0.02} = 0.157</​m>​
 Lo que hace es dar la probabilidad de A dado B a partir de la probabilidad de B dado A. Es decir, sabiendo la probabilidad de tener un dolor de cabeza cuando se tiene gripe, se podría saber la probabilidad de tener gripe si se tiene un dolor de cabeza. Lo que hace es dar la probabilidad de A dado B a partir de la probabilidad de B dado A. Es decir, sabiendo la probabilidad de tener un dolor de cabeza cuando se tiene gripe, se podría saber la probabilidad de tener gripe si se tiene un dolor de cabeza.
 +
 +
  
 ===== Distribuciones ===== ===== Distribuciones =====
 +Una distribución es una función que nos da la probabilidad de que un valor concreto para una variable pueda ocurrir. Las distribuciones tiene una forma concreta, según esta son discretas o continuas. \\ 
 +La función que siguen una distribución es denominada **función de densidad**.
 +==== Tipos ====
 +
 +=== Discretas ===
 +  * **Binomial**:​ Los ensayos son independientes y la probabilidad de éxisto es fija, además únicamente tiene dos posibles resultados: éxito (p) o fracaso (1-p).
 +  * **De Poisson**: A partir de la frecuencia de un evento estudia la probabilidad de que ocurran otros durante cierto periodo de tiempo.
 +
 +=== Continuas ===
 +Aquellas que pueden tomar cualquier valor existente dentro de un intervalo.
 +  * **Normal**: o gausiana, en una serie de echos podemos ver los más frecuentes en el centro y los menos a los distintos lados del gráfico. Se define a partir de μ (la media) y σ (la desviación típica (σ² es la varianza)).
 +  * **De Pearson o χ²**
 +  * **t de Student**: Cuando la muestra es pequeña.
 +  * **De Laplace**
  
  
Línea 200: Línea 218:
  
  
-===== Otros ===== 
- 
- 
- 
-==== Modelos de Markov ==== 
-Un modelo de Markov no es más que un modelo en el que una acción ocurre con probabilidad condicional independiente a las demás; esto permite calcularla fácilmente. \\  
-En un modelo existen: 
-  * Estados que se pueden dar. 
-  * Probabilidades iniciales de los estados, que un estado sea el primero. 
-  * Probabilidades de cambio de un estado a otro. 
-  * Acciones que se pueden llevar a cabo. 
-  * Probabilidad de que las acciones se lleven a cabo según el estado. 
-<code python> 
-estados = ('​Lluvioso',​ '​Soleado'​) 
-observaciones = ('​caminar',​ '​comprar',​ '​limpiar'​) 
-probabilidad_inicial = {'​Lluvioso':​ 0.6, '​Soleado':​ 0.4} 
-probabilidad_transicion = { 
-   '​Lluvioso'​ : {'​Lluvioso':​ 0.7, '​Soleado':​ 0.3}, 
-   '​Soleado' ​ : {'​Lluvioso':​ 0.4, '​Soleado':​ 0.6}, 
-   } 
-probabilidad_emision = { 
-   '​Lluvioso'​ : {'​caminar':​ 0.1, '​comprar':​ 0.4, '​limpiar':​ 0.5}, 
-   '​Soleado' ​ : {'​caminar':​ 0.6, '​comprar':​ 0.3, '​limpiar':​ 0.1}, 
-   } 
-</​code>​ 
-Los problemas que pueden ser resueltos gracias a las cadenas de Markov son: 
-  - Calcular la probabilidad de que ocurra algo (problema de evaluación),​ se monta el modelo y se calcula las probabilidades a partir de la anterior. 
-  - Calcular, dando un modelo y un resultado, qué secuencia de estados es más probable que haya seguido (problema de decodificación,​ con algoritmo de Viterbi). Se monta el modelo y se van calculando probabilidades,​ se escogerá como resultado la secuencia de estados más probables. 
-  - Crear un modelo desde 0. Problema de aprendizaje. 
-Un modelo oculto de Markov es cuando se conoce una salida pero no el paso por los estados, estos podrían respresentar por ejemplo gestos del usuario: el sistema recbe unos datos y según estos podría indicar qué gestos han sido realizados (tipo de problema 2). 
  
-=== Notas === +===== Intervalos de confianza ===== 
-  * {{numbers:​statistics:​introduction_to_markov_chains.zip|Vídeos sobre el montaje del modelo y el cálculo ​de probabilidades}}. +Podemos escribir la probabilidad ​de la forma... \\  
-  * {{numbers:​statistics:​ejmarkov.pdf|Ejemplos de uso de los modelos de Markov}}+''​P(L ≤ Θ ≤ U) = 1 ∝''​ \\  
-  * {{numbers:​statistics:​hidden-markov-models01.pdf|Documento sobre como resolver ​los distintos problemas}}.+, donde //L// y //U// son funciones para los datos y Θ el parámetro. Quiere decir que el valor de Θ estará entre //L// y //U// en un ''​100·(1-∝)''​% de las veces que se haga el experimento.
numbers/statistics.1318592689.txt.gz · Última modificación: 2020/05/09 09:24 (editor externo)