lunes, 30 de mayo de 2022

ESTADISTICA DESCRIPTIVA BASICA (PARA PYTHON)

 Fuente: https://relopezbriega.github.io/blog/2015/06/27/probabilidad-y-estadistica-con-python/

Conceptos básicos de la estadística descriptiva

En estadística descriptiva se utilizan distintas medidas para intentar describir las propiedades de nuestros datos, algunos de los conceptos básicos, son:

  • Media aritmética: La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total elementos. Se suele representar con la letra griega
. Si tenemos una muestra de valores, , la media aritmética, , es la suma de los valores divididos por el numero de elementos; en otras palabras:
  • Desviación respecto a la media: La desviación respecto a la media es la diferencia en valor absoluto entre cada valor de la variable estadística y la media aritmética.
  • Varianza: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. La varianza intenta describir la dispersión de los datos. Se representa como
.
  • Desviación típica: La desviación típica es la raíz cuadrada de la varianza. Se representa con la letra griega
.
  • Moda: La moda es el valor que tiene mayor frecuencia absoluta. Se representa con
  • Mediana: La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. Se representa con
  • .
  • Correlación: La correlación trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas. La correlación es positiva cuando los valores de las variables aumenta juntos; y es negativa cuando un valor de una variable se reduce cuando el valor de la otra variable aumenta.
  • Covarianza: La covarianza es el equivalente de la varianza aplicado a una variable bidimensional. Es la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.La covarianza indica el sentido de la correlación entre las variables; Si
la correlación es directa; Si
  • la correlación es inversa.
  • Valor atípico: Un valor atípico es una observación que se aleja demasiado de la moda; esta muy lejos de la tendencia principal del resto de los datos. Pueden ser causados por errores en la recolección de datos o medidas inusuales. Generalmente se recomienda eliminarlos del conjunto de datos.

No hay comentarios: