logo

Media, varianza y desviación estándar

Media, varianza y desviación estándar son medidas estadísticas vitales. La varianza cuantifica la desviación de los puntos de datos con respecto a la media, mientras que la desviación estándar mide la distribución de los datos. La distinción clave radica en que la desviación estándar está en las mismas unidades que la media, mientras que la varianza está en unidades al cuadrado. Profundice en estos conceptos con definiciones, fórmulas y un ejemplo ilustrativo.

Significar

Significar es el promedio de un conjunto de datos dado. Consideremos el siguiente ejemplo.

2, 4, 4, 4, 5, 5, 7, 9

Estos ocho puntos de datos tienen la media (promedio) de 5:

frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

Fórmula: mu=frac{sum_{i=1}^{N} x_{i}}{N}

Dónde ? es media yx1, X2, X3…., Xison elementos. También tenga en cuenta que la media a veces se denota por egin{array}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (- 1)^2 = 1 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4  (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16.  end{array}



Diferencia

Diferencia es la suma de los cuadrados de las diferencias entre todos los números y medias.
Desviación para el ejemplo anterior. Primero, calcule las desviaciones de cada punto de datos de la media y eleve al cuadrado el resultado de cada uno:

Fórmula: sigma^{2}= frac { sum_{i=1}^{N} (x_{i}-mu)^{2}}{N}

varianza = 	extup{Coeficiente de variación } =frac{ 	extup{Desviación estándar}}{Media}*100= 4.



Dónde ? es la media, N es el número total de elementos o frecuencia de distribución.


Desviación Estándar

Desviación Estándar es la raíz cuadrada de la varianza. Es una medida del grado en que los datos varían de la media.

Desviación estándar (para los datos anteriores) = = 2

¿Por qué los matemáticos eligieron un cuadrado y luego una raíz cuadrada para encontrar la desviación, y por qué no simplemente tomar la diferencia de valores?
Una razón es que la suma de las diferencias llega a ser 0 según la definición de media. La suma de diferencias absolutas podría ser una opción, pero con diferencias absolutas era difícil demostrar muchos teoremas interesantes. [Fuente: Videoconferencia del MIT a las 1:19]

  1. El valor de la desviación estándar es 0 si todas las entradas en la entrada son iguales.
  2. Si sumamos (o restamos) un número, digamos 7, a todos los valores del conjunto de entrada, la media aumenta (o disminuye) en 7, pero la desviación estándar no cambia.
  3. Si multiplicamos todos los valores en el conjunto de entrada por un número 7, tanto la media como la desviación estándar se multiplican por 7. Pero si multiplicamos todos los valores de entrada con un número negativo, digamos -7, la media se multiplica por -7, pero el la desviación estándar se multiplica por 7.
  4. La desviación estándar y la varianza son una medida que indica qué tan dispersos están los números. Si bien la varianza le da una idea aproximada de la dispersión, la desviación estándar es más concreta y le brinda distancias exactas de la media.
  5. La media, la mediana y la moda son la medida de tendencia central de los datos (ya sea agrupados o no agrupados).

Controlar:

  • Varianza y desviación estándar
  • Aplicaciones de la desviación estándar en la vida real
  • Diferencia entre varianza y desviación estándar

Las siguientes preguntas se formularon en los exámenes GATE del año anterior. Referencias:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm

Media, varianza y desviación estándar: preguntas frecuentes

¿Cuál es la diferencia entre desviación estándar y varianza?

Tanto la desviación estándar como la varianza miden la dispersión de los puntos de datos en un conjunto de datos en relación con la media. La diferencia clave es que la varianza mide el promedio de las desviaciones al cuadrado de la media, mientras que la desviación estándar es la raíz cuadrada de la varianza, lo que proporciona una medida de dispersión en las mismas unidades que los datos.

¿Cómo se calcula la media, la varianza y la desviación estándar?

  • Media: Suma todos los números y divide por el recuento de números.
  • Varianza: Calcule la media, reste la media de cada número, cuadre el resultado, sume estos resultados al cuadrado y divida por el número de números menos uno.
  • Desviación estándar: saque la raíz cuadrada de la varianza.

¿Por qué son importantes la media, la varianza y la desviación estándar?

Estas medidas estadísticas son cruciales para comprender la distribución de los datos. La media proporciona un valor central, mientras que la varianza y la desviación estándar brindan información sobre la variabilidad o dispersión de los datos, indicando la consistencia o volatilidad del conjunto de datos.

¿Pueden ser negativas la varianza y la desviación estándar?

No, la varianza y la desviación estándar no pueden ser negativas. La varianza se calcula como el promedio de las diferencias al cuadrado de la media, lo que da como resultado un valor no negativo. Dado que la desviación estándar es la raíz cuadrada de la varianza, tampoco puede ser negativa.

¿Cómo afectan los valores atípicos a la media, la varianza y la desviación estándar?

Los valores atípicos pueden afectar significativamente la media al atraerla hacia el valor atípico, por lo que no reflejan con precisión la tendencia central del conjunto de datos. La varianza y la desviación estándar también se ven afectadas, ya que aumentarán, lo que indica una mayor dispersión de datos debido a los valores atípicos.