logo

¿Cómo encontrar la desviación estándar en R?

En este artículo, discutiremos cómo encontrar la desviación estándar en Lenguaje de programación R . La desviación estándar R es la medida de la dispersión de los valores. También se puede definir como la raíz cuadrada de la varianza.

Fórmula de desviación estándar muestral:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

dónde,

  • s = desviación estándar de la muestra
  • N = Número de entidades
  • overline{x}= Media de entidades

Básicamente, existen dos formas diferentes de calcular la desviación estándar en el lenguaje de programación R; ambas se analizan a continuación.



Método 1: enfoque ingenuo

En este método de calcular la desviación estándar, usaremos la fórmula estándar anterior de la desviación estándar de muestra en lenguaje R.

Ejemplo 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Producción:



[1]   25.53886>

Ejemplo 2:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Producción:

[1] 2.676004>

Método 2: usar sd()

La función sd() se utiliza para devolver la desviación estándar.

cpld y fpga

Sintaxis: sd(x, na.rm = FALSO)

Parámetros:

    x: un vector numérico, matriz o marco de datos.na.rm: ¿se eliminarán los valores faltantes?

Devolver: La desviación estándar muestral de x.

Ejemplo 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

Producción:

[1] 25.53886>

Ejemplo 2:

R

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Producción:

[1] 23.52175>

Ejemplo 3:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Producción:

[1] 2.676004>

Calcule la desviación estándar del marco de datos:

Podemos calcular la desviación estándar del marco de datos utilizando ambos métodos. Podemos tomar el conjunto de datos del iris y para cada columna calcularemos la desviación estándar.

Ejemplo 1:

R

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

Producción:

códigos de error de Linux
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

También podemos calcular la desviación estándar para todo el marco de datos junto con la ayuda de la función de aplicación.

R

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

Producción:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

Las columnas 1 a 4 del conjunto de datos del iris, que son las columnas numéricas que contienen las medidas variables, se eligen utilizando la expresión iris[, 1:4] en el código anterior.

La función sd se aplica a cada columna (marcada con 2) del subconjunto elegido del conjunto de datos del iris utilizando la función aplicar. Los valores de desviación estándar resultantes se guardan en el vector std_deviation para cada columna.