Funções de desvio padrão do MySQL

Resumo : neste tutorial, você aprenderá como usar as funções de desvio padrão do MySQL para calcular o desvio padrão de preenchimento e o desvio padrão de amostra.

Introdução ao desvio padrão

O desvio padrão é uma medida de quão dispersos estão os valores em um conjunto de dados. O desvio padrão mostra quanta variação existe em relação à média (média).

Um desvio padrão baixo mostra que os valores no conjunto de dados estão próximos da média. O alto desvio padrão indica que os valores do conjunto de dados estão espalhados por uma grande faixa de valores.

Um desvio padrão é uma raiz quadrada da variância , que pode ser calculada usando as seguintes etapas:

  • Passo 1 . Calcule a média de todos os valores no conjunto de dados para obter a média ou média. Por exemplo, suponha que o conjunto de dados consista em 1, 2 e 3, a média é (1+2+3)/3 = 2.
  • Passo 2 . Calcule a diferença do valor da média para cada valor e eleve ao quadrado o resultado de cada um, por exemplo, (1-2) 2 = (-1) 2 = 1, (2-2) 2 = (0) 2 = 0, (3-2) 2 = (1) 2 = 1.
  • Etapa 3 . Calcule os valores médios na etapa 2, que produz a variância. Em seguida, calcule a raiz quadrada da variância para obter o desvio padrão de todos os valores no conjunto de dados, por exemplo, raiz quadrada de ((1 + 0 + 1)/3) = 0,816497

Desvio padrão da população vs. desvio padrão da amostra

Se todos os valores do conjunto de dados forem considerados no cálculo, esse desvio padrão é chamado de desvio padrão populacional . No entanto, se um subconjunto de valores ou uma amostra for considerado no cálculo, esse desvio padrão é denominado desvio padrão amostral .

Uma letra sigma (σ) representa o desvio padrão. As equações a seguir ilustram como calcular o desvio padrão da população e o desvio padrão da amostra:

Desvio padrão da população:

Fórmula de desvio padrão da população MySQL

Desvio padrão da amostra:

Fórmula de desvio padrão de amostra do MySQL

O cálculo do desvio padrão da população e do desvio padrão da amostra é ligeiramente diferente. Ao calcular a variância do desvio padrão da amostra, divida por N-1 em vez de N, onde N é o número de valores no conjunto de dados.

Funções de desvio padrão do MySQL

O MySQL facilita o cálculo do desvio padrão da população e do desvio padrão da amostra.

Para calcular o desvio padrão populacional, você usa uma das seguintes funções:

  • STD(expression)– retorna o desvio padrão populacional da expressão. A função STD retorna NULL se não houver linha correspondente.
  • STDDEV(expression)– é equivalente à STDfunção. Ele é fornecido para ser compatível apenas com o Oracle Database.
  • STDEV_POP(expression)– é equivalente à STDfunção.

Para calcular o desvio padrão da amostra, você usa a STDDEV_SAMP (expression)função.

O MySQL também fornece algumas funções para cálculo de variação populacional e cálculo de variação amostral:

  • VAR_POP(expression)– calcula a variância padrão populacional da expressão.
  • VARIANCE(expression)– é equivalente à VAR_POPfunção.
  • VAR_SAMP(expression)– calcula a variância padrão amostral da expressão.

Exemplos de funções de desvio padrão do MySQL

Vamos dar uma olhada na orderstabela do banco de dados de exemplo .

Exemplos de funções de desvio padrão populacional

Primeiro, a consulta a seguir retorna os números dos clientes e o número de pedidos da orderstabela:

SELECT customerNumber, 
       COUNT(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber;Linguagem de código:  SQL (linguagem de consulta estruturada)  ( sql )

Em segundo lugar, a seguinte declaração calcula o desvio padrão populacional do número de pedidos dos clientes:

SELECT FORMAT(STD(orderCount),2)
FROM (SELECT customerNumber, count(*) orderCount
FROM orders
GROUP BY customerNumber) t;Linguagem de código:  SQL (linguagem de consulta estruturada)  ( sql )

Experimente

Função MySQL STD

Observe que a função FORMAT é usada para formatar o resultado da STDfunção.

Exemplos de funções de desvio padrão de amostra

Suponha que você queira avaliar apenas os pedidos enviados na tabela de pedidos.

Primeiro, a consulta a seguir retorna os números dos clientes e o número de pedidos enviados:

SELECT customerNumber, count(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber;Linguagem de código:  SQL (linguagem de consulta estruturada)  ( sql )

Em segundo lugar, a consulta a seguir usa a STDDEV_SAMPfunção para calcular o desvio padrão da amostra:

SELECT FORMAT(STDDEV_SAMP(orderCount),2)
FROM (SELECT customerNumber, count(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber) t;Linguagem de código:  SQL (linguagem de consulta estruturada)  ( sql )

Experimente

Função MySQL STDDEV_SAMP

Neste tutorial, apresentamos o conceito de desvio padrão. Em seguida, mostramos como usar as funções de desvio padrão do MySQL para calcular o desvio padrão populacional e o desvio padrão amostral de uma expressão.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *