Resumo : neste tutorial, você aprenderá como usar as funções de desvio padrão do MySQL para calcular o desvio padrão de preenchimento e o desvio padrão de amostra.
Introdução ao desvio padrão
O desvio padrão é uma medida de quão dispersos estão os valores em um conjunto de dados. O desvio padrão mostra quanta variação existe em relação à média (média).
Um desvio padrão baixo mostra que os valores no conjunto de dados estão próximos da média. O alto desvio padrão indica que os valores do conjunto de dados estão espalhados por uma grande faixa de valores.
Um desvio padrão é uma raiz quadrada da variância , que pode ser calculada usando as seguintes etapas:
- Passo 1 . Calcule a média de todos os valores no conjunto de dados para obter a média ou média. Por exemplo, suponha que o conjunto de dados consista em 1, 2 e 3, a média é (1+2+3)/3 = 2.
- Passo 2 . Calcule a diferença do valor da média para cada valor e eleve ao quadrado o resultado de cada um, por exemplo, (1-2) 2 = (-1) 2 = 1, (2-2) 2 = (0) 2 = 0, (3-2) 2 = (1) 2 = 1.
- Etapa 3 . Calcule os valores médios na etapa 2, que produz a variância. Em seguida, calcule a raiz quadrada da variância para obter o desvio padrão de todos os valores no conjunto de dados, por exemplo, raiz quadrada de ((1 + 0 + 1)/3) = 0,816497
Desvio padrão da população vs. desvio padrão da amostra
Se todos os valores do conjunto de dados forem considerados no cálculo, esse desvio padrão é chamado de desvio padrão populacional . No entanto, se um subconjunto de valores ou uma amostra for considerado no cálculo, esse desvio padrão é denominado desvio padrão amostral .
Uma letra sigma (σ) representa o desvio padrão. As equações a seguir ilustram como calcular o desvio padrão da população e o desvio padrão da amostra:
Desvio padrão da população:
Desvio padrão da amostra:
O cálculo do desvio padrão da população e do desvio padrão da amostra é ligeiramente diferente. Ao calcular a variância do desvio padrão da amostra, divida por N-1 em vez de N, onde N é o número de valores no conjunto de dados.
Funções de desvio padrão do MySQL
O MySQL facilita o cálculo do desvio padrão da população e do desvio padrão da amostra.
Para calcular o desvio padrão populacional, você usa uma das seguintes funções:
STD(expression)
– retorna o desvio padrão populacional da expressão. A função STD retorna NULL se não houver linha correspondente.STDDEV(expression)
– é equivalente àSTD
função. Ele é fornecido para ser compatível apenas com o Oracle Database.STDEV_POP(expression)
– é equivalente àSTD
função.
Para calcular o desvio padrão da amostra, você usa a STDDEV_SAMP (expression)
função.
O MySQL também fornece algumas funções para cálculo de variação populacional e cálculo de variação amostral:
VAR_POP(expression)
– calcula a variância padrão populacional da expressão.VARIANCE(expression)
– é equivalente àVAR_POP
função.VAR_SAMP(expression)
– calcula a variância padrão amostral da expressão.
Exemplos de funções de desvio padrão do MySQL
Vamos dar uma olhada na orders
tabela do banco de dados de exemplo .
Exemplos de funções de desvio padrão populacional
Primeiro, a consulta a seguir retorna os números dos clientes e o número de pedidos da orders
tabela:
SELECT customerNumber,
COUNT(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber;
Linguagem de código: SQL (linguagem de consulta estruturada) ( sql )
Em segundo lugar, a seguinte declaração calcula o desvio padrão populacional do número de pedidos dos clientes:
SELECT FORMAT(STD(orderCount),2)
FROM (SELECT customerNumber, count(*) orderCount
FROM orders
GROUP BY customerNumber) t;
Linguagem de código: SQL (linguagem de consulta estruturada) ( sql )
Observe que a função FORMAT é usada para formatar o resultado da STD
função.
Exemplos de funções de desvio padrão de amostra
Suponha que você queira avaliar apenas os pedidos enviados na tabela de pedidos.
Primeiro, a consulta a seguir retorna os números dos clientes e o número de pedidos enviados:
SELECT customerNumber, count(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber;
Linguagem de código: SQL (linguagem de consulta estruturada) ( sql )
Em segundo lugar, a consulta a seguir usa a STDDEV_SAMP
função para calcular o desvio padrão da amostra:
SELECT FORMAT(STDDEV_SAMP(orderCount),2)
FROM (SELECT customerNumber, count(*) orderCount
FROM orders
WHERE status = 'Shipped'
GROUP BY customerNumber) t;
Linguagem de código: SQL (linguagem de consulta estruturada) ( sql )
Neste tutorial, apresentamos o conceito de desvio padrão. Em seguida, mostramos como usar as funções de desvio padrão do MySQL para calcular o desvio padrão populacional e o desvio padrão amostral de uma expressão.