Interpretando a Análise de dados

As fases da análise de dados, apesar de ser um ciclo, possuem algumas fases bem distintas.

Já falamos sobre praticamente todas as fases, neste artigo iremos nos ater à fase de Interpretação.

Nessa fase, os resultados podem ser homologados ou não. Em caso negativo, avalia-se os principais parâmetros utilizados e convalida-os.

Para validar os dados alguns critérios matemáticos são indispensáveis nesse processo.

Variância e Desvio padrão

São medidas de dispersão que indicam a regularidade de um conjunto de dados em função de uma média aritmética.

 Variância

É a medida de dispersão que mostra quão distante os valores estão da média.

Exemplo:

Considere dois alunos com as seguintes notas:

variancia

Média (Aluno A) = (7 + 10 + 6 + 8 + 4)/5 = 7

Média (Aluno B) = (7,5 + 6 + 7 + 6,5 + 8)/5 = 7

Calcula-se a diferença entre os valores e sua média e depois eleva-se essa diferença ao quadrado.

A variância é feita usando a fórmula:

Desvio Padrão

Conhecer o desvio padrão é importante. Ele é o resultado positivo de uma raiz quadrada da variância. Na prática o desvio padrão indica qual é o “erro” se fossemos substituir uma das notas pela média.

Ou seja, podemos afirmar que 2 é distância da média, ou seja, seu grau de dispersão e sua probabilidade de acontecer distante da média.

Muitas outras formas podem ser utilizadas para validar suas análises, estudaremos mais algumas no momento oportuno. Até lá!

Você também pode gostar...