Quando temos amostras independentes de cada uma de duas populações, podemos sumarizá-las pelas suas médias, desvios padrão e tamanhos amostrais.
Denote estas medidas por , , para a amostra 1 e , , para a amostra 2.
Denote as correspondentes médias populacionais e desvios padrão , , e respectivamente.
Para os dados de alturas dos estudantes da UFPR, vamos comparar a altura média dos estudantes do sexo masculino com as dos sexo feminino.
Seja o grupo dos homens a amostra 1, e o grupo das mulheres a amostra 2.
As alturas foram medidas em centímetros e as medidas sumárias foram como segue:
Agora claramente uma estimativa natural da diferença entre médias na
população, , é dada pela diferença nas médias
amostrais:
Agora o que precisamos é um erro padrão para esta estimativa para que possamos construir um intervalo de confiança ou realizar um teste da hipótese nula H: versus H: .
O cálculo do erro padrão de depende da suposição feita a respeito dos desvios padrão de cada grupo de comparação.
Uma regra prática é assumir que os desvios padrão populacionais e são iguais se a razão do maior desvio padrão amostral para o menor for menor do que 2 ou 3.
Além disso a suposição de variâncias iguais pode ser grosseiramente avaliada através de histogramas dos dados.
Testes formais estão disponíveis se necessário. Um deles é o teste F para igualdade de variâncias de Levene cuja hipótese nula é a de que .