Estimação

No exemplo acima interessa saber se existe efeito de fertilizante.


Mas o que é existir efeito de fertilizante?


Num mesmo tratamento, plantas diferentes respondem de formas diferentes (variabilidade). O peso seco das plantas é uma variável aleatória!

Vamos considerar que existe efeito de fertilizante quando o peso seco médio das plantas cultivadas em ambiente fertilizado diferir do peso seco médio das plantas cultivadas em ambiente padrão. Isto é, quando as distribuições do peso seco para o grupo controle e grupo tratamento apresentam médias, digamos $\mu_c$ e $\mu_t$, diferentes.

As quantidades $\mu_c$ e $\mu_t$ são desconhecidas e chamadas parâmetros, e só podem ser conhecidas se observarmos toda a população, o que é quase sempre impossível.

O que fazemos é estimar os parâmetros a partir de uma amostra da população.

As médias $\mu_c$ e $\mu_t$ podem ser estimadas pelas médias amostrais $\bar{X}_c$ e $\bar{X}_t$, que são funções dos valores da amostra e são chamadas de estimadores de $\mu_c$ e $\mu_t$.

Os valores de $\bar{X}_c$ e $\bar{X}_t$ observados na amostra

$\bar{x}_c=5,03$ g e $\bar{x}_t=4,66$ g

são chamados de estimativas dos parâmetros. Observe que denotamos estimativas por letras minúsculas e estimadores por letras maiúsculas.


Exemplo: Exemplo 6.1.2 pág 122
Dois diferentes tipos de secagem foram usados na preparação de sementes. Duzentas sementes foram aleatoriamente selecionadas para serem submetidas a dois processos de secagem A e B. Após a secagem, as sementes foram osbervadas quanto à sua germinação. Os resultados foram:

Processo de Germinação  
secagem Sim Não Total
A 70 30 100
B 62 38 100
Total 132 68 200

Neste caso interessa saber se existe diferença entre os métodos de secagem quanto à germinanção de sementes. Vamos considerar que existe efeito de método de secagem quando as proporções populacionais de sementes germinadas pelos métodos A, $p_A$, e B, $p_B$, diferem.

Os parâmetros de interesse $p_A$ e $p_B$ são estimados pelas proporções amostrais

$\hat{p}_A=\frac{x_A}{n_A}$ e $\hat{p}_B=\frac{x_B}{n_B}$

em que

$x_A$ é o número de sementes submetidas ao processo A que germinaram;
$n_A$ é o número total de sementes submetidas ao processo A;
$x_B$ é o número de sementes submetidas ao processo B que germinaram;
$n_B$ é o número total de sementes submetidas ao processo B;

As estimativas dos parâmetros $p_A$ e $p_B$ são $\hat{p}_A=0,70$ e $\hat{p}_B=0,62$.

Nos exemplos acima, os parâmetros de interesse forma médias e proporções, mas poderiamos estar interessados em estimar medianas, desvios-padrão, etc.


Diferentes amostras podem ser retiradas de uma mesma população, e amostras diferentes podem resultar em estimativas diferentes. Isto é, um estimador é uma variável aleatória, podendo assumir valores diferentes para cada amostra.

Então, ao invés de estimar o parâmetro de interesse por um único valor, é muito mais informativo estimá-lo por um intervalo de valores que considere a variação presente na amostra e que contenha o seu verdadeiro valor com determinada confiança. Este intervalo é chamado de intervalo de confiança.

Para construir um intervalo de confiança precisamos conhecer a distribuição de probabilidade do estimador. Lembre que um estimador é uma variável aleatória e que uma variável aleatória é completamente caracterizada por sua distribuição de probabilidade.

Na próxima seção serão apresentados resultados sobre a distribuição de probabilidade da média amostral.



Subsecções
shimakur 2016-02-29