######## # Mostrando porque é melhor usar n-1 ao invés de n # ao estimar a variância set.seed(984293781) media=12 dp=1 N=50000 hemo=rnorm(N,media,dp) #nivel de hemoglobina em mulheres jovens e saud?veis par(mfrow=c(1,1)) hist(hemo,main='',xlab='Taxas de hemoglobina',freq=TRUE,ylab='Frequência Absoluta') N=length(hemo) media.pop=round(mean(hemo)) var.pop=round(sum((hemo-mean(hemo))^2)/N,1) dp.pop=round(var.pop) abline(v=media,lty=2,col=2,lwd=2) dp.pop n=6 amostra=sample(hemo,size=n,replace=TRUE) var.6=round(sum((amostra-mean(amostra))^2)/n,3) var.5=round(sum((amostra-mean(amostra))^2)/(n-1),3) data.frame(var.pop, var.6, var.5) m=NULL v=NULL s2=NULL n=6 for (i in 1:500) { amostra=sample(hemo,size=n,replace=TRUE) m=c(m,mean(amostra)) v=c(v,sum((amostra-mean(amostra))^2)/n) s2=c(s2,sum((amostra-mean(amostra))^2)/(n-1)) } par(mfrow=c(2,1)) hist(s2,xlab='s²',xlim=range(c(v,s2)),main='') abline(v=var.pop,col=2,lwd=3) abline(v=mean(s2),col=4,lwd=3) legend(max(s2)-1.5,150,c('sigma²','s²'), col=c(2,4),lty=1,lwd=3) hist(v,xlab='v²',xlim=range(c(v,s2)),main='') abline(v=var.pop,col=2,lwd=3) abline(v=mean(v),col=4,lwd=3) ######## # Mostrando porque é melhor usar n-1 ao invés de n # ao estimar a variância tempo=rweibull(50000,1.5,0.5) par(mfrow=c(1,1)) hist(tempo) sigma2=round(sum((tempo-mean(tempo))^2)/length(tempo),3) sigma2 m=NULL s2=NULL v=NULL n=7 for (i in 1:1000) { amostra=sample(tempo,size=n,replace=TRUE) m=c(m,mean(amostra)) v=c(v,sum((amostra-mean(amostra))^2)/n) s2=c(s2,sum((amostra-mean(amostra))^2)/(n-1)) } par(mfrow=c(2,1)) hist(s2,xlab='s?',xlim=range(c(v,s2)),main='') abline(v=var.pop,col=2,lwd=3) abline(v=mean(s2),col=4,lwd=3) legend('topright',c('Sigma?','s?'), col=c(2,4),lty=1,lwd=3) hist(v,xlab='v',xlim=range(c(v,s2)),main='') abline(v=var.pop,col=2,lwd=3) abline(v=mean(v),col=4,lwd=3) legend('topright',c('Sigma?','v'), col=c(2,4),lty=1,lwd=3)