%==========================================================================================
% Estatística Computacional I                                         www.leg.ufpr.br/ce083
% Curso de Estatística - 2013/1
%                                                                      Prof. Walmes Zeviani
%                                                                         LEG - DEST - UFPR
%
% Aula 24                                                                      (11/07/2013)
%    * Edição de documentos em Sweave;
%==========================================================================================

\documentclass[12pt]{article} % classe do documento
\usepackage[brazilian,brazil]{babel} % definições de idioma
\usepackage[utf8x]{inputenc}  % para Linux
%\usepackage[latin1]{inputenc} % para Windows
\usepackage[T1]{fontenc} % para usar o \hyphenation{}
\usepackage{amsmath}  % texto matemático
\usepackage{graphicx} % incluir figuras
%\usepackage{mathpazo} % tipo de fonte
\usepackage[top=2.5cm, left=2.5cm, right=2.5cm, bottom=2.5cm]{geometry} % tamanho das margens

\title{Precificação de apartamentos para o \\ bairro Água Verde em Curitiba}
\author{Chuck Norris\footnote{Acadêmico do Curso de Estatística, grr: 12345678.}
\and Arnold Schwarzenegger\footnote{Acadêmico do Curso de Estatística, grr: 87654321.}}

\hyphenation{dis-tri-bu-i-\c{c}\~{a}o va-ri-\'{a}-vel}

\usepackage{Sweave}
\begin{document}
\input{ce083-2013-01-aula24-concordance}
\maketitle

O preço de imóveis depende principalmente do seu tamanho e localização. A infraestrutura dos bairros
influenciam o preço do imóvel pela disponibilidade de recursos, como mercados e escolas, vias de acessos
e distâncias com relação aos centros comerciais da cidade, além de segurança e arborização. Dentro de um
mesmo bairro o valor dos imóveis dependem da sua área contruída, da face voltada para o sol, do número de quartos
e das vagas na garagem. Diante de tantas caracteríticas que regulam o valor do imóvel é útil estabelecer um modelo
para preficiação a partir de suas caractísticas. O objetivo com essa análise é construir um modelo
para precificação de apartamentos no bairro Água Verde em Curitiba.

\section{Descrição e análise exploratória}


Uma amostra aleatória de 40 apartamentos tipo padrão foi feita dentro do site Imóveis Curitiba
\footnote{\texttt{www.imoveiscuritiba.com.br}}. Coletou-se apenas informações para imóveis do bairro Água Verde. 
Foram registradas as variáveis do imóvel: preço (R\$),
área (m$^2$), número de quartos, de suites, de banheiros e vagas na garagem. Os dados estão disponíveis
na tabela \ref{tab:dados} na sessão anexos.

A análise exploratória dos dados aponta que o valor do imóvel aumenta com a área do mesmo
(figura \ref{fig:dispersao}). Na escala original das variáveis preço e área, verifica-se uma relação
linear positiva com aumento da variabilidade ao longo da linha de tendência ao passo que na escala
logarítmica essas duas variáveis apresentam ainda uma relação linear porém com variabilidade
aproximadamente constante.

Da amostra coletada mais de 50\% dos apartamentos têm até dois banheiros (tabela \ref{tab:freqs}).
Mais da metade dos apartamentos têm três quartos e quase 90\% deles têm uma suite e até duas vagas
na garagem. O preço do imóvel aumenta de acordo com o número de banheiros, quartos, suites e vagas na garagem
conforme pode ser visto na figura \ref{fig:quantidade}. No entanto, não pode deixar de ser
mencionado que o aumento do número de quartos por exemplo também representa aumento da área do
imóvel. Sendo assim, as relações observadas nos gráficos não podem ser intepretadas isoladamente
pois essas variáveis que regulam o preço do imóvel são dependentes umas das outras.

\setkeys{Gin}{width=0.6\textwidth}
\begin{figure}[p]
\begin{center}
\includegraphics{ce083-2013-01-aula24-dispersao}
\end{center}
\caption{Preço do imóvel (R\$) em função da sua área (m$^2$) na escala natural (esq.)
e na escala logaritmica dos valores (dir.). Linha suave indica
a relação de tendência entre as variáveis.}\label{fig:dispersao}
\end{figure}


\begin{small}
% latex table generated in R 3.0.1 by xtable 1.7-1 package
% Thu Jul 18 18:09:29 2013
\begin{table}[ht]
\centering
\caption{Frequência do número banheiros, quartos, suites e vagas na garagem por imóvel. Valores entre parenteses representam a frequência relativa.} 
\label{tab:freqs}
\begin{tabular}{rrrrr}
  \hline
unidades & banheiros & quartos & suites & vagas \\ 
  \hline
1 & 10 (25.0\%) & 1 (2.5\%) & 35 (87.5\%) & 16 (40.0\%) \\ 
  2 & 17 (42.5\%) & 10 (25.0\%) & 3 (7.5\%) & 19 (47.5\%) \\ 
  3 & 8 (20.0\%) & 23 (57.5\%) & 2 (5.0\%) & 4 (10.0\%) \\ 
  4 & 3 (7.5\%) & 6 (15.0\%) &  & 1 (2.5\%) \\ 
  5 & 1 (2.5\%) &  &  &  \\ 
  6 & 1 (2.5\%) &  &  &  \\ 
   \hline
\end{tabular}
\end{table}\end{small}

\setkeys{Gin}{width=\textwidth}
\begin{figure}[p]
\begin{center}
\includegraphics{ce083-2013-01-aula24-005}
\end{center}
\caption{Preço do imóvel (R\$) em função do número de quartos, banheiros, suites e vagas
na garagem.}\label{fig:quantidade}
\end{figure}

\section{Ajuste do modelo}

Com a intenção de precificar imóveis será ajutado um modelo de regressão linear simples
do preço do imóvel como função da área. Os valores serão usados na escala logartímica de base 10 uma
vez que o gráfico de análise exploratória indicou uma relação linear de variabilidade
constante para a relação entre essas duas variáveis.

\begin{Schunk}
\begin{Sinput}
> imo <- transform(imo, lp=log10(preco), la=log10(area))
> m0 <- lm(lp~la, data=imo)
> summary(m0)
\end{Sinput}
\begin{Soutput}
Call:
lm(formula = lp ~ la, data = imo)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.30911 -0.07229  0.01244  0.06247  0.23238 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.84200    0.16870   4.991 1.36e-05 ***
la           0.93808    0.08374  11.202 1.33e-13 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.09989 on 38 degrees of freedom
Multiple R-squared:  0.7676,	Adjusted R-squared:  0.7614 
F-statistic: 125.5 on 1 and 38 DF,  p-value: 1.328e-13
\end{Soutput}
\begin{Sinput}
> c0 <- round(coef(m0), 3)
> r2 <- round(summary(m0)$r.squared, 3)
\end{Sinput}
\end{Schunk}

O ajuste do modelo aos dados fornceu a seguinte esquação estimada para o valor esperado
do imóvel na escala $\log_{10}$
\begin{equation}
 \text{E}(\log_{10}(\text{pre\c{c}o})|\text{\'{a}rea}) =
 0.842 + 0.938 \log_{10}(\text{\'{a}rea}),
\end{equation}
com coeficinte de determinação de R$^2 = 0.768$. Pelas estimativas dos parâmetros tem-se
que o valor do imóvel aumenta significativamente com a área ($p$-valor < 0.01). No entanto,
tais conclusões só são validas mediante o atendimento dos pressupostos do modelo considerado.
Os pressupostos são: 1) que o modelo considerado representa a relação entre as variáveis,
2) que os desvios têm variabilidade constante ao redor dos valores dados pelo modelo ajustado,
3) que os desvios têm distribuição normal e que 4) as observações são indepentes. O requisito
4) é justificado pelo processo aleatório de aquisição dos dados. Para os demais, análise gráfica
dos resíduos fornecem uma boa idéia sobre o atendimento dos pressupostos.

Pela figura \ref{fig:residuos} observa-se não haver fuga do pressuposto 1) 
pois os resíduos se distribuem ao redor da linha
horizontal do zero. Para o pressuposto 2) também não se verifica afastamento de pressuposto
uma vez que os resíduos ocupam uma faixa de mesma altura ao longo do eixo dos valores preditos,
indicando haver nenhuma ou muito fraca relação da variabilidade com a o
valor ajustado pelo modelo. O pressuposto de normalidade, 3), também é atendido pois os pontos
formam uma linha diagonal.
Portanto, o modelo ajustado, uma vez que os pressupostos
foram atendidos, pode ser considerado para inferência e previsão de preços.

A figura \ref{fig:preditos} tem-se os valores observados e os ajustados dados pelo modelo.
As bandas ao redor dos valores preditos delimitam o intervalo de confiança (95\%)
para cada valor predito. Os valores sobre a linha são portanto os preços esperados
para os apartamentos considerando sua área. Na tabela \ref{tab:pred}
estão os valores preditos para apartamentos de cinco tamanhos.

\begin{small}
% latex table generated in R 3.0.1 by xtable 1.7-1 package
% Thu Jul 18 18:09:29 2013
\begin{table}[ht]
\centering
\caption{Preço predito do ímovel em função da sua área. LI e LS são o limite inferior e superior do intervalo de confiança (95\%) para o valor predito.} 
\label{tab:pred}
\begin{tabular}{ccccc}
  \hline
Área (m$^2$) & $\log_{10}$ Área & Preço (mil R\$) & LI & LS \\ 
  \hline
50 & 1.70 & 272.75 & 236.99 & 313.90 \\ 
  75 & 1.88 & 398.98 & 364.81 & 436.35 \\ 
  100 & 2.00 & 522.58 & 485.48 & 562.52 \\ 
  150 & 2.18 & 764.43 & 692.22 & 844.18 \\ 
  200 & 2.30 & 1001.25 & 873.23 & 1148.04 \\ 
   \hline
\end{tabular}
\end{table}\end{small}

\section{Considerações finais}

Diante das várias características que regulam o preço do imóvel estabeleceu-se um modelo baseado
apenas na área do mesmo. O modelo de regressão linear simples, considerando o logarítimo
do preço do ímovel como função do logarítmo da área (ambos em base 10), ajustado atendeu os
pressupostos e apresentou um coeficiente de determinação de 0.768.
Com o modelo foi possível estimar o preço de apartamentos a partir da área localizados no
bairro Água Verde em Curitiba.

\setkeys{Gin}{width=0.9\textwidth}
\begin{figure}[p]
\begin{center}
\includegraphics{ce083-2013-01-aula24-008}
\end{center}
\caption{Gráficos de análise dos resíduos.
Resíduos em função dos valores ajustados (esquerda).
Raíz quadrada dos resíduos padronizados em função dos valores ajustados (centro).
Quantis observados em função dos quantis teórios da distribuição normal (direita).}\label{fig:residuos}
\end{figure}

\setkeys{Gin}{width=0.7\textwidth}
\begin{figure}[p]
\begin{center}
\includegraphics{ce083-2013-01-aula24-009}
\end{center}
\caption{Valores observados (pontos) e ajustados (linha) para preço em função da área do imóvel na escala
logartímica e na escala natual.}\label{fig:preditos}
\end{figure}


\newpage
\section{Anexos}

\begin{table}[h]
\caption{Variáveis para uma amostra aleatória de 40 apartamento no bairro Água Verde.}\label{tab:dados}
\begin{center}
\resizebox{!}{8cm}{
% latex table generated in R 3.0.1 by xtable 1.7-1 package
% Thu Jul 18 18:09:29 2013
\begin{tabular}{cccccc}
  \hline
Preço (R\$) & Área (m$^2$) & Quartos & Banheiros & Vagas & Suites \\ 
  \hline
280.00 & 70.0 & 2 & 2 & 1 & 1 \\ 
  299.00 & 75.0 & 2 & 1 & 1 & 1 \\ 
  300.00 & 66.0 & 3 & 1 & 2 & 1 \\ 
  310.00 & 75.0 & 2 & 2 & 1 & 1 \\ 
  324.00 & 64.0 & 3 & 2 & 1 & 1 \\ 
  330.00 & 70.0 & 1 & 1 & 1 & 1 \\ 
  340.00 & 80.0 & 3 & 1 & 1 & 1 \\ 
  344.04 & 69.0 & 3 & 2 & 1 & 1 \\ 
  360.00 & 72.0 & 3 & 1 & 1 & 1 \\ 
  370.00 & 61.0 & 2 & 2 & 1 & 1 \\ 
  380.00 & 70.0 & 3 & 2 & 2 & 1 \\ 
  398.00 & 96.9 & 3 & 3 & 1 & 1 \\ 
  415.00 & 97.0 & 3 & 3 & 1 & 1 \\ 
  415.80 & 75.0 & 2 & 2 & 1 & 1 \\ 
  440.00 & 75.0 & 2 & 2 & 2 & 1 \\ 
  450.00 & 84.0 & 3 & 3 & 2 & 1 \\ 
  460.00 & 75.0 & 2 & 2 & 2 & 1 \\ 
  474.40 & 77.0 & 2 & 1 & 2 & 1 \\ 
  480.00 & 75.0 & 2 & 2 & 1 & 1 \\ 
  488.00 & 83.0 & 3 & 2 & 3 & 1 \\ 
  495.00 & 88.0 & 3 & 3 & 2 & 1 \\ 
  496.00 & 75.0 & 2 & 2 & 2 & 1 \\ 
  500.00 & 86.0 & 3 & 3 & 1 & 1 \\ 
  522.78 & 100.0 & 3 & 3 & 2 & 1 \\ 
  532.00 & 89.0 & 3 & 2 & 2 & 1 \\ 
  545.00 & 95.0 & 3 & 2 & 1 & 1 \\ 
  590.00 & 94.0 & 3 & 2 & 2 & 1 \\ 
  598.00 & 91.0 & 3 & 2 & 2 & 1 \\ 
  599.00 & 247.0 & 3 & 3 & 1 & 1 \\ 
  650.00 & 107.0 & 3 & 2 & 2 & 1 \\ 
  650.00 & 150.0 & 3 & 1 & 2 & 1 \\ 
  691.60 & 119.0 & 3 & 1 & 2 & 1 \\ 
  695.00 & 185.0 & 4 & 6 & 2 & 2 \\ 
  781.00 & 184.0 & 4 & 3 & 3 & 1 \\ 
  799.00 & 129.0 & 3 & 4 & 2 & 3 \\ 
  950.00 & 235.0 & 3 & 4 & 2 & 2 \\ 
  1230.00 & 181.0 & 4 & 4 & 3 & 1 \\ 
  1250.00 & 264.0 & 4 & 5 & 2 & 1 \\ 
  1353.99 & 181.0 & 4 & 1 & 3 & 2 \\ 
  2563.51 & 308.0 & 4 & 1 & 4 & 3 \\ 
   \hline
\end{tabular}}
\end{center}
\end{table}

\end{document}
