Universidade Federal do Paraná
Curso de Estatística
CE 083 - Estatística Computacional I
Prof. Dr. Walmes Marques Zeviani
Cada dupla ou trio deve escolher dois modelos de carros para comparar (ex: Fiat Palio vs Volkswagen Gol, Renault Clio vs Fiat Uno); Os carros a serem comparados devem ser de mesma categoria e faixa de preço mas de montadoras diferentes.
O contexto do trabalho é orientar clientes a escolher entre os modelos de interesse via uma análise exploratória de dados baseada nos dados disponíveis de satisfação dos clientes no site carrosnaweb.com.br/opiniao. Os modelos e montadoras considerados estão discriminados abaixo.
As tabelas sobre a nota, dada pelos donos desses modelos com relação à uma série de características serão extraídos do site carros na web e disponibilizados via arquivos de texto (txt e csv). São 15 as características avaliadas: estilo, acabamento, posição de dirigir, instrumentos, interior, porta-malas, desempenho, motor, câmbio, freios, suspensão, consumo, estabilidade, custo-benefício, recomendação. A nota atribuída é um número inteiro de 0 à 10 inclusive.
Sobre tais dados são forncecidos 4 arquivos:
aval_carros_nota.txt: Nota dos donos para seu carro com relação às 10 características. Os dados estão no formato longo e separados por tabulação em utf-8. Esse arquivo tem 124980 linhas de registro.
carro dono item nota
gol 1 Estilo 8
gol 1 Acabamento 7
gol 1 Posição de dirigir 9
...
aval_carros_fwf.txt: tem o mesmo conteúdo do aquivo anterior porém está no formato longo e organizado como dados de comprimento de campo fixo (fwf). Esse arquivo tem 8332 linhas de registro.
agile001060310080502101008100910100709
agile010070709070708090609090708090807
...
clio098090709101009090909101009091009
clio099070506070706070607070707080707
...
crossfox001040907091007090809090903080909
crossfox010021002040700050007030803100002
...
aval_carros_dic.txt: é o “dicionário” para ler o arquivo de campos de comprimento fixo pois os números espeficicam os nomes e comprimentos de cada campo. Esse arquivo tem 17 linhas de registro.
carro 8
dono 3
Acabamento 2
Câmbio 2
Consumo 2
...
aval_carros_info.csv: contém as informações referentes ao dono (nome, origem) e condições/histórico do carro. Estão separados por ponto e vírgula e cada linha é o resgistro de um dono. Esse arquivo tem 8332 linhas de registro.
carro;dono;especificação;origem;histórico
gol;1;Volkswagen Gol G5 1.6 2009/2010;Eduardo - Pelotas RS;Dono há 2 anos - 64.115 kmCarro anterior: Volkswagen Parati
gol;2;Volkswagen Gol G5 1.0 2010/2011;Marcelo - Juiz de Fora MG;Dono há 2 anos - 57.000 kmCarro anterior: Ford Escort
gol;3;Volkswagen Gol G5 Power 1.6 2011/2012;Hudson - Belo Horizonte MG;Dono há 2 anos - 31.000 kmCarro anterior: Volkswagen Gol
...
Os dados devem ser lidos e uma análise exploratória com emprego de gráficos e tabelas deve ser feita no sentido de indenficar diferenças entre os dois modelos e indicar qual deles é uma melhor aquisição. Essa análise deve ser baseada em no mínimo 4 das 15 características votadas pelos donos.
A análise a análise ainda pode considerar informações sobre o dono para poder estratificar ou poderar a comparação como, por exemplo, ao considerar ano/modelo do veículo, o período de tempo em que foi dono do carro, o carro anterior e a distância percorrida.
O relatório deve ser entregue em formato pdf. Pode ser feito em aplicativos de edição de documentos de texto como LibreOffice Writer, MS Word, Latex e equivalentes. O trabalho deve seguir formato de artigo conforme o exemplo disponível em writelatex e sharelatex. Usuários de Latex podem considerar o template disponibilizado nos links. Usuários de MS Word ou LibreOffice Writer devem formatar seu documento de forma a se assemelhar aos modelos fornecidos.
Deve-se estar atento aos seguintes itens:
Os grupos e pares de carros a serem comparados estão na tabela dentro da sessão Avaliações dentro da página da disciplina.
Um zip contendo os arquivos de extensão *.pdf
(relatório), *.R
(script R usado para ler os dados, gerar os gráficos e tabelas), deve
ser hospedado em algum site de hospedagem de arquivos. O link para
download deve ser informado na página da disciplina no campo de
discussões. Sugere-se usar o
datafilehost.com para o qual tem-se
instruções disponíveis na
wiki leg/datafilehost.
Importante: O nome do arquivo zip deve ser o GRR de um dos
alunos. Por exemplo 20129999.zip
. O nome para o arquivo *.R
e
*.pdf
devem ser ce083-2014-01-trab01.R
e
ce083-2014-01-trab01.pdf
. O aluno deve identificar-se pelo GRR ao
fornecer o link para download do zip dentro do campo discussões na
página wiki leg da disciplina.
O prazo limite para envio dos arquivos é 07/10/2014 até às 23h59. Não serão considerados envios fora do prazo nem encaminhados por email.