Uma Análise Exploratória de Toronto, Ontário — Canadá

Atualizado: 17 de mar.

Este artigo tem o objetivo de apresentar uma análise exploratória da cidade de Toronto - Canadá, usando dados do Airbnb.


Um pouco sobre o Airbnb

O Airbnb já é considerado como a maior empresa hoteleira da atualidade. Ah, o detalhe é que ele não possui nenhum hotel!

Conectando pessoas que querem viajar (e se hospedar) com anfitriões que querem alugar seus imóveis de maneira prática, o Airbnb fornece uma plataforma inovadora para tornar essa hospedagem alternativa.

No final de 2018, a Startup fundada 10 anos atrás, já havia hospedado mais de 300 milhões de pessoas ao redor de todo o mundo, desafiando as redes hoteleiras tradicionais.

Toronto, Canadá

Toronto é a maior cidade e maior centro financeiro do Canadá, além de ser a capital da província canadense de Ontário. Com uma população estimada de 2.731.571 de habitantes em 2016, é a quarta cidade mais populosa da América do Norte depois da Cidade do México, Nova York e Los Angeles.

Além de ser uma cidade global, Toronto é um centro internacional de negócios, finanças, arte, cultura, qualidade de vida e segurança. Em 2017, Toronto foi considerada pelo Economist a quarta melhor cidade do mundo para se viver e uma das cidades mais seguras do Canadá e do continente americano.

 

Como mencionado acima, o objetivo deste artigo é explorar os dados e extrair insights para tomada de decisão para quem deseja se hospedar nessa cidade utilizando o Airbnb. Aqui é possível verificar os bairros mais populares, regiões com maiores e menores preços além da limpeza e obtenção dos dados.

Obs: O notebook deste projeto estará disponível no final deste artigo.

Obtenção dos Dados

Os dados foram obtidos do site InsideAirbnb. Para essa análise foi usado o seguinte arquivo: Listing Summary information and metrics for listings in Toronto (good for visualisations). Apenas lembrando que este arquivo é “Summary”, uma versão resumida dos dados.

Analisando os Dados

As bibliotecas usadas foram as seguintes:


Por se tratar de uma base com várias variáveis, o Airbnb disponibiliza um dicionário dessas variáveis, o que facilita muito o entendimento antes da análise.




Para iniciar nossa análise, vamos começar identificando a quantidade de entradas e variáveis que esse conjunto de dados possui. Lembrando que o conjunto que estamos usando é a versão resumida do Airbnb.


O conjunto de dados usado possui 15.155 registros e 18 variáveis, desde preço e bairros até comentários e data do último review. O tipo de dado é algo muito importante a ser observado também, pois dependendo da variável usada para análise será necessário algum tratamento específico.


Valores Nulos

Identificar os valores nulos dos campos que possuímos é uma parte importante na análise exploratória. Aqui conseguimos avaliar se a base é consistente ou não. Abaixo está o percentual de valores nulos em cada coluna. Podemos identificar que a coluna neighbourhood_group não possui valor nenhum, está 100% zerada. Em sequência as colunas license, reviews_per month e last_review.



Outra parte importante da análise é visualizar a distribuição dos valores de cada métrica. Conseguimos identificar alguns outliers em métricas importantes como price e minimum_nights.



Removendo Outliers

Para não enviesar a nossa análise, é necessário remover os outliers (Valores que fogem do padrão) da variável price. Na tabela abaixo podemos ver que a coluna ‘price’ possui uma média de 154,90 e um valor máximo de 13.000, mínimo de 0 e75% está entre 165,00. Com isso iremos remover os registros acima de 500.





Após a remoção dos valores:


Após a remoção dos outliers, conseguimos extrair a média dos preços com mais precisão. O valor médio dos aluguéis da cidade de Toronto é de $ 125,33.



Qual o tipo de imóvel mais alugado no Airbnb?

O tipo de imóvel mais alugado na cidade de Toronto são as casas e apartamentos (Entire home/apt) que correspondem a 65% dos imóveis alugados, seguido dos quartos individuais (Private room), que representam 33%, e quartos compartilhados (shared room) representando 1,28%.



Bairros com Valores Mais Altos

Um dos bairros mais caros da cidade de Toronto é o Bridle Path-Sunnybrook-York Mills. Um bairro nobre da cidade, repleto de mansões e parques com acesso a rodovias principais e centros comerciais.

Ranking:

1º Bridle Path-Sunnybrook-York Mills

2º Lawrence Park South

3º Leaside-Bennington



Distribuição dos Imóveis por Bairro

Conclusão

Usando esta versão resumida do dataset do Airbnb, foi possível extrair alguns insights. Identificamos dados ausentes e outliers que foram tratados para extrair insights mais precisos.

  • Há presença de imóveis por toda a cidade com uma distribuição bem homogênea na média de preços.

  • A variável ‘price’ apresenta outliers na máxima dos preços.

  • A presença desses outliers influencia a média de estadia por localidade.

  • A média de estadia por noites é: 20 noites.

  • Os bairros mais caros são Bridle Path-Sunnybrook-York Mills, Lawrence Park South e Leaside-Bennington.

  • Os imóveis mais alugados são Entire home/apt, Private room e shared room.

Link para o código do projeto: gabrielreversi/AnalisesExploratorias (github.com)

Gostou desse conteúdo? Curta, comente e compartilhe. 💜