Roteiro de Aula: Abrindo um Restaurante no Central Park
Qual tipo de culinária tem a melhor média de avaliação na região do Central Park?
Etapa 1: Preparação do Ambiente
Pergunta:
Quais bibliotecas precisamos importar para trabalhar com análise de dados e arquivos no Google Colab?
Resposta comentada:
Python
Copiar
Legenda
import pandas as pd
import numpy as np
import os
from google.colab import drive
pandas
: manipulação de tabelasnumpy
: operações numéricasos
: interação com o sistema de arquivosdrive
: acesso ao Google Drive
Etapa 2: Montar o Drive e Carregar os Dados
Pergunta:
Como montamos o Google Drive e carregamos o arquivo
Cuisine_rating.csv
?
Resposta comentada:
Python
Copiar
Legenda
drive.mount('/content/drive')
endereco_pasta = '/content/drive/My Drive/Colab Notebooks'
os.listdir(endereco_pasta)
tabela_cozinha = pd.read_csv(f'{endereco_pasta}/Cuisine_rating.csv')
Montamos o drive e listamos os arquivos para garantir que o arquivo está lá.
Carregamos o CSV com
pd.read_csv
.
Etapa 3: Exploração Inicial dos Dados
Pergunta:
Como podemos entender a estrutura da tabela e visualizar os dados?
Resposta comentada:
Python
Copiar
Legenda
tabela_cozinha.info()
tabela_cozinha.head()
tabela_cozinha.sample()
info()
: mostra colunas, tipos e nulos.head()
: primeiras linhas.sample()
: amostra aleatória.
Etapa 4: Tratamento de Dados Faltantes
Pergunta:
A coluna
Marital Status
tem valores nulos. Como podemos tratá-los?
Resposta comentada:
Python
Copiar
Legenda
# Preencher com a média
tabela_cozinha['Marital Status'].fillna(tabela_cozinha['Marital Status'].mean(), inplace=True)
# Ou remover as linhas
tabela_cozinha.dropna(subset=['Marital Status'], inplace=True)
Preencher evita perda de dados.
Remover pode ser útil se os nulos forem poucos.
Etapa 5: Foco na Região Central Park
Pergunta:
Como filtramos apenas os dados da região Central Park?
Resposta comentada:
Python
Copiar
Legenda
central_park = tabela_cozinha[tabela_cozinha['Region'] == 'Central Park']
Filtramos com uma condição lógica.
Etapa 6: Agrupamento por Tipo de Culinária
Pergunta:
Como descobrimos qual culinária tem a melhor média de avaliação no Central Park?
Resposta comentada:
Python
Copiar
Legenda
media_avaliacoes = central_park.groupby('Cuisines')['Overall Rating'].mean().sort_values(ascending=False)
media_avaliacoes.head()
groupby
: agrupa por tipo de culinária.mean()
: calcula a média.sort_values
: ordena da melhor para a pior.
Etapa 7: Interpretação dos Resultados
Pergunta:
Qual é a culinária mais bem avaliada? Há outras que também se destacam?
Resposta comentada:
A primeira linha de
media_avaliacoes
mostra a culinária com maior média.Podemos observar as 3 primeiras para ver se há empate ou concorrência próxima.
Etapa 8: Discussão Final
Pergunta:
Você recomendaria abrir um restaurante dessa culinária? Que outros fatores deveriam ser considerados?
Resposta comentada:
A decisão pode considerar também:
Popularidade (frequência de cada culinária)
Preço médio
Concorrência
Tendências culturais
Desafio Extra (Opcional)
Qual é a culinária mais popular no Central Park?
Python
Copiar
Legenda
central_park['Cuisines'].value_counts().head()
Comentários
Postar um comentário