Del curso: Linguagem de Programação R para Ciência de Dados: Formação Básica
EDA – Exploratory Data Analysis, bibliotecas de investigação
Del curso: Linguagem de Programação R para Ciência de Dados: Formação Básica
EDA – Exploratory Data Analysis, bibliotecas de investigação
Agora que entendemos melhor sobre tipos de dados e como representá-los por meio de classes no "R", podemos avançar, certo? Bem, sim, mas eu gostaria de propor uma rota um pouco diferente. A proposta é irmos direto para o bloco de exploração, entender um pouco mais sobre o que é possível ser feito aqui, para então seguirmos o ciclo da ciência de dados proposto, tendo mais claro aonde queremos chegar. Que tal? Assim, iniciaremos discutindo Análise Exploratória de Dados ou EDA, do inglês, Exploratory Data Analysis. Indo para os códigos, trabalharemos com um recurso que eu gosto bastante do "R", que são os Foldings. Vamos trabalhar com os capítulos agrupados para facilitar a descrição. Vamos iniciar carregando a biblioteca Tidyverse. Como sempre, aqui na introdução, eu comento um pouco sobre o que veremos neste capítulo. E agora sim, ao que interessa: o que é a EDA? Basicamente é o processo de explorar dados, algo que inclui desde examinar a estrutura do DataSet, ou seja, dos dados, algo que já vínhamos fazendo nos vídeos anteriores, até um entendimento mais profundo sobre o comportamento das variáveis, e será este o foco deste material. Na prática, EDA contempla desde a etapa descritiva até a etapa diagnóstica. É aqui que aprendemos e damos sentido aos dados. E para guiar a discussão, utilizaremos uma base de dados do Super Bowl americano. Nesta base, temos informações sobre os comerciais que foram vinculados ao longo dos últimos anos do evento, considerando dez grandes marcas. Para mais informações sobre essa base, você pode ar estes links aqui. Você pode importar a base diretamente da internet ou fazer a leitura do CSV que eu deixei salvo na pasta Dados. E aqui está a nossa base. Tratam-se de 247 linhas com 25 colunas. Para aproveitar melhor o espaço em tela, vou usar o atalho CTRL+SHIFT+1 para dar foco no Source. Podemos fazer isto via Point and Click.
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
-
-
EDA – Exploratory Data Analysis, bibliotecas de investigação2 min 18 s
-
(Bloqueado)
EDA – pacote janitor3 min 55 s
-
(Bloqueado)
EDA – pacote inspectdf5 min 12 s
-
(Bloqueado)
EDA – pacote skimr1 min 5 s
-
(Bloqueado)
Sumarizações estatísticas2 min 19 s
-
(Bloqueado)
Medidas de Resumo6 min 38 s
-
(Bloqueado)
Distribuição Empírica3 min 28 s
-
(Bloqueado)
Medidas de Associação2 min 55 s
-
(Bloqueado)
Considerações finais sobre EDA3 min 19 s
-
-
-
-
-
-
-