Del curso: Linguagem de Programação R para Ciência de Dados: Formação Básica
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 25.000 cursos impartidos por expertos del sector.
Tratando dados faltantes e imputação de dados (missing)
Del curso: Linguagem de Programação R para Ciência de Dados: Formação Básica
Tratando dados faltantes e imputação de dados (missing)
Em relação aos dados faltantes, temos como objetivo primário entender qual o mecanismo que causou a ausência dos dados. Temos, por exemplo, ausências causadas por deficiência estrutural, causas específicas ou ocorrências aleatórias. A depender do mecanismo que resultou na falta de dados, iremos endereçar esses valores faltantes, deletando a coluna, imputando valores, criando uma nova categoria ou mesmo fazendo técnicas baseadas em modelo. De maneira geral, quando o mecanismo de falta se dá por uma deficiência estrutural, é suficiente criar uma nova categoria. Já quando estamos falando de causas específicas, tendemos a ter um NA que está mais concentrado em alguma parte da população e, neste caso, técnicas baseadas em modelos tendem a funcionar melhor. Quando o valor dos dados ausentes é aleatório, é possível trabalhar com imputações simples de valores. Aqui, para endereçar tecnicamente cada uma dessas soluções, teremos a ajuda de pacotes como o tidyr ou o naniar. A representação de…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
-
-
-
-
-
Pré-processamento (dataprep), o que é?1 min 51 s
-
(Bloqueado)
Pré processamento de dados no R2 min 55 s
-
(Bloqueado)
Tratando dados faltantes e imputação de dados (missing)4 min 19 s
-
(Bloqueado)
Feature engineering, o que é?3 min 2 s
-
(Bloqueado)
Feature engineering no R, trabalhando com datas, textos e fatores4 min 10 s
-
(Bloqueado)
Considerações finais37 s
-
-
-
-