Rating 3.83 out of 5 (3 ratings in Udemy)
What you'll learn- Você aprenderá as ferramentas mais importantes em R que permitirão que você aplique ciência de dados.
- Você aprenderá a instalar o IDE RStudio.
- Você terá as ferramentas para enfrentar uma ampla variedade de desafios de ciência de dados, usando as melhores partes de R.
- Você aprenderá a importar seus dados para o R.
- Você aprenderá como arrumar os dados. Arrumar seus dados significa armazená-los de forma consistente que corresponda …
Rating 3.83 out of 5 (3 ratings in Udemy)
What you'll learn- Você aprenderá as ferramentas mais importantes em R que permitirão que você aplique ciência de dados.
- Você aprenderá a instalar o IDE RStudio.
- Você terá as ferramentas para enfrentar uma ampla variedade de desafios de ciência de dados, usando as melhores partes de R.
- Você aprenderá a importar seus dados para o R.
- Você aprenderá como arrumar os dados. Arrumar seus dados significa armazená-los de forma consistente que corresponda à semântica do conjunto de dados com a maneira como eles são armazenados.
- Você aprenderá que a visualização é uma atividade fundamentalmente humana. Uma boa visualização mostrará coisas que você não esperava, ou permitirá novas perguntas sobre os dados.
- Você aprenderá modelos, eles são ferramentas complementares para visualização. Depois de fazer suas perguntas suficientemente precisas, você pode usar um modelo para respondê-las. Os modelos são uma ferramenta fundamentalmente matemática ou computacional; portanto, eles geralmente são bem dimensionados.
DescriptionA ciência de dados é uma disciplina interessante que permite transformar dados brutos em entendimento, insight e conhecimento. O objetivo do curso "Programação em R" é ajudá-lo a aprender as ferramentas mais importantes no R que permitirão que você faça ciência de dados. Após concluir este curso, você terá as ferramentas para enfrentar uma ampla variedade de desafios de ciência de dados, usando as melhores partes de R.
O que você aprenderá?
A ciência de dados é um campo enorme e não há como você dominar isso através de um único curso. O objetivo deste curso é fornecer uma base sólida nas ferramentas mais importantes.
Primeiro, você deve importar seus dados para o R. Isso normalmente significa que você pega dados armazenados em um arquivo, banco de dados ou link Web e carrega-os em um quadro de dados (data frame) em R. Se você não pode colocar seus dados em R, não pode fazer ciência de dados nele!
Depois de importar seus dados, é uma boa ideia organizá-los. Arrumar seus dados significa armazená-los de forma consistente que corresponda à semântica do conjunto de dados com a maneira como eles são armazenados. Em resumo, quando seus dados estão organizados, cada coluna é uma variável e cada linha é uma observação. Os dados organizados são importantes porque a estrutura consistente permite que você concentre sua "luta" em perguntas sobre os dados, não 'lutando" para colocá-los na forma correta para diferentes funções.
Depois de arrumar os dados, um primeiro passo comum é transformá-los. A transformação inclui restringir as observações de interesse (como todas as pessoas em uma cidade ou todos os dados do ano passado), criar novas variáveis que são funções das variáveis existentes (como calcular a velocidade a partir da distância e do tempo) e calcular um conjunto de resumo estatístico (como contagens ou médias). Juntos, arrumar e transformar são chamados de "disputas", porque colocar seus dados em uma forma natural de trabalhar costuma parecer mesmo uma 'luta'!
Depois de organizar os dados com as variáveis necessárias, existem dois mecanismos principais de geração de conhecimento: visualização e modelagem. Eles têm pontos fortes e fracos complementares, de modo que qualquer análise real será repetida muitas vezes.