Roadmap Data Science
### Semanas 1-4: Fundamentos de Programação
**Semana 1**
- **Dia 1-2**: Introdução a Python (variáveis, tipos de
dados, operadores)
- **Dia 3-4**: Estruturas de controle (condicionais)
- **Dia 5-6**: Estruturas de controle (loops)
**Semana 2**
- **Dia 1-2**: Listas e tuplas
- **Dia 3-4**: Dicionários e conjuntos
- **Dia 5-6**: Funções e módulos
**Semana 3**
- **Dia 1-2**: Manipulação de strings
- **Dia 3-4**: Manipulação de arquivos
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 4**
- **Dia 1-2**: Compreensão de listas e expressões
lambda
- **Dia 3-4**: Introdução à programação orientada a
objetos
- **Dia 5-6**: Revisão e exercícios práticos
### Semanas 5-8: Estatística e Probabilidade
**Semana 5**
- **Dia 1-2**: Estatísticas descritivas (média,
mediana, moda)
- **Dia 3-4**: Variância e desvio padrão
- **Dia 5-6**: Distribuições de probabilidade (normal,
binomial)
**Semana 6**
- **Dia 1-2**: Distribuição de Poisson
- **Dia 3-4**: Probabilidade (regra da adição e
multiplicação)
- **Dia 5-6**: Teorema de Bayes
**Semana 7**
- **Dia 1-2**: Inferência estatística (intervalos de
confiança)
- **Dia 3-4**: Testes de hipótese
- **Dia 5-6**: Regressão linear simples
**Semana 8**
- **Dia 1-2**: Análise de correlação
- **Dia 3-4**: Testes estatísticos (t-test, ANOVA)
- **Dia 5-6**: Introdução ao p-valor
### Semanas 9-12: Álgebra Linear e Cálculo
**Semana 9**
- **Dia 1-2**: Vetores e operações vetoriais
- **Dia 3-4**: Matrizes e operações matriciais
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 10**
- **Dia 1-2**: Determinantes de matrizes
- **Dia 3-4**: Inversas de matrizes
- **Dia 5-6**: Sistemas de equações lineares
**Semana 11**
- **Dia 1-2**: Derivadas básicas
- **Dia 3-4**: Integrais básicas
- **Dia 5-6**: Aplicações de derivadas em otimização
**Semana 12**
- **Dia 1-2**: Gradiente e gradiente descendente
- **Dia 3-4**: Funções de várias variáveis
- **Dia 5-6**: Derivadas parciais
### Semanas 13-16: Introdução à Análise de Dados
**Semana 13**
- **Dia 1-2**: Introdução ao NumPy
- **Dia 3-4**: Operações básicas com arrays
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 14**
- **Dia 1-2**: Introdução ao pandas
- **Dia 3-4**: Manipulação de DataFrames
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 15**
- **Dia 1-2**: Limpeza de dados
- **Dia 3-4**: Tratamento de dados faltantes
- **Dia 5-6**: Tratamento de inconsistências
**Semana 16**
- **Dia 1-2**: Visualização de dados com Matplotlib
- **Dia 3-4**: Visualização de dados com Seaborn
- **Dia 5-6**: Gráficos básicos e personalizados
### Semanas 17-20: Machine Learning
**Semana 17**
- **Dia 1-2**: Introdução ao machine learning
- **Dia 3-4**: Aprendizado supervisionado vs. não
supervisionado
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 18**
- **Dia 1-2**: Regressão linear múltipla
- **Dia 3-4**: Regressão logística
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 19**
- **Dia 1-2**: Árvores de decisão
- **Dia 3-4**: Florestas aleatórias
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 20**
- **Dia 1-2**: K-vizinhos mais próximos (KNN)
- **Dia 3-4**: K-means clustering
- **Dia 5-6**: Revisão e exercícios práticos
### Semanas 21-24: Projeto 1
**Semana 21-24**
- **Dia 1-6**: Escolha um conjunto de dados, faça a
limpeza, análise exploratória e visualização dos
dados.
- **Dia 7-12**: Aplique algoritmos de machine
learning.
- **Dia 13-18**: Documente o processo e resultados.
### Semanas 25-28: Deep Learning
**Semana 25**
- **Dia 1-2**: Introdução ao deep learning
- **Dia 3-4**: Redes neurais artificiais
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 26**
- **Dia 1-2**: Construção de redes neurais com
Keras e TensorFlow
- **Dia 3-4**: Funções de ativação e
backpropagation
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 27**
- **Dia 1-2**: Convolução e redes neurais
convolucionais (CNNs)
- **Dia 3-4**: Aplicações de CNNs
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 28**
- **Dia 1-2**: Redes neurais recorrentes (RNNs)
- **Dia 3-4**: Aplicações de RNNs
- **Dia 5-6**: Revisão e exercícios práticos
### Semanas 29-32: NLP (Processamento de
Linguagem Natural)
**Semana 29**
- **Dia 1-2**: Fundamentos de NLP
- **Dia 3-4**: Pré-processamento de texto
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 30**
- **Dia 1-2**: Modelos de linguagem
- **Dia 3-4**: Vetorização de texto (TF-IDF,
Word2Vec)
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 31**
- **Dia 1-2**: Modelos de classificação de texto
- **Dia 3-4**: Análise de sentimento
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 32**
- **Dia 1-2**: Tarefas avançadas em NLP
- **Dia 3-4**: Introdução a transformers e BERT
- **Dia 5-6**: Revisão e exercícios práticos
### Semanas 33-36: Projeto 2
**Semana 33-36**
- **Dia 1-6**: Escolha um conjunto de dados, faça a
limpeza, análise exploratória e visualização dos
dados.
- **Dia 7-12**: Aplique algoritmos de machine
learning e/ou deep learning.
- **Dia 13-18**: Documente o processo e resultados.
### Semanas 37-40: Big Data e Ferramentas
**Semana 37**
- **Dia 1-2**: Introdução ao Big Data
- **Dia 3-4**: Fundamentos de Hadoop e
MapReduce
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 38**
- **Dia 1-2**: Introdução ao Spark
- **Dia 3-4**: Processamento de dados com PySpark
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 39**
- **Dia 1-2**: Bancos de dados NoSQL (MongoDB,
Cassandra)
- **Dia 3-4**: Integração de dados com Spark e
Hadoop
- **Dia 5-6**: Revisão e exercícios práticos
**Semana 40**
- **Dia 1-2**: Ferramentas de visualização de dados
(Tableau, Power BI)
- **Dia 3
-4**: Criação de dashboards
- **Dia 5-6**: Revisão e exercícios práticos
### Semanas 41-44: Projeto 3
**Semana 41-44**
- **Dia 1-6**: Escolha um conjunto de dados
relevante, faça a limpeza, análise exploratória e
visualização dos dados.
- **Dia 7-12**: Aplique técnicas de machine learning,
deep learning e big data.
- **Dia 13-18**: Crie um dashboard interativo para
apresentar os resultados e documente todo o
processo.
### Semanas 45-52: Especialização e Projetos
Avançados
**Semana 45-48**
- **Dia 1-6**: Escolha uma área de especialização,
estude materiais e faça cursos online sobre a área
escolhida.
**Semana 49-52**
- **Dia 1-6**: Trabalhe em projetos avançados na
área escolhida.
- **Dia 7-12**: Participe de competições de ciência
de dados (ex.: Kaggle).
- **Dia 13-18**: Construa um portfólio de projetos.