Banco de dados. Modelo entidade-relacionamento. Mapeamento lógico relacional. Normalização. (Parte 1)
Banco de dados. Modelo entidade-relacionamento. Mapeamento lógico relacional. Normalização. (Parte 2)
Linguagem de definição e manipulação de dados (SQL).
Conceitos de data warehousing.
Modelagem multidimensional (esquema estrela).
Big Data; Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark. (Parte 1)
Big Data; Conceitos gerais de Hadoop: HDFS, MapReduce, YARN e Spark. (Parte 2)
Conceitos de Bancos NoSQL
Armazenamento orientado a objeto (object store).
Aprendizado supervisionado: Regressão e Classificação. Métricas de avaliação. Overfitting e underfitting de modelos. Regularização. Seleção de modelos: Erro de Generalização. Validação Cruzada. Conjuntos de Treino, Validação e Teste. Trade off entre Variância e Viés. Algoritmos: Regressão Linear e Regressão Logística. Árvores de decisão e random forests. Máquina de e de vetores. Naive Bayes. K-NN. Ensembles. Conceitos de otimização de hiperparâmetros. (Parte 1)
Aprendizado supervisionado: Regressão e Classificação. Métricas de avaliação. Overfitting e underfitting de modelos. Regularização. Seleção de modelos: Erro de Generalização. Validação Cruzada. Conjuntos de Treino, Validação e Teste. Trade off entre Variância e Viés. Algoritmos: Regressão Linear e Regressão Logística. Árvores de decisão e random forests. Máquina de e de vetores. Naive Bayes. K-NN. Ensembles. Conceitos de otimização de hiperparâmetros. (Parte 1)
Aprendizado não supervisionado. Redução de dimensionalidade: PCA. Agrupamento K-Means. Mistura de Gaussianas. Agrupamento Hierárquico. Regras de associação. (Parte 1)
Aprendizado não supervisionado. Redução de dimensionalidade: PCA. Agrupamento K-Means. Mistura de Gaussianas. Agrupamento Hierárquico. Regras de associação. (Parte 2)
Redes neurais artificiais. Conceitos Básicos em Redes Neurais Artificiais: Definições e Arquitetura. Funções de Ativação. Otimização de Redes Neurais Artificiais: método do gradiente, método do gradiente estocástico, algoritmo backpropagation, métodos de inicialização dos pesos, Vanishing Gradients. Métodos de regularização: penalização com normas L1 e L2, Dropout e Early Stopping. Definições básicas de Redes Neurais Convolucionais. Definições básicas de Redes Neurais Recorrentes.
Machine learning aplicado. Noções de Visão computacional com redes neurais convolucionais. Classificação de imagens. Detecção de objetos. Segmentação de objetos e instâncias. Noções de Processamento Natural de Linguagem. Stop-words, stemização e n-grams. TF-IDF. Modelagem de tópicos (LDA, NMF). Word embeddings: CBOW e Skip Gram.
Conceitos Básicos em Séries Temporais.
Manipulação, tratamento e visualização de dados. Técnicas de visualização de dados (questão 1/2). Técnicas de visualização de dados (questão 2/2). Lidando com valores faltantes. Lidando com dados categóricos. Normalização numérica. Detecção e tratamento de outliers. Diagrama boxplot. Avaliação de outliers.
Lógica de Programação [não explícito no edital]
Algoritmos e estrutura de dados. Complexidade de algoritmos e notação assintótica (Big O). (Parte 1)
Algoritmos e estrutura de dados. Complexidade de algoritmos e notação assintótica (Big O). (Parte 2)
Python (Conceitos Básicos)
Aprendizado supervisionado com Python scikit-learn. Aprendizado não supervisionado com Python scikit-learn. Redes neurais com Python: treino de modelos com Keras e Pytorch. Manipulação de dataframes com Python Pandas: leitura de dados tabulares, seleção de linhas e colunas, agregação de dados, preenchimento de valores faltantes, remoção de duplicados, junção de dataframes.
Conceitos modernos de sistemas de informação. Conceitos Nuvem: IaaS, PaaS e SaaS.
Versionamento com git, pipeline e CI/CD.
Conceitos básicos de DevOps
Conceitos de Containers: construção, registro, execução e orquestração.