Syllabus Data Scientist
Syllabus Data Scientist
Syllabus
Data Scientist
Notre histoire
Leader français de la formation en Data Science,
DataScientest offre un apprentissage d’excellence orienté emploi
pour professionnels et particuliers.
88% des
les entreprises ont d’abord fait appel à
DataScientest pour spécialiser et former
leurs équipes internes. En l’espace responsables Data
de quatre ans, plus de 30 entreprises des plus grands groupes
du CAC40 et de nombreux autres français souhaitent
champions français et étrangers leur renforcer leurs équipes
ont fait confiance pour former quelque en recrutant des Data
1500 professionnels. Scientists*.
*enquête menée auprès d’une quarantaine
d’entreprises partenaires.
1 500 99 %
taux de
alumnis complétion
+ de 30
groupes
du CAC40 formés
2 000 h 94 %
contenu taux de
spécialisé satisfaction
Charles S.
Responsable Académique
Thomas B
Responsable formation Data Scientist
Après son cursus à l’École des Mines de Paris, Thomas a vite rejoint
les rangs de DataScientest. Il maitrise évidemment la programmation
et la dataviz mais également machine et deep learning, NLP, computer
vision… En 2 ans Thomas a déjà formé plus de 100 apprenants
à la Data Science.
Raphaël K
Responsable formation Data Analyst
Paul D
Responsable formation Data Engineer
85 %
en ligne
MASTERCLASS
EXAMENS Chaque sprint s’accompagne d’une ou
plusieurs masterclass auxquelles vous
Chez DataScientest, pas de QCM
pourrez assister en présentiel ou en
automatisé, chaque copie est
visioconférence. Les objectifs et les
corrigée à la main par nos
formats pédagogiques de chaque
enseignants, avec des re-
Masterclass changent en fonction du
marques et conseils adaptés à
sprint abordé : corrections de use cases
chaque élève.
concrets, cours magistraux sur des
thématiques spéciales, concours entre
cohortes…
Projet fil-rouge
Tout au long de votre formation, et au fur et à mesure que vos
compétences se développent, vous allez mener un projet de Data
Scientist nécessitant un investissement d’environ 120 heures
au long de la formation.
Ce ne sera pas un projet de data
science standardisé et imposé :
ce sera à vous (en binôme ou trinôme)
de déterminer le sujet et de le pitcher à
nos équipes.
En Bootcamp ou en Continu
La formation de Data Scientist est disponible en deux formats
afin de correspondre au mieux à vos besoins.
Le BootCamp
Formez-vous rapidement,
en suivant un programme
intensif de 11 semaines
Durée
11 semaines
Rythme
Temps plein (35h)
La formation
continue
Adaptez la formation à
votre rythme, avec un
programme plus flexible
étalé sur 9 mois
Durée
9 mois
Rythme
De 8 à 10h par semaine
Les horaires restent à titre indicatif, la formation ayant une durée totale de 400h.
Bloc 1
Programmation
Bloc 2
Dataviz
Bloc 3
Machine
Learning
Bloc 4
Machine
Learning Avancé
Bloc 5
Big Data /
Database
Bloc 6
Deep Learning
Bloc 7
Système complexe
et IA
DIPLÔME
Introduction à Python
Durée : 35h
2
1 DATA
FONDAMENTAUX
Chargement et première
DE PYTHON exploration d’un jeu
Variables et types de données
Opérateurs et tests Data cleaning
Les boucles Data processing
Les fonctions
Classes et modules
LES COMPÉTENCES
3 ACQUISES À L’ISSUE
NUMPY - Lire et comprendre un
code Python, langage de
Création d’un NumPy array
DIPLÔME référence en data science
Manipulation d’un NumPy
array - Manipuler et gérer les
Opérations sur les NumPy tableaux de données
array - Interroger, manipuler,
ordonner et modifier un jeu
de données avec Python
Data Visualisation
Durée : 25h
1 LES COMPÉTENCES
MATPLOTLIB ACQUISES À L’ISSUE
Courbes, graphiques,
nuages de points, - Maîtrise, customisation d’une
histogrammes... grande variété de rendus
graphiques (nuage de points,
graphes, camemberts,
histogrammes etc.…) fondamentaux
pour la Data Visualisation
2
- Capacité à mettre la Data
SEABORN Visualisation au service de la Data
Analyse de distribution analysis
Analyse statistique - Production de graphiques
Analyse multivariée statistiques simples au croisement
de la Data Visualisation et Data
Analysis
Machine Learning
Durée : 75h
LES COMPÉTENCES
MACHINE LEARNING
ACQUISES À L’ISSUE
SUPERVISÉ
Pré-traiter les données afin qu’elles
1 CLASSIFICATION conviennent aux modèles utilisés
SIMPLE DE MODÈLES Évaluer un modèle à l’aide de la
validation croisée et de différentes
métriques
1
SÉRIES TEMPORELLES LES COMPÉTENCES
AVEC STATSMODELS ACQUISES À L’ISSUE
Modèles de base - Analyser et décomposer un
Modèles ARIMA incontournable de la data science : les
séries temporelles
- Corriger une série temporelle des
2 variations saisonnières
TEXT - Formation à la prédiction de
MINING l’évolution future d’une série
Introduction aux expressions temporelle
régulières - Maîtriser les techniques de
Pre-processing en Text mining manipulation et prétraitement de
Création d’un WordCloud données textes
Création d’un WordCloud - Lire et utiliser les expressions
régulières
- Utiliser un modèle de Machine
3 Learning sur données textes, domaine
MACHINE LEARNING ET en pleine expansion en Data Analysis
THÉORIE DES GRAPHES - Connaître les concepts fondamentaux
AVEC NETWORKX de la théorie des graphes, discipline
clé en Data Science
Introduction à la théorie des
- Choisir un modèle de données entre
graphes
une approche par graphe et une
Algorithmes fondamentaux : approche tabulaire
Kruskal et Dijkstra
- Connaître les algorithmes les plus
Détection de communautés populaires en Machine Learning
Algorithme PageRank appliqué pour graphes
au classement de pages Web
1 LES COMPÉTENCES
INTRODUCTION ACQUISES À L’ISSUE
AU DATA ENGINEERING
ET BIG DATA - Lire et interroger les bases de
données relationnelles
Deep Learning
Durée : 40h
1
DEEP-LEARNING LES COMPÉTENCES
AVEC LE FRAMEWORK ACQUISES À L’ISSUE
KERAS
- Comprendre et implémenter des
Concepts fondamentaux réseaux de neurones, un classique
Prédiction à l’aide des Dense du deep learning
Neural Networks
Prédiction à l’aide des - Entraîner et évaluer les résultats
obtenus par un réseau de neurones
Convolutional Neural Networks
(CNN) - Utiliser les méthode de Transfer
Résolution avec l’architecture Learning, très appréciées en deep
LeNet learning
Système Complexe et IA
Durée : 40h
LES COMPÉTENCES
1 ACQUISES À L’ISSUE
INTRODUCTION TO
REINFORCEMENT Comprendre les fondements
LEARNING mathématiques d'une discipline
un peu particulière du Machine
The maths behind Learning : l'apprentissage par
Reinforcement renforcement
Monte Carlo Learning
Temporal Difference Connaître les principaux
algorithmes utilisés en
Learning : SARSA
Reinforcement Learning,
Temporal Difference domaine du Machine Learning
Learning : Q-Learning souvent utilisé en finance.
ÉTAPE 1
Après votre inscription sur le site, nous vous contactons
une première fois pour une présentation détaillée de
notre offre et une compréhension de votre parcours et
vos souhaits.
L’idée est d’aligner dès le départ vos attentes avec nos
formations .
ÉTAPE 2
Nous vous redirigeons vers un test technique de
positionnement nullement rédhibitoire qui nous
sert à savoir avec quelles bases vous démarrez. Il
s’agit essentiellement de test mathématiques de
probabilité/statistique et d’algèbre relativement
basique (niveau L1/L2 mathématiques).
ÉTAPE 3
Une fois ce test passé, un membre de l’équipe d’admission
prend contact avec vous pour échanger sur votre résultat,
vos motivations, et la pertinence de votre projet.
La communauté alumni
Beta-test
Afin de gagner en connaissances data et d’assurer la veille technologique
même après la fin de la formation, tout alumni
a accès en avant-première à tout nouveau
module de formation.
Veille technologique
En parallèle, des newsletters élaborées par nos
data scientists sont régulièrement envoyées
et sont une source fiable d’informations
spécialisées en data science.
Communauté Alumni
Enfin, la communauté DataScientest ne cesse
de s’agrandir, et avec elle l’ensemble de ses alumnis. Pour garder le contact
et permettre aux anciens élèves de communiquer entre eux, DataScientest a
mis en place la commuanauté DatAlumni, un groupe qui partage et échange
sur divers thèmes autour de la Data Science. Vous serez invité à la rejoindre en
début de votre formation! Au programme : vieille technologique, opportunités
business, networking, événements (afterworks, salons, data challenges…).
Amir ABBASZADEH
Cofounder and CEO at Oilifina Consulting
Ayant une formation d’ ingénieur, Amir a commencé sa carrière en conseil en stratégie
chez McKinsey puis en M&A dans une banque d’investissement. Suite à une expérience
entrepreneuriale, il a senti un vrai besoin technique en traitement des données mais son profil
100% business restait un frein pour se lancer dans l’aventure.
Alina Vornicu
Responsable du Pôle Data de l’Inspection Générale de LCL
Après un master Économétrie et Statistiques Appliquées à l’Université d’Orléans, Alina a intégré
en 2010 Crédit Agricole Consumer Finance en tant que Chargée d’études statistiques dans
l’équipe Prévention du Risque et innovation puis LCL en 2015, en tant qu’Ingénieur d’études
statistiques et actuarielles dans l’équipe Data de l’Inspection Générale qu’elle a eu l’honneur de
manager depuis novembre 2019.
Stefania Di Tommaso
Data Scientist at IsCool entertainment
" À la recherche d’un nouveau travail potentiel. Chose encore plus importante,
ainsi que d’un nouveau défi intellectuel, j’ai eu la possibilité de connaître des
j’ai commencé ma formation de data professionnels du secteur, travaillant
scientist chez DataSciencetest. En 3 dans les milieux des plus différents.
mois, grâce à un suivi constant, j’ai Cette formation fut une véritable
appris les bases en programmation sur fenêtre ouverte sur un monde qui
R et Python. J’ai également découvert m’était inconnu et dont maintenant je
plusieurs algorithmes de ML et de leur fais partie !"
Caroline Uge
Data Scientist chez Back Market
J’ai assisté au bootcamp DataScientest data scientist. Cette formation m’a permis
il y a un peu plus de deux ans. A cette d’acquérir les connaissances techniques
époque, j’avais quitté un emploi de et mathématiques nécessaires pour
gestion de projet qui ne me convenait débuter en data science. Par la suite, j’ai
pas. Je m’intéressais beaucoup à l’analyse intégré une entreprise de conseil en data
de données que j’avais pu légèrement science au sein de laquelle j’ai pu mettre en
pratiquer. Je cherchais de ce fait un pratique mes acquis et affiner mon projet
poste de data analyst, dans l’optique professionnel. Aujourd’hui, je travaille
d’évoluer par la suite en data scientist. chez Back Market : j’exerce un métier
Malheureusement, mes entretiens que j’aime dans une entreprise en accord
n’aboutissaient pas par manque de avec mes valeurs. Ce bootcamp a donné
connaissances techniques. un gros coup de pouce à ma carrière et
Datascientest a été l’opportunité parfaite largement facilité ma reconversion, je le
pour monter en compétences et ainsi recommande chaudement !
prétendre directement à un poste de
Pour répondre à cette question, nous avons mené notre propre enquête auprès
d’une quarantaine d’entreprises partenaires.
En fonction du secteur et de l’entreprise le salaire d’un data scientist junior est
compris entre 35 et 50 000 € par an.
Après 4 ans d’expérience, ce salaire augmente considérablement et oscille
entre 50 et 65 000 euros.
Si vous êtes inscrit chez Pôle Emploi, vous êtes potentiellement éligible à l’AIF .
Soit une aide allant jusqu’à 2000€. DataScientest est également éligible
au CPF.
Enfin si vous êtes actuellement en entreprise, vous pouvez être éligible à une
aide du FNE ou toute l’année via l’OPCO.
Quoi qu’il en soit nos équipes sont là pour vous guider dans vos démarches
administratives d’inscription aux différentes aides de financement.
Pour trouver toutes les possibilités de financement, rien de plus simple : nous
avons crée une page dédiée au sujet ! Cliquez-ici pour la découvrir !
La capacité à maîtriser la data s’avère être très précieuse dans certains métiers
comme chercheur ou actuaire.
Ils bénéficient énormément de l’apport des data sciences , tout comme la
plupart des professions quantitatives qui impliquent des statistiques.
La data leur offre des nouvelles portes et opportunités.
[email protected]
www.datascientest.com
+33 9 80 80 79 49
www.datascientest.com