0% ont trouvé ce document utile (0 vote)
158 vues3 pages

Data Science

Transféré par

Lamine
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats TXT, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
158 vues3 pages

Data Science

Transféré par

Lamine
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats TXT, PDF, TXT ou lisez en ligne sur Scribd

Data Science : définition, problématiques et cas d’usage

---
Table des matières
• Qu'est-ce que la Data Science ?
• Comment fonctionne la data science ?
• Les cas d'usage et applications
La Data Science ou science des données est un vaste champ multi-disciplinaire
visant à donner du sens aux données brutes. Data Science : définition, champs
d’applications et limites actuelles, découvrez tout ce que vous devez savoir sur ce
domaine complexe, devenu un enjeu prioritaire dans les entreprises de toutes les
industries.

Qu'est-ce que la Data Science ?


Pour définir la Data Science de la plus simple des façons, il s’agit de
l’extraction d’informations exploitables à partir de données brutes. Ce champ
multi-disciplinaire a pour but principal d’identifier des tendances, des motifs,
des connexions et des corrélations dans les larges ensembles de données.
La science des données englobe une large variété d’outils et de techniques telles
que la programmation informatique, l’analyse prédictive, les mathématiques, les
statistiques ou l’intelligence artificielle. Désormais, la Data Science inclut
aussi les algorithmes de Machine Learning.
De nos jours, presque toutes les entreprises affirment pratiquer la Data Science
sous une forme ou une autre. Cependant, les méthodes et approches employées peuvent
varier d’une organisation à l’autre.
Il devient donc très compliqué d’offrir une définition précise de la Data Science.
D’autant que de nouvelles technologies apparaissent sans cesse et transforment
continuellement ce domaine. Ainsi, pour définir la science des données, la
meilleure question à se poser est « pourquoi ? ».
Découvrir nos formations en Data
Si la Data Science connaît un essor fulgurant dans tous les secteurs d’activité,
c’est parce que l’humanité génère de plus en plus de données. Entre 2011 et 2013,
en seulement deux ans, le volume mondial de données a été multiplié par 9.
Et cette explosion du Big Data n’a pas ralenti depuis. D’ici la fin de l’année
2020, le volume total de données à l’échelle de la planète devrait atteindre 44
zettabytes contre moins de 5 zettabytes en 2013.
Comment expliquer ce phénomène ? Plusieurs technologies émergentes génèrent des
données. C’est le cas des objets connectés, des réseaux sociaux, des smartphones,
ou des moteurs de recherche web.
Or, toutes ces données offrent des opportunités inouïes pour les entreprises de
toutes les industries, les institutions de recherche ou le secteur public. C’est la
raison pour laquelle les données sont souvent considérées comme « le pétrole du
XXIème siècle« .
Le but de la Data Science est d’exploiter ces données, de leur donner du sens.
Cette discipline vise à parcourir de vastes » lacs de données » à la recherche de
connexions, de tendances, de points d’intérêt.
En s’appuyant sur ces découvertes, il est possible de créer de nouveaux produits et
services innovants, de résoudre des problèmes concrets, d’améliorer ses
performances comme jamais auparavant. La Data Science permet de prendre des
décisions basées sur les données, plutôt que sur une simple intuition. Ainsi, elle
révolutionne notre quotidien et nous permet de s’ouvrir à de nouveaux horizons. En
bref, la data science représentera une science incontournable du monde demain !

Comment fonctionne la data science ?


La Data Science couvre une large variété de disciplines et de champs d’expertise.
Son but reste toutefois de donner du sens aux données brutes.
Pour y parvenir, les Data Scientists doivent posséder des compétences en ingénierie
des données, en mathématiques, en statistique, en informatique et en Data
Visualization. Ces compétences leur permettront de parcourir les vastes ensembles
de données brutes pour en dégager les informations les plus pertinentes et les
communiquer aux décideurs de leurs organisations.
Les Data Scientists exploitent également l’intelligence artificielle, et plus
particulièrement le Machine Learning et le Deep Learning. Ces technologies sont
utilisées pour créer des modèles et réaliser des prédictions en utilisant des
algorithmes et diverses techniques.
De manière générale, la Data Science se décompose en cinq étapes. Chacune de ces
étapes requiert différentes techniques, outils et compétences.
Dans un premier temps, les données doivent être collectées, extraites à partir de
différentes sources.
Il s’agit ensuite de les entreposer dans une Data Warehouse, de les nettoyer, de
les transformer afin qu’elles puissent être analysées. L’étape suivante est celle
du traitement des données, par le biais du Data Mining (forage de données), du
clustering, de la classification ou de la modélisation.
Les données sont ensuite analysées à l’aide de techniques comme l’analyse
prédictive, la régression ou le text mining. Enfin, la dernière étape consiste à
communiquer les informations dégagées par le biais du reporting, du dashboarding ou
de la Data Visualization.

Les cas d'usage et applications


Les cas d’usage de la Data Science sont aussi nombreux que variés. Cette
technologie est utilisée pour assister la prise de décision en entreprise, mais
permet aussi l’automatisation de certaines tâches.
Elle est utilisée à des fins de détection d’anomalies ou de fraude. La science des
données permet aussi la classification, par exemple pour trier automatiquement les
emails dans votre boîte.
Elle permet aussi la prédiction, par exemple pour les ventes ou les revenus. En
l’utilisant, il est possible de détecter des tendances ou des » patterns » dans
les ensembles de données.
La Data Science se cache aussi derrière les technologies de reconnaissance faciale,
vocale ou textuelle. Elle alimente aussi les moteurs de recommandations capables de
vous suggérer des produits ou du contenu en fonction de vos préférences.
D’un secteur d’activité à l’autre, la Data Science est exploitée de différentes
manières. Dans le domaine de la santé, les données permettent aujourd’hui de mieux
comprendre les maladies, de recourir à la médecine préventive, d’inventer de
nouveaux traitements ou d’accélérer les diagnostics.
En logistique, la Data Science aide à optimiser les itinéraires et les opérations
internes en temps réel en tenant compte de facteurs comme la météo ou le trafic.
Dans la finance, elle permet d’automatiser le traitement des données d’accords de
crédit grâce au NLP pour Natural Language Processing ou Traitement automatique des
langues ou de détecter la fraude grâce au Machine Learning.
Les entreprises de retail l’utilisent pour le ciblage publicitaire et le marketing
personnalisé. Les moteurs de recommandations, basés sur l’analyse des préférences
du consommateur, sont utilisés par Google pour son moteur de recherche web, par les
plateformes de streaming comme Netflix ou Spotify, et par les entreprises de e-
commerce comme Amazon.
Les entreprises de cybersécurité se tournent vers l’IA et la science des données
pour découvrir de nouveaux malwares au quotidien. Même les voitures autonomes
reposent sur la Data Science et l’analyse prédictive pour ajuster leur vitesse,
éviter les obstacles et les changements de voie dangereux ou choisir l’itinéraire
le plus rapide.
Voir nos formations en Data Science
Vous savez maintenant tout sur la Data Science. Vous souhaitez travailler dans ce
domaine Découvrez nos formations aux différents métiers de la science des données
tels que Data Scientist, Data Analyst et Data Engineer.

Intro DS Syllabus
-----------------
Data science is a very broad topic. Data scientists use
many different tools to make sense of data, from databases
to advanced ML algorithms.

The breadth of problems that can be solved with data science


is astonishing.

Recommender systems are one of the most visible applications


of machine learning and their uncanny ability to convert our
unspoken actions into items we like is both addicting and
concerning. Recommender systems, though, are here to stay
and for anyone beginning their journey in data science,
this is a lucrative space for future employment.

Modern Linear Algebra


---------------------

Computers are extremely efficient at working with


matrices. And so, modern computing gave rise to modern
linear algebra.

Modern linear algebra is computational whereas traditional


linear algebra is abstract.

Modern linear algebra is best learned through code and


applications in graphics, statistics, data science, A.I.,
and numerical simulations; whereas traditional linear algebra
is learned through proofs and pondering infinite-dimensional
vector spaces.

Modern linear algebra provides the structural beams that


support nearly every algorithm implemented on computers,
whereas traditional linear algebra is often intellectual
fodder for advanced mathematics university students.

Welcome to modern linear algebra.

Vous aimerez peut-être aussi