LE BIG DATA
1. Historique du Big Data
Selon Gill PRESS dans un article publié sur [Link] le 05 Mai 2013,
l’explosion des données est en effet d’abord perçue comme une menace sur la vie privée.
Côté technique l’espace de stockage grandit, mais les données s’étendent
systématiquement jusqu’à le combler. Dans les années 70, la qualité des données est enfin mise
en cause : tout est stocké, il n’est plus utile de faire le tri.
L’expression « Big data » fait finalement son apparition en octobre 1997
dans la bibliothèque numérique de l’ACM, au sein d’articles scientifiques qui pointent du doigt
les défis technologiques à visualiser les « grands ensembles de données ». Le Big data est né, et
avec lui ses nombreux défis.
2. Définition du Big Data
Big Data, littéralement « les grosses données », est une expression anglophone
utilisée pour designer « des ensembles de données » qui deviennent tellement volumineux qu’ils
en deviennent difficiles à travailler avec des outils classiques de gestion de base de données.
Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le
partage, l’analyse et la visualisation des données doivent être redéfinis.
Il s’agit donc d’un ensemble de technologies, d’architecture, d’outils et de
quantités et contenu hétérogènes et changeants, et d’en extraire les informations pertinentes à un
cout accessible.
3. Le principe du Big Data
Il est obligatoire de résumer ses caractéristiques majeures en utilisant quatre
lettres ‘’V’’ :
Le volume de données à collecter, stocker et traiter
La vitesse à laquelle les données sont produites et évoluent dans le temps
Variétés la nature des données
Valeur qui représente l’importance de la donnée
4. Les caractéristiques du Big Data
a. Le volume
Le volume décrit la quantité de données générées par des entreprises ou des
personnes. Le Big Data est généralement associé à cette caractéristique.
Les entreprises, tous secteurs d’activité confondus, devront trouver des
moyens pour gérer le volume de données en constante augmentation qui est créé
quotidiennement.
b. La vitesse
La vitesse décrit la fréquence à laquelle les données sont générées,
capturées et partagées. Du fait des évolutions technologiques récentes, les consommateurs mais
aussi les entreprises génèrent plus de données dans des temps beaucoup plus courts.
c. La variété
La prolifération de types de données provenant de sources comme les
médias sociaux, les interactions Machine to Machine et les terminaux mobiles, crée une très
grande diversité au-delà des données transactionnelles.
d. La valeur
L’analyse Big Data a pour objectif de créer un avantage concurrentiel
unique pour les entreprises, en leur permettant de mieux comprendre les préférences de leurs
clients, de segmenter les clients de façon plus granulaire et de cibler des offres spécifiques au
niveau de segments précis.
Mais les entreprises du secteur public utilisent également Big Data pour
éviter les fraudes et économiser l’argent des contribuables et offrir des meilleurs services aux
citoyens, dans le domaine des soins de santé par exemple.
Le Big Data nous aide à obtenir une meilleure représentation de l’interaction des clients
avec l’entreprise. Il permet une meilleure compréhension de ce que les clients aimeraient réaliser
à chaque point de contact.
5. Stockage liés à Big Data au sein de l’entreprise
Les quatre composants du Big Data changent les besoins de l’entreprise en
matière de protection de données, et relèvent les défis dans la gestion de données ci-dessus
explication détaillée :
Volume : L’augmentation des volumes de données est le défi le plus
communément admis pour les responsables du stockage.
Variété : L’existence de différents types de données, qui ne sont pas toutes
générées au sein de l’entreprise, soulève la question de la gouvernance de l’information.
La vitesse : La performance est l’un des caractéristiques clé de Big Data.
Et l’un de ses avantages est la réduction du temps de décision. Cela augmente les performances
exigées dans l’infrastructure de stockage.
La valeur : L’objectif de l’analyse du Big Data est de créer une valeur
ajoutée pour l’entreprise. Un autre aspect de valeur est de trouver des données pertinentes et de
les rendre accessibles lors du processus de décision, en particulier des informations non
structurées.
6. Quelques domaines d’utilisations du Big Data
La plupart des contextes d’utilisations actuelles du Big Data se résume en
quelques termes :
Pressentir la naissance d’une tendance
Prédire l’évolution d’un phénomène
Repérer des corrélations pour optimiser une stratégie
Faire des contrôles pour découvrir une fraude
Organiser une communication virale
Mieux cibler
7. Cas d’utilisation du Big Data
Le Big Data a su apporter une valeur ajoutée et des innovations concrètes
dans des domaines comme la santé, la physique ou la géopolitique.
1) Le Big Data dans la prédiction des conflits mondiaux
L’outil GDELT (Global Database of Events, Languages and Tones),
développé par l’université de Georgetown et accessible de manière open source,
compile toutes les actualités (communiqués de presse, articles, discours…) parues
depuis 1979.
Il applique ensuite des techniques d’analyse sémantique et des algorithmes
auto-apprenants pour faciliter la compréhension des événements récents et des
principes de cause à effet pour arriver à prédire les conflits mondiaux.
2) Big Data dans l’aide à la recherche contre le cancer
Project Data Sphère met à disposition de tous des données de tests
cliniques passés pour permettre à chacun de conduire ses propres analyses, et,
dans l’esprit du Crowd-Innovation, d’améliorer les méthodes ou de découvrir des
corrélations encore inconnues.
3) Le Big Data nous aide à comprendre le monde
L’entreprise Kaggle, qui met à disposition sa communauté de 150 000
datascientists pour aider les entreprises à résoudre des défis liés à l’analyse de
données, vient de lancer un concours visant à définir un algorithme capable de
comprendre les facteurs qui influencent la création d’un boson de Higgs lors de la
collision de deux atomes.
Le projet est mandaté par le CERN et a été élaboré par deux chercheurs du
CNRS.
4) Le Big data permet de gérer les catastrophes naturelles
En utilisant des outils de tracking, d’analyse sémantique et de visualisation
en temps réel, l’Organisation Mondiale de la Migration a pu assister les forces
locales en dégageant les urgences sanitaires, la localisation des ressources clés et
en optimisant l’allocation des ressources sur le terrain lors du typhon qui a frappé
les Philippines en 2013.
5) Le Big Data aide à éradiquer les épidémies
Des scientifiques de l’université de Bringhma Youns essaient de simuler la
localisation des mouches tsé-tsé dans le but d’aider à contrôler la propagation
d’épidémies.
De la même manière, la police de Chicago utilise le Big Data et la
visualisation de données pour contrôler les populations de rats dans la ville.
8. Les avantages et inconvénients du Big Data
Nous avons comme avantages :
Amélioration de la prise de décision
Une efficacité accrue
Un meilleur service à la clientèle
Nouvelles opportunités commerciales
La réduction des coûts
La création de produits et services améliorés ou nouveaux pour répondre aux
différents besoins des clients
La possibilité d’avoir des retours en temps réel
Une meilleure connaissance du marché
Et comme inconvénients nous avons :
La confidentialité des données
La sécurité des données stockées mise à mal par les risques d’espionnage
numérique
Les données personnelles doivent être collectées dans un but bien précis,
explicite et légitime selon la loi « informatique et libertés » de 1995, mais tous ne
tiennent pas compte de cette législation
La manipulation des données
Préoccupations en matière de protection de la vie privé
Manque de normalisation
Difficulté d’analyse et de gestion des données
L’INTELLIGENCE ARTIFICIELLE (IA)
1. Définition
Construction de programmes informatiques qui s’adonnent à des tâches qui sont,
pour l’instant, accomplies de façon plus satisfaisantes par des êtres humains car elles demandent
des processus mentaux de haut niveau tels que l’apprentissage perceptuel, l’organisation de la
mémoire et le raisonnement critique. Ce terme a été inventé par John McCarthy
Intelligence artificielle forte : Le concept d’intelligence artificielle forte
fait référence à une machine capable non seulement de produire un comportement intelligent,
mais d’éprouver une impression d'une réelle conscience de soi, de « vrais sentiments », et une
compréhension de ses propres raisonnements.
Intelligence artificielle faible : La notion d’intelligence artificielle faible
constitue une approche pragmatique d’ingénieur : chercher à construire des systèmes de plus en
plus autonomes, des algorithmes capables de résoudre des problèmes en simulant l'intelligence.
En bref l’intelligence artificielle c’est des systèmes qui pensent comme des êtres humains,
pensent de manière rationnelle, agissent comme des êtres humains, agissent de manière
rationnelle.
2. Résumé de l’histoire de l’IA
1943 : McCulloch & Pitts : Modèle du cerveau avec un circuit booléen
1950 : Turing’s” Computing Machinery and Intelligence”
1950 - 69 : Les grandes espérances Années 50 Premiers programmes d’IA, jeux
d’échecs de Samuel, Théoricien logique de Newell & Simon, moteur géométrique
de Gelernter
1956 : Conférence de Dartmouth : adoption du terme ”Intelligence Artificielle”
1965 : Algorithme complet pour le raisonnement logique de Robinson
1966 -74 : L’IA découvre la complexité computationnelle La recherche sur les
réseaux de neurones disparait presque
1969 -79 : Premiers développements des systèmes fondés sur les connaissances
1980 -88 : Explosion de l’industrie des systèmes experts
1988 -93 : Fin de l’industrie des systèmes experts : ” l’hiver de l’IA”
1985 -95 : Retour en grâce des réseaux de neurones
1988 - : Résurgence des modèles probabilistes ; l’IA devient une science
”Nouvelle IA” : vie artificielle, algorithmes génétiques, soft computing
1995 - : Des agents partout . . .
2003 - : IA de niveau humain de retour sur l’agenda, Big data
3. Que peut-on faire avec l’IA ?
Jouer correctement au tennis de table
Commander sur le web une semaine de nourriture
Jouer correctement au bridge
Découvrir et prouver un nouveau théorème mathématique
Donner un conseil juridique avisé
Traduire de l’anglais au suédois en temps réel
Réaliser une opération chirurgicale complexe sous surveillance d’un chirurgien.