Question n°8 :
Une API, ou Application Programming Interface, est une liste de méthodes mise à disposition par un site à
d’autres développeurs. Elle leur permet ainsi d’utiliser certaines fonctionnalités ou d’accéder à des données
du site. L'API peut être résumée à une solution informatique qui permet à des applications de communiquer
et de s'échanger des services ou des données. Il s'agit en réalité d'un ensemble de fonctions qui facilitent
grâce à un langage de programmation l'accès aux services d'une application.
Twitter dispose de plusieurs APIs permettant de requêter sa base de données, mais aussi de construire des
services au-dessus de sa plateforme. Ces APIs sont particulièrement riches en retournant presque une
centaine de variables par requête ; les données concernent les tweets (date de publication, le texte du
message, etc.), l’auteur (date de création du compte, pseudo…), les entités contenues dans les messages
(hashtags, mentions, urls…) et des informations de localisation (pays, timezone, longitude / latitude).
L'api twitter permet donc d''accéder' à la base de données twitter et de récupérer et/ou poster plusieurs
informations. Elle se décompose en quatre classes :
SEARCH : qui permet d'interroger twitter pour récupérer des données simples, principalement des
tweets.
REST : permet d'accéder à des fonctionnalités avancées de twitter : chercher des utilisateurs, des
followers, voir les statuts, éditer des informations sur son compte, etc.
STREAMING : Elle permet l'accès à de gros volume de données twitter et d'être moins contrainte par
les limites d'accès et d'interrogations de twitter. Elle requiert c.ependant l’installation de
mécanismes complexes pour l’accès aux données
WEBSITES : permet d'intégrer des fonctions de base twitter dans des sites web.
L’API twitter se présente sous la forme de requêtes HTTP. Elles permettent de communiquer avec les
serveurs et services twitter et d'interagir avec eux. Selon l'API utilisée (SEARCH, REST, Streaming), les
requêtes à utiliser ont une syntaxe et des arguments précis.
Un développeur utilisant une seule application peut collecter au maximum 100 000 tweets en 24h, soit
environ 4167 tweets par heure. Pour collecter des données Twitter les librairies et/ou modules suivant
peuvent être utilisés : tweepy, json, pandas, csv, textblob, string, preprocessor, searchtweets (or
TwitterSearch)…
Question n 10 :
10. (3 points) Quels modules / bibliothèques avez-vous utilisés ? Quels sont les noms de fonction que vous
avez utilisés pour chaque question ? Quelle partie a été difficile ? Etc. (Ajoutez toutes les réponses à votre
rapport.)
Nous avons utilisés trois bibliothèques : pandas, matplotlib.pyplot et langdetect.
Nous avons utilisé les fonctions :
x.iloc( ?).plot.bar,
langdetect.detect()
tu peux parler de la question 4 avec le graphique ou on a eu du mal à d'abord sélectionner
les 10 plus grosses valeurs, puis à mettre un nom à ces valeurs
peut etre aussi du langdetect pcq c'est loin de ce qu'on a l'habitude de faire en python