Logiciels Statistiques
Programmation & Logiciels
Statistiques
Cours 7
Salim Lardjane - Université de Bretagne-Sud
Autres logiciels statistiques
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• ADaMSoft : c’est un logiciel libre open source
développé en Java et qui peut fonctionner sur
toute plateforme où Java est disponible.
• Les outils suivants sont disponibles sous
ADaMSoft :
Réseaux de Neurones
Graphiques
Algorithmes de Data Mining
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
Régression linéaire
Régression Logistique
Méthodes de classification
Arbres de décision
Analyse discriminante
ACP
Analyse des correspondances
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• ADaMSoft peut accéder à des données de
type
• Texte
• Excel
• ODBC
• MySQL
• Postgressql
• Oracle
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• ADMB : c’est un logiciel libre open source de
modélisation non linéaire développé en C++
• ADMB implémente :
Diverses méthodes de Monte-Carlo par
Chaînes de Markov, ce qui le rend utile dans le
cadre d’analyses bayésiennes
Les modèles à effets aléatoires
• Il est particulièrement utilisé en statistique
environnementale
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• BFL (Bayesian Filtering Library) : C’est une
bibliothèque C++ open source dédiée à
l’estimation recursive bayésienne
• BFL implémente :
Le filtre de Kalman
Les filtres particulaires
Les méthodes de Monte-Carlo séquentielles
Les filtres de mélange
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Chronux : C’est un paquet open source dédié à
l’analyse des séries temporelles
neurobiologiques. Il est composé de routines
MATLAB et de diverses librairies C
• Chronux implémente :
Les méthodes de régression locale
Diverses méthodes de lissage
L’analyse spectrale des séries temporelles
Divers outils de visualisation des séries
chronologiques
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Dap : C’est logiciel gratuit d’analyse statistique
et de visualisation des données dans la lignée
de SAS mais qui nécessite une bonne maîtrise
du langage C
• Dap implémente :
Les méthodes de statistique descriptive
univariée
L’analyse de variance
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
La régression linéaire
La régression logistique
Diverses méthodes de statistique non-
paramétrique
Divers outils graphiques de visualisation
• Dap a été spécialement conçu pour traiter des
tableaux de données importants, pouvant
excéder la mémoire de l’ordinateur
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Fityk : C’est un logiciel de régression et
d’analyse des données. Il est très utilisé en
chromatographie et en spectroscopie.
• Fityk implémente notamment divers
algorithmes de moindres carrés pondérés
pour la régression non linéaire :
L’algorithme de Levenberg-Marquardt
L’algorithme de Nelder-Mead
Les algorithmes génétiques
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Gretl (Gnu Regression, Econometrics and
Times-series Library) : C’est un paquet open-
source dédié principalement à l’économétrie.
• Gretl dispose d’une interface graphique qui
peut être utilisée avec X12-ARIMA, R, Octave
et Ox.
• Gretl est programmé en C.
• Il supporte différentes langues, dont le
Français.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Gretl peut accéder à des données au format :
Ascii
Csv
Eviews
Excel
Octave
SAS xport
SPSS
Stata
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Incanter : c’est un logiciel gratuit, de type R
pour l’analyse statistique des données, basé
sur le langage de programmation Clojure
(dialecte de LISP) et sur Java.
• Il implémente notamment divers outils de
visualisation des données et les fonctions
statistiques usuelles.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• JAGS (Just Another Gibbs Sampler) : C’est un
programme dédié à l’analyse des modèles
hiérarchiques bayésiens par MCMC
• Il est écrit en C++ et peut donc être utilisé sur
différentes plateformes, contrairement à
WinBUGS et OpenBUGS
• JAGS peut interagir avec R à l’aide du paquet
rjags
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• JHepWork : c’est un logiciel interactif dédié au
calcul scientifique, à l’analyse des données et
à leur visualisation. Il est programmé en JAVA
et peut donc être utilisé sur diverses
plateformes.
• JHepWork implémente :
Des outils de visualisation 2D et 3D des
données, fonctions et histogrammes
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
Calculs scientifiques avec la syntaxe Matlab ou
Octave
Des générateurs de nombres aléatoires et des
méthodes d’échantillonnage
Nuages de points, diagrammes de contours
Réseaux de neurones
Régression linéaire
Diverses méthodes de classification, dont CAH
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
Graphiques EPS, PDF, Postscript
• JHepWork est parfois appelé Jwork
• Il fonctionne sous Windows, Mac, Linux et
Android
• Sous Android, il est appelé AWork
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• JMulTi : c’est un logiciel interactif dédié à
l’analyse économétrique, en particulier des
séries temporelles univariées et multivariées
• Il dispose d’une interface graphique Java
• Il implémente notamment la technique
d’Impulse Response Analysis et d’autres
techniques avancées non disponibles sous
d’autres logiciels
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Octave : c’est un langage de haut niveau,
principalement dédié au calcul scientifique,
qui est en grande partie compatible avec
Matlab
• Il implémente diverses techniques statistiques
de base mais est surtout utile pour
implémenter de nouvelles méthodes
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Mondrian : C’est un logiciel dédié
principalement à la visualisation des données.
• Les graphiques de Mondrian sont pleinement
dynamiques : un point sélectionné sur un
graphique est sélectionné sur tous les autres
• Mondrian implémente :
Les nuages de points
Les histogrammes
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
Les diagrammes en barres
Les boxplots
L’ACP
Les techniques de Multidimensional Scaling
• Mondrian peut accéder à des données au
format délimité par des tabulations ou des
virgules et lire des données R
• Mondrian peut interagir avec R
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• OpenBUGS : C’est un logiciel dédié à l’analyse
bayésienne de modèles statistiques complexes
par les méthodes de MCMC
• C’est une version open source du logiciel
WinBUGS
• Il fonctionne sous Windows et Linux et peut
être appelé sous R et S+
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• OpenEpi : C’est un logiciel gratuit, open source
composé de différents programmes dédiés à
l’épidémiologie, la biostatistique, la santé
publique et la médecine.
• Il a été développé en JavaScript et HTML et
peut fonctionner dans un Browser.
• Il peut être utilisé directement sur le site
OpenEpi ou être téléchargé et utilisé en local.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• La version disponible sous Windows est
appelée Winpepi (freeware)
• OpenEpi implémente :
Le calcul d’intervalles de confiance pour des
proportions, taux, taux de mortalité,
moyennes, médianes, fractiles
Analyse de tables de contingences 2x2
Analyses cas-contrôle
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
Tests de tendances pour des données de
comptage
Test de Student et Anova
Courbes ROC
Calcul de tailles d’échantillon pour des
proportions, enquêtes, cohortes, essais cliniques
et comparaison de moyennes
Calcul de puissances pour des proportions et
comparaison de moyennes
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
Générateurs de nombres aléatoires
• OpenEpi offre des fonctionnalité qui ne sont
pas disponibles sous d’autres logiciels pour
l’analyse épidémiologique, notamment
différents tests sur les taux de risque et les
odds-ratios.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• OpenMx : c’est un programme open source
pour la modélisation avancée par équations
structurelles.
• Il est implémenté sous la forme d’un paquet R.
• OpenMx fonctionne sur différentes
plateformes : Linux, Mac et Windows.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Orange : C’est un logiciel de data mining et
d’apprentissage statistique.
• Il dispose d’une interface graphique pour
l’analyse exploratoire des données et leur
visualisation et interagit avec Python
• Il est programmé en C++ et Python
• Il fonctionne sous Linux, Mac et windows
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Ploticus : c’est un logiciel gratuit, open source,
pour la visualisation des données.
• Il fonctionne sous Unix, Solaris, Linux, Mac et
Win32.
• Il implémente les graphiques usuels de
statistique ainsi que les diagrammes de Venn
et les arbres.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• PSPP : c’est un logiciel gratuit pour l’analyse de
données obtenues par échantillonnage /
sondage, conçu comme alternative libre à
SPSS.
• Il dispose d’une interface graphique et d’une
ligne de commande.
• Il est écrit en C et basé sur la GNU Scientific
Library.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• PSPP implémente :
Calculs de fréquences
Comparaison de moyennes
Analyse de la variance
Régression linéaire
Outils de fiabilité
Tests non paramétriques
Analyse en Facteurs
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Ses possibilités graphiques sont limitées mais
incluent :
Histogrammes
Diagrammes en secteurs (camemberts)
• PSPP peut importer des données au format
Gnumeric, OpenDocument, Excel, CSV, ASCII
et BDD Postgres.
• Il peut exporter les données au format SPSS.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• RapidMiner : C’est un environnement dédié à
l’apprentissage statistique, le data mining, le
text mining, la prévision et l’analyse de
marché.
• RapidMiner implémente diverses procédures
de data mining et d’apprentissage statistique,
parmi lesquelles :
Lecture et transformation des données
(Extract Transform Load – ETL)
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
Prétraitement des données et leur visualisation
Modélisation
Evaluation des modèles
Déploiement des modèles
• Il est écrit en Java et fait appel à des outils Weka
et R.
• RapidMiner permet de créer un arbre des
opérations à appliquer aux données, comme SAS
Enterprise Miner.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• RapidMiner peut être appelé à partir d’autres
programmes et dispose également d’une ligne
de commande.
• Il est très utilisé en bioinformatique, text
mining, mutimédia mining et data mining
distribué.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Revolution R : Version de R dédiée aux
données de grande dimension, basée sur le
calcul multiprocesseur et multicore.
• Revolution R est développé par une société
privée : Revolution Analytics.
• Il permet d’utiliser R pour analyser des
données excédant la mémoire de l’ordinateur,
notamment via le package RevoScaleR.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Salstat : c’est un logiciel gratuit pour l’analyse
statistique des données, l’accent étant mis sur
la facilité d’utilisation.
• Il dispose d’une interface graphique et d’une
ligne de commande.
• Salstat implémente entre autres :
Les méthodes de statistique descriptive
Les tests paramétriques et non-paramétriques
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Salstat est programmé en Python et
fonctionne sur toute plateforme supportant
Python, NumPy, SciPy et wxPython.
• Il est notamment utilisé en climatologie.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Scilab : c’est un logiciel et langage matriciel de
programmation open source multiplateforme,
dédié au calcul scientifique et qui peut être
notamment utilisé pour la Statistique et le
Traitement du signal.
• Tout code Matlab peut être converti en Scilab.
• Scilab est disponible sous plusieurs langues,
dont le Français.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Scipy : c’est une bibliothèque open source
implémentant divers algorithmes
mathématiques sous Python.
• Elle peut notamment être utilisée pour le
Traitement du Signal et des images.
• Elle peut interagir avec R via le package Rpy.
• Les modules stats et cluster implémentent
diverses fonctions de statistique descriptive et
de classification.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Scikit-learn : c’est une bibliothèque open
source sous Python, dédiée à l’apprentissage
statistique.
• Elle implémente notamment :
Diverses méthodes de classification
La régression linéaire
Diverses méthodes d’analyse discriminante
Les SVM (Support Vector Machines)
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
La régression logistique
L’analyse discriminante par méthode de Bayes
naïve
Les k-moyennes
• Elle est conçue pour interagir avec Numpy et
Scipy.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Shogun : C’est une boîte à outils gratuite et
open source programmée sous C++ et dédiée
à l’apprentissage statistique.
• Outre l’Analyse Discriminante Linéaire, Shogun
implémente notamment diverses méthodes à
noyaux comme les SVM pour la régression et
l’analyse discriminante.
• Il implémente également les modèles de
Chaînes de Markov Cachées.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Shogun peut interagir avec Matlab, Octave,
Python, R, Java, Ruby, Lua et C#.
• Les noyaux actuellement disponibles pour les
données numériques incluent :
Le noyau linéaire
Le noyau gaussien
Les noyaux polynômiaux
Les noyaux sigmoïdes
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• SimFiT : c’est un paquet Windows open source
dédié à la simulation, la régression, la
visualisation des données et à la Statistique.
• Il peut être utilisé sous Linux via WINE.
• Il est notamment utilisé en Epidémiologie et
en Médecine.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• SOCR (Statistics Online Computational
Resource) : c’est une suite d’outils online
dédiés à l’apprentissage de la Statistique et de
la Théorie des Probabilités.
• Elle est développée en HTML, XML et Java.
• SOCR implémente notamment divers outils
d’Analyse Exploratoire des Données.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• SOFA Statistics : c’est un logiciel statistique
open source mettant l’accent sur la facilité
d’utilisation et la qualité des sorties.
• Il dispose d’une interface graphique et peut
importer des données directement de MySQL,
PostgreSQL, SQLite, MS Access, Microsoft SQL
Server et CUBRID.
• Il peut également accéder à des données aux
formats CSV, Excel, OpenOffice, Gnumeric et
Google Docs.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• SOFA Statistics implémente notamment :
Divers tests statistiques : Student, Wilcoxon,
Mann-Whitney, Pearson, Kruskal-Wallis,
Spearman, Pearson…etc.
Divers outils de statistique descriptive :
moyenne, quantiles, médiane, écart-type.
Divers graphiques dynamiques : camemberts,
histogrammes, nuages de points…etc.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• SOFA Statistics fonctionne sous Windows, Mac
et Linux.
• Il est écrit en Python et fait appel au module
statistique de Scipy.
• Les analyses et rapports d’analyse peuvent
être automatisés à l’aide de scripts en Python,
produits directement par SOFA ou écrits
manuellement.
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
• Weka : c’est une suite logicielle gratuite
dédiée au data mining et à l’apprentissage
statistique, programmée en Java.
• Weka implémente notamment des méthodes
de :
Prétraitement des données
Classification
Analyse discriminante
Salim Lardjane - Université de Bretagne-Sud
Logiciels libres
Régression
Visualisation des données
Courbes ROC
• Weka peut accéder aux bases de données SQL
ou importer des données au format texte ou
CSV.
Salim Lardjane - Université de Bretagne-Sud
Domaine public
• Demetra+ : c’est un logiciel dédié à l’analyse
de saisonnalité développé par Eurostat pour la
commission européenne.
• Il est programmé en C++ et Java.
• Il implémente notamment les méthodes de
désaisonalisation de séries temporelles
TramoSeats et X12-ARIMA.
Salim Lardjane - Université de Bretagne-Sud
Domaine public
• CSPro : c’est un logiciel statistique du domaine
public développé par le US Census Bureau et
ICF International.
• Il est principalement dédié à la saisie, l’édition,
la tabulation et la dissémination des données
de recensement ou de sondage.
• Il fonctionne sous Windows.
Salim Lardjane - Université de Bretagne-Sud
Domaine public
• Epi Info : c’est un logiciel statistique du
domaine public dédié à l’épidémiologie.
• Il est développé à Atlanta (USA).
• Il fonctionne sous Windows et est programmé
en Visual C# 3.5.
• Epi Info implémente notamment :
Des méthodes de création de questionnaires
Une interface de saisie des données
Salim Lardjane - Université de Bretagne-Sud
Domaine public
Test de Student
ANOVA
Tests non-paramétriques
Tableaux croisés
Estimation d’odds-ratios, risques, différences de
risques
Régression logistique
Analyse de Survie (Kaplan-Meier, Modèle de Cox)
Analyse de données de sondage à plan complexe
Salim Lardjane - Université de Bretagne-Sud
Domaine public
• X-12 ARIMA : c’est un logiciel de
désaisonnalisation développé par le US
Census Bureau.
• Il peut être utilisé avec d’autres logiciels
statistiques, comme Gretl ou Eviews, qui
disposent d’une interface graphique.
• Il succède à X-11 ARIMA.
Salim Lardjane - Université de Bretagne-Sud
Freeware
• BV4.1 : c’est un programme facile d’utilisation
pour la décomposition des séries temporelles
et l’ajustement saisonnier.
• Il est développé par l’Office Fédéral de
Statistique Allemand.
• C’est un freeware pour une utilisation non
commerciale.
• Il supporte les formats Excel, Access, SQL
Server et CSV et fonctionne sous Windows.
Salim Lardjane - Université de Bretagne-Sud
Freeware
• GeoDA : c’est un logiciel gratuit dédié à
l’analyse spatiale des données, à la
géovisualisation, à la modélisation spatiale et
à l’analyse des corrélations spatiales.
• Il fonctionne sous Windows, Mac et Linux.
• GoDA implémente également la régression
linéaire simple.
Salim Lardjane - Université de Bretagne-Sud
Freeware
• WinBUGS : c’est un logiciel de statistique
bayésienne basé sur les méthodes de Monte
Carlo par Chaînes de Markov (MCMC).
• Il fonctionne sous Windows mais peut être
utilisé sous Linux via WINE.
• La dernière version de WinBUGS date de
2007.
• Il n’est plus développé, l’effort portant
actuellement sur OpenBUGS.
Salim Lardjane - Université de Bretagne-Sud
Freeware
• IDAMS : c’est un logiciel propriétaire
développé par l’UNESCO pour le traitement et
l’analyse des données numériques.
• Il implémente notamment diverses méthodes
de Statistique Exploratoire et d’analyse de
séries temporelles.
• Une version spécifique à Windows, WinIDAMS
a été publiée en 2006.
Salim Lardjane - Université de Bretagne-Sud
Add-In Excel
• Analyse-it : c’est un add-in pour Excel dédié à
l’analyse statistique.
• Analyse-it implémente notamment :
Méthodes de Statistique Descriptive
ANOVA
Tests de Mann-Whitney, Wilcoxon, Khi-Deux
Régression linéaire
Régression polynômiale
Salim Lardjane - Université de Bretagne-Sud
Add-In Excel
• NumXL : c’est un add-in pour Excel dédié à
l’économétrie et à l’analyse des séries
temporelles.
• Il implémente diverses techniques d’analyse
des séries temporelles, notamment par
modélisation linéaire ou non-linéaire et divers
tests statistiques.
• Entre autres, NumXL implémente :
Salim Lardjane - Université de Bretagne-Sud
Add-In Excel
Calcul des fonctions d’autocorrélation et
d’autocorrélation partielle
Fonctions de répartitions empiriques,
estimation non-paramétrique de la densité
Tests de Normalité
Modèles linéaires généralisés
Modèles ARIMA
Modèles ARCH et GARCH
Salim Lardjane - Université de Bretagne-Sud
Add-In Excel
• SigmaXL : c’est un add-in Excel implémentant
divers outils de la méthodolgie Six-Sigma.
• Il implémente notamment :
Diagrammes de Pareto
Histogrammes
Boxplots
Nuages de points
Méthodes de Statistique descriptive
Salim Lardjane - Université de Bretagne-Sud
Add-In Excel
Tests de Student
ANOVA
Tests d’égalité des variances
Tests de régression
Test du Khi-Deux
Tests non-paramétriques
Salim Lardjane - Université de Bretagne-Sud
Add-In Excel
• D’autres add-in Excel sont : Xlfit, dédié
notamment à la régression linéaire et non-
linéaire, SPC XL, Stats Helper et StatBox, ce
dernier implémentant entre autres la
régression linéaire, la régression PLS, la
régression logistique, l’ACP et diverses
méthodes de classification.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• Eviews : Logiciel d’économétrie dédié
notamment à l’analyse des séries temporelles.
• Eviews implémente diverses technique
d’estimation et de prévision des séries
temporelles ainsi que des techniques
d’analyse des données longitudinales et des
données de Panel.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• GAUSS : c’est un langage de programmation
matriciel dédié aux Mathématiques et à la
Statistique.
• Il est très utilisé en économétrie.
• Gauss implémente entre autres :
Les méthodes de Statistique descriptive
La régression linéaire
La régression non-linéaire
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
Les modèles de choix discret
Diverses méthodes d’estimation par maximum
de vraisemblance
L’analyse des données de Panel
Les modèles ARIMA, VARIMA, VARMAX,
VARMA, ARIMAX
Les modèles log-linéaires
Graphiques 2D et 3D
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• IBM SPSS Statistics : c’est un logiciel de
Statistique, très utilisé en Sciences Sociales.
• Il implémente notamment :
Statistique descriptive univariée et bivariée
Tests de Student
Anova
Tests de corrélation
Tests non-paramétriques
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
Régression linéaire et logistique
Analyse en Facteurs
Classification (k-moyennes, CAH)
Analyse discriminante
• Il dispose d’une interface graphique et de menus
• Il peut lire les données aux formats texte, Excel,
BDD et ceux d’autres logiciels statistiques
• Il peut interagir avec des BDD relationnelles via
ODBC et SQL
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• IBM SPSS Modeler : c’est un logiciel complet
de data mining et de text mining orienté vers
la modélisation prédictive.
• Il implémente notamment :
Diverses méthodes de classification
Les réseaux bayésiens
Le modèle de Cox
L’ACP, l’Analyse en Facteurs
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
La régression logistique
Les cartes de Kohonen
Les SVM (Support Vector Machines)
Les réseaux de neurones
La régression linéaire
Les modèles linéaires généralisés
Divers outils d’analyse de séries temporelles
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• JMP (« jump ») : c’est un programme d’analyse
statistique dynamique des données.
• Un point sélectionné sur un graphique est mis
en évidence dans les tables et sur les autres
graphiques.
• Il est développé par SAS.
• JMP implémente divers outils statistiques dont
des outils de développement de plans
d’expériences et de contrôle de la qualité.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• JMP peut accéder à des données au format
texte, Excel, SAS et ODBC.
• Il dispose d’un langage de programmation, JSL
qui permet, entre autres, de soumettre et de
récupérer les résultats d’analyses effectuées
avec R.
• JSL permet également de soumettre du code
SAS.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• MATLAB : c’est un langage matriciel de calcul
scientifique, particulièrment adapté à la
visualisation 2D et 3D des données.
• En plus des fonctions disponibles en standard
sous MATLAB, la boîte à outils « Statistics
Toolbox » implémente diverses techniques
statistiques, dont l’ACP, la régression linéaire,
la classification, l’ANOVA, les tests
d’hypothèses, les plans d’expériences.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• MedCalc : c’est un logiciel statistique dédié
aux sciences biomédicales.
• Il peut accéder à des données aux formats
Excel et CSV, entre autres.
• MedCalc implémente notamment :
Les courbes ROC
L’estimateur de Kaplan-Meier et les
graphiques associés
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• Minitab : c’est un logiciel statistique, très
utilisé en conjonction avec diverses
méthodologies d’amélioration des procédés.
• Il est disponible en plusieurs langues, dont le
Français.
• Minitab implémente notamment :
Régression linéaire
Calculs de puissance et de taille d’échantillon
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
Graphiques 2D
Analyse en facteurs, ACP, AFC
Outils de lissage et de prévision de séries
temporelles
Outils de contrôle statistique des procédés
ANOVA
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• NCSS : c’est un logiciel statistique généraliste.
• Il peut accéder aux données aux formats
texte, Excel, BDD et aux données issues de la
plupart des autres logiciels statistiques.
• NCSS implémente notamment :
ANOVA
Régression linéaire et non-linéaire
Plans d’expériences
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
Outils de prévision de séries temporelles
Modèles linéaires généralisés
Outils de méta-analyse
Outils de contrôle de la qualité
Modèles mixtes
Outils d’analyse de Survie
Tests de Student
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• Q research software : c’est un logiciel
d’analyse des données d’études de marché,
très utilisé en Marketing.
• Il peut accéder aux données aux formats CSV
et SPSS.
• Q implémente notamment :
Régression linéaire
Régression logistique
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
Arbres de régression
Arbres de classification
Modèles de choix
ACP
Analyse en classes latentes
Modèles de mélange
Classification par K-moyennes
AFC, ACM
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• RATS : c’est logiciel d’économétrie et d’analyse
des séries temporelles.
• RATS implémente notamment :
Régression linéaire, dont stepwise
Régression non-linéaire
Estimation par maximum de vraisemblance
Modèle ARIMA
Modèles économétriques de grande dimension
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
Analyse spectrale des séries temporelles
Réseaux de neurones
Filtre de Kalman
Modèles ARCH et GARCH
Modèles autorégressifs vectoriels VAR
Estimation par méthode des moments
généralisée GMM
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• SHAZAM : c’est un logiciel de statistique et
d’économétrie.
• SHAZAM peut accéder en standard à des
données au format texte, CSV ou Excel.
• L’édition Professionnel dispose d’une
connectivité étendue, notamment vers MS
Access et divers DBMS.
• SHAZAM implémente notamment :
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
Régression linéaire
Outils d’analyse des séries temporelles
Tests d’hypothèses et intervalles de confiance
ACP et Analyse en Facteurs
Simulations de Monte-Carlo
Régression non-linéaire
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• SPAD : c’est un logiciel d’analyse des données
et de data mining orienté vers l’analyse
predictive.
• Il peut accéder aux données aux formats
texte, CSV, Excel, SPSS et sous diverses BDD.
• SPAD implémente notamment :
Statistique descriptive univariée et bivariée
ACP, ACM, AFC
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
CAH
ANOVA
Régression linéaire
Régression logistique
Régression PLS
Analyse discriminante et scoring
Réseaux de neurones
• SPAD peut interagir avec Python et R
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• Stata : c’est un logiciel statistique généraliste,
très utilisé dans le monde de la Recherche.
• Il peut accéder aux données aux formats
texte, CSV, Excel et peut lire et écrire au
format SAS xport.
• Stata implémente la plupart des techniques
statistiques disponibles sous les autres
logiciels.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• Statgraphics : c’est un logiciel statistique
généraliste au fonctionnalités avancées.
• Il se distingue notamment par sa version
Mobile qui peut être utilisée sur Pocket PC et
Windows Mobile.
• Il existe également une version Online qui
peut être utilisée à partir d’un browser et qui
permet d’effectuer des analyses statistiques
sur un poste distant.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• STATISTICA : c’est un logiciel statistique
complet implémentant divers outils de
régression, classification, prévision et
d’analyse exploratoire des données.
• STATISTICA peut interagie avec R, ce qui étend
ses possibilités et dispose de fonctionnalités
graphiques avancées.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• Spotfire S+ : c’est une implémentation
commerciale du langage S.
• S+ est très analogue à R, si ce n’est qu’il dispose
d’une interface graphique complète et d’un
support commercial.
• Les versions récentes sont compatibles avec les
packages R.
• Les boîtes à outils dédiés aux essais cliniques et à
l’analyse de Survie justifient souvent son achat.
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• Unistat : c’est un logiciel statistique pouvant
être également utilisé comme add-in Excel.
• Unistat implémente notamment :
Les graphiques statistiques usuels
Tests de Student, de Fisher, de Levene
Tests d’ajustement, de normalité
Tests non-paramétriques
ANOVA
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
Régression linéaire, dont stepwise
Régression non-linéaire
Régression logistique
Modèle de Cox
PCA, CAH, MDS
Analyse discriminante linéaire
Outils d’Analyse de Survie, dont Kaplan-Meier
Outils de Contrôle de la Qualité
Salim Lardjane - Université de Bretagne-Sud
Logiciels commerciaux
• WPS (World Programming System) : c’est un
logiciel statistique analogue à SAS et pouvant
exécuter des programmes SAS.
• Il peut accéder aux données aux formats
texte, Excel, Access, SAS xport, SPSS, XML, et à
diverses BDD.
• Il fonctionne, sous Windows, Linux, Mac,
Solaris.
Salim Lardjane - Université de Bretagne-Sud
Comment choisir ?
• Cela dépend essentiellement des facteurs
suivants :
Le niveau d’analyse requis
Le budget dont on dispose
Le système d’exploitation utilisé
Le temps qu’on est prêt à consacrer à
l’apprentissage du logiciel
Des logiciels utilisés autour de vous
Salim Lardjane - Université de Bretagne-Sud
Références
• Wikipedia
• Sites internet des différents éditeurs ou
développeurs des logiciels
Salim Lardjane - Université de Bretagne-Sud