Cours3 4
Cours3 4
Outils numériques et
informatiques pour la chimie 1. CM1 : Introduction à la science des données, récolte de données
J. Le Roux
Le modèle est utilisé pour effectuer des simulations numériques. Les simulations
sont menées pour étudier l’évolution du système, généralement en fonction du
temps (mais aussi en fonction de l’espace, de la température…).
Critères de différence
Biais moyen
Partie 3 : Modélisation numérique :
Erreur quadratique moyenne
𝐵𝑀 =
1
(𝑦 , −𝑦, )=
1
𝑒
modèles statistiques et déterministes
𝑛 𝑛 1 1
𝐸𝑄𝑀 = (𝑦 , −𝑦, ) = 𝑒
𝑛 𝑛
1. La modélisation numérique
1 (𝑦 , −𝑦, )
𝐵𝑀𝑟𝑒𝑙𝑎𝑡𝑖𝑓 =
𝑛 𝑦, Remarque : donne un poids important aux grandes
Remarque : compensation des erreurs
différences 2. Evaluation des modèles
Erreur absolue moyenne
3. Modélisation statistique
1 1
Racine de l’erreur quadratique moyenne
4. Modélisation déterministe
𝐸𝐴𝑀 = |𝑦 , −𝑦, |= |𝑒 |
𝑛 𝑛
1 𝑦, −𝑦, 1 1
𝐸𝐴𝑀𝑟𝑒𝑙𝑎𝑡𝑖𝑓 = 𝑅𝐸𝑄𝑀 = 𝐸𝑄𝑀 = (𝑦 , −𝑦, ) = 𝑒
𝑛 𝑂 𝑛 𝑛
Remarque : EAM ≥ BM
16
A. Le modèle de régression linéaire simple Exemple : caractéristiques d’un véhicule et émissions atmosphériques de CO2
Objectif : déterminer s’il y a un lien entre certaines
caractéristiques du véhicule et ses émissions en CO2
observations simultanées de
Y : variable à expliquer (ou dépendante) - celle que Données : émission de CO2 + caractéristiques des
X et Y (n données xi et yi,obs)
nous cherchons à expliquer, décrire, prédire véhicules commercialisés en France (marque,
modèle linéaire simple puissance, …) https://www.data.gouv.fr/fr/datasets/em
issions-de-co2-et-de-polluants-des-
X : variable explicative (ou indépendante) - celle vehicules-commercialises-en-france/#_
que nous utilisons dans le but d’expliquer, décrire,
prédire la variable à expliquer yi,obsY
yi,mod a1 (pente)
Ymod = a0 + a1 X
a0
a0 et a1 : paramètres du modèle à optimiser/ajuster - (o.o.)
utilisés dans la / les équations reliant la (ou les)
xi X
variable(s) dépendante(s) aux variables explicatives 0
Exemple : caractéristiques d’un véhicule et émissions atmosphériques de CO2 Exemple : caractéristiques d’un véhicule et émissions atmosphériques de CO2
Objectif : déterminer s’il y a un lien entre certaines Objectif : déterminer s’il y a un lien entre certaines Histogrammes
caractéristiques du véhicule et ses émissions en CO2 caractéristiques du véhicule et ses émissions en CO2
Données : émission de CO2 + caractéristiques des Données : émission de CO2 + caractéristiques des
véhicules commercialisés en France (marque, véhicules commercialisés en France (marque,
puissance, …) https://www.data.gouv.fr/fr/datasets/em puissance, …) https://www.data.gouv.fr/fr/datasets/em
issions-de-co2-et-de-polluants-des- issions-de-co2-et-de-polluants-des-
vehicules-commercialises-en-france/#_ vehicules-commercialises-en-france/#_
1. Etude des observations 1. Etude des observations
- Réflexion sur les variables d’intérêt X pouvant être liées aux - Réflexion sur les variables d’intérêt X pouvant être liées aux
émissions de CO2 émissions de CO2
- Construction et nettoyage de la base de données - Construction et nettoyage de la base de données
- Etude de la distribution des données
{ {
𝜕𝐹 𝑎 , 𝑎 𝜕∑ 𝑎 +𝑎 𝑥 −𝑦,
=2 𝑎 +𝑎 𝑥 −𝑦, =0 𝑛𝑎 + 𝑎 𝑥 = 𝑦,
observée au point i 𝜕𝑎
=
𝜕𝑎
𝑒 =𝑦, −𝑦, X
𝜕𝐹 𝑎 , 𝑎 𝜕∑ 𝑎 +𝑎 𝑥 −𝑦,
=2 𝑎 +𝑎 𝑥 −𝑦, 𝑥 =0 𝑎 𝑥 +𝑎 𝑥 = 𝑥 𝑦,
0 xi 𝜕𝑎 =
𝜕𝑎
Système de 2 équations à 2 inconnues à résoudre
∑ (𝑥 − 𝑥̅ )(𝑦 , − 𝑦 )
𝑎 = 𝑎 =𝑦 − 𝑎 𝑥̅
∑ (𝑥 − 𝑥̅ )
Exemple : caractéristiques d’un véhicule et émissions atmosphériques de CO2 Exemple : caractéristiques d’un véhicule et émissions atmosphériques de CO2
Objectif : déterminer s’il y a un lien entre certaines Objectif : déterminer s’il y a un lien entre certaines
caractéristiques du véhicule et ses émissions en CO2 caractéristiques du véhicule et ses émissions en CO2
Données : émission de CO2 + caractéristiques des Données : émission de CO2 + caractéristiques des
véhicules commercialisés en France (marque, véhicules commercialisés en France (marque,
puissance, …) https://www.data.gouv.fr/fr/datasets/em puissance, …) https://www.data.gouv.fr/fr/datasets/em
issions-de-co2-et-de-polluants-des- issions-de-co2-et-de-polluants-des-
vehicules-commercialises-en-france/#_ vehicules-commercialises-en-france/#_
1. Etude des observations 1. Etude des observations
- Réflexion sur les variables d’intérêt X pouvant être liées aux - Réflexion sur les variables d’intérêt X pouvant être liées aux
émissions de CO2 émissions de CO2
- Construction et nettoyage de la base de données - Construction et nettoyage de la base de données
- Etude de la distribution des données - Etude de la distribution des données
- Recherche de liens entre les émissions de CO2 et les autres - Recherche de liens entre les émissions de CO2 et les autres
variables variables
B. Conception d’un modèle statistique observations (m données i) B. Conception d’un modèle statistique
B. Conception d’un modèle statistique observations (m données i) B. Conception d’un modèle statistique observations (m données i)
Avantages :
- fondés sur des mesures et donc ancrés dans la réalité
- utilisables même quand on ne connait pas la théorie ou les processus mis en jeu
- mise en œuvre relativement simple
Inconvénients :
- lien entre variables non forcement causal
- processus physico-chimiques non traités explicitement
- difficilement extrapolables
2. Développement du modèle
R2
Test de Fisher
H0 : « Les coefficients ai sont nuls,
excepté la constante »
o.o. : a0
pente : a1 Test de t
H0 : « Le coefficient ai est nul »
1. La modélisation numérique
2. Evaluation des modèles
3. Modélisation statistique
4. Modélisation déterministe
A. Le système différentiel d’ordre 1 à n dimensions
Exemple : transformation d’un aldol en solution aqueuse à pH=2 et T=292,5K
avec une variable indépendante (souvent le temps)
N N
(- H2O)
xi(t) : variables (fonctions dérivables) du système évoluant avec le temps - celles O OH O
Exemple : transformation d’un aldol en solution aqueuse à pH=2 et T=292,5K Exemple : transformation d’un aldol en solution aqueuse à pH=2 et T=292,5K
N N 2. Solution analytique N N 2. Solution analytique
O OH
(- H2O) O OH
(- H2O)
O O
𝐴 (𝑡) = 𝐴 (𝑡0) 𝑒
N N N N
(- H2O) (- H2O) 𝐵 𝑡 = 𝐵 𝑡0 + 𝐴 (𝑡0) (1 − 𝑒 ( ))
A B Raulin et Toupance, Bull. A B Raulin et Toupance, Bull.
Soc. Chim. Fr, 1975 Soc. Chim. Fr, 1975
réaction d’ordre 1 en A avec k = 4,32 10-3 s-1 réaction d’ordre 1 en A avec k = 4,32 10-3 s-1
Objectif : déterminer l’évolution temporelle des Objectif : déterminer l’évolution temporelle des
concentrations de A et de B pour les conditions concentrations de A et de B pour les conditions
initiales suivantes : t0=0, [A](t0)=1 M, [B](t0)=0 M initiales suivantes : t0=0, [A](t0)=1 M, [B](t0)=0 M
1. Analyse du système étudié : 1. Analyse du système étudié :
Variables/fonctions : [A]t et [B]t Variables/fonctions : [A]t et [B]t
𝑑[𝐴] 𝑑[𝐵]
𝑑[𝐴] 𝑑[𝐴]
= −𝑘 𝐴 𝑑[𝐴] 𝑑[𝐵] = −𝑘 𝐴
Réaction globale : 𝑣 = − = Réaction globale : 𝑣 = − =
𝑑𝑡 𝑑𝑡 𝑑𝑡 𝑑𝑡 𝑑𝑡 𝑑𝑡
Réaction d’ordre 1 : 𝑣 = 𝑘 𝐴 𝑑[𝐵] Réaction d’ordre 1 : 𝑣 = 𝑘 𝐴 𝑑[𝐵]
=𝑘 𝐴 =𝑘 𝐴
𝑑𝑡 𝑑𝑡
Généralement, la solution analytique n’existe pas et le
système doit être résolu à l’aide d’une méthode numérique
Les méthodes numériques de résolution par différence finie La méthode d’Euler explicite
Souvent basées sur un développement limité de la fonction xi(t) en t : 𝑑𝑥 (𝑡) calcul de la dérivée
𝑥 𝑡 + ∆𝑡 = 𝑥 𝑡 + ∆𝑡 au temps t
𝑑𝑥 (𝑡) ∆𝑡 𝑑 𝑥 (𝑡) 𝑑𝑡 t
𝑥 𝑡 + ∆𝑡 = 𝑥 𝑡 + ∆𝑡 + +⋯
𝑑𝑡 2! 𝑑𝑡 𝑑𝑥 (𝑡)
Exemple : transformation d’un aldol en solution aqueuse à pH=2 et T=292,5K Exemple : transformation d’un aldol en solution aqueuse à pH=2 et T=292,5K
N N 2. Solution analytique N N 2. Solution analytique
O OH
(- H2O) O OH
(- H2O)
O O
𝐴 (𝑡) = 𝐴 (𝑡0) 𝑒 𝐴 (𝑡) = 𝐴 (𝑡0) 𝑒
N N N N
(- H2O) 𝐵 (𝑡) = 𝐵 𝑡0 + 𝐴 (𝑡0) (1 − 𝑒 ( ))
(- H2O) 𝐵 (𝑡) = 𝐵 𝑡0 + 𝐴 (𝑡0) (1 − 𝑒 ( ))
A B Raulin et Toupance, Bull. A B Raulin et Toupance, Bull.
Soc. Chim. Fr, 1975 Soc. Chim. Fr, 1975
3. Solution numérique 3. Solution numérique
réaction d’ordre 1 en A avec k = 4,32 10-3 s-1 réaction d’ordre 1 en A avec k = 4,32 10-3 s-1
Méthode d’Euler explicite Méthode d’Euler explicite
Objectif : déterminer l’évolution temporelle des 𝑑𝑥 (𝑡) Objectif : déterminer l’évolution temporelle des 𝑑𝑥 (𝑡)
concentrations de A et de B pour les conditions 𝑥 𝑡 + ∆𝑡 = 𝑥 𝑡 + ∆𝑡 concentrations de A et de B pour les conditions 𝑥 𝑡 + ∆𝑡 = 𝑥 𝑡 + ∆𝑡
𝑑𝑡 t 𝑑𝑡 t
initiales suivantes : t0=0, [A](t0)=1 M, [B](t0)=0 M initiales suivantes : t0=0, [A](t0)=1 M, [B](t0)=0 M
𝐴 𝑡 + ∆𝑡 = 𝐴 𝑡 + ∆𝑡(−𝑘 𝐴 𝑡 )
1. Analyse du système étudié : 1. Analyse du système étudié : 𝐵 𝑡 + ∆𝑡 = 𝐵 𝑡 + ∆𝑡(𝑘 𝐴 𝑡 )
Variables/fonctions : [A]t et [B]t Variables/fonctions : [A]t et [B]t
𝑑[𝐴] 𝑑[𝐵]
𝑑[𝐴] 𝑑[𝐴]
= −𝑘 𝐴 𝑑[𝐴] 𝑑[𝐵] = −𝑘 𝐴
Réaction globale : 𝑣 = − = Réaction globale : 𝑣 = − =
𝑑𝑡 𝑑𝑡 𝑑𝑡 𝑑𝑡 𝑑𝑡 𝑑𝑡
Réaction d’ordre 1 : 𝑣 = 𝑘 𝐴 𝑑[𝐵] Réaction d’ordre 1 : 𝑣 = 𝑘 𝐴 𝑑[𝐵]
=𝑘 𝐴 =𝑘 𝐴
𝑑𝑡 𝑑𝑡
La méthode de Runge-Kutta d’ordre 2 Exemple : transformation d’un aldol en solution aqueuse à pH=2 et T=292,5K
𝑑𝑥 (𝑡) Dérivée calculée au demi pas de temps N N 2. Solution analytique
𝑥 𝑡 + ∆𝑡 = 𝑥 𝑡 + ∆𝑡 (à t+Dt/2), avec les xi(t+Dt/2) calculés O OH
(- H2O)
O
𝑑𝑡 t+Dt/2 avec la méthode d’Euler explicite 𝐴 (𝑡) = 𝐴 (𝑡0) 𝑒
N N
(- H2O) 𝐵 (𝑡) = 𝐵 𝑡0 + 𝐴 (𝑡0) (1 − 𝑒 ( ))
A B Raulin et Toupance, Bull.
xi(t) 𝑑𝑥 (𝑡) 𝑑𝑥 (𝑡) Schéma itératif Soc. Chim. Fr, 1975
3. Solution numérique
𝑑𝑡 t +Dt/2 𝑑𝑡 t t0 xi(t0) = xi,0 réaction d’ordre 1 en A avec k = 4,32 10-3 s-1
0 1 Méthode d’Euler explicite
xi(t2) Objectif : déterminer l’évolution temporelle des
t1=t0+Dt xi(t1) = xi(t0) + Dt dxi/dt)t0+Dt/2 Méthode de Runge-Kutta ordre 2
concentrations de A et de B pour les conditions
xi(t1+Dt/2) 𝑑𝑥 (𝑡) 𝑑𝑥 (𝑡)
xi(t0+Dt/2) 𝑑𝑡 t1+Dt/2 xi(t0+Dt/2) = xi(t0) + Dt/2 dxi/dt)t0 initiales suivantes : t0=0, [A](t0)=1 M, [B](t0)=0 M 𝑥 𝑡 + ∆𝑡 = 𝑥 𝑡 + ∆𝑡 t+Dt/2
Dt 𝑑𝑡
xi(t1) Dt/2 1. Analyse du système étudié : ∆𝑡 ∆𝑡 𝑑𝑥 (𝑡)
t2=t1+Dt xi(t2) = xi(t1) + Dt dxi/dt)t1+Dt/2 𝑥 𝑡+ =𝑥 𝑡 +
Variables/fonctions : [A]t et [B]t 2 2 𝑑𝑡 t
xi(t0) Dt solution vraie (inconnue) xi(t1+Dt/2) = xi(t1) + Dt/2 dxi/dt)t1 𝑑[𝐴]
conditions initiales 𝑑[𝐴] 𝑑[𝐵] = −𝑘 𝐴
Dt/2 Réaction globale : 𝑣 = − =
… 𝑑𝑡 𝑑𝑡 𝑑𝑡
solution numérique
Réaction d’ordre 1 : 𝑣 = 𝑘 𝐴 𝑑[𝐵]
t tn+1=tn+Dt xi(tn+1) = xi(tn) + Dt dxi/dt)tn+Dt/2 =𝑘 𝐴
t t1 t 𝑑𝑡
2
𝑑𝑥 (𝑡) 0
t xi(tn+Dt/2) = xi(tn) + Dt/2 dxi/dt)tn1
t
𝑑𝑡 t0 0+Dt/2 1+Dt/2
Exemple : transformation d’un aldol en solution aqueuse à pH=2 et T=292,5K Exemple : transformation d’un aldol en solution aqueuse à pH=2 et T=292,5K
2. Solution analytique 2. Solution analytique
𝐴 (𝑡) = 𝐴 (𝑡0) 𝑒 𝐴 (𝑡) = 𝐴 (𝑡0) 𝑒
𝐵 (𝑡) = 𝐵 𝑡0 + 𝐴 (𝑡0) (1 − 𝑒 ( )) 𝐵 (𝑡) = 𝐵 𝑡0 + 𝐴 (𝑡0) (1 − 𝑒 ( ))
3. Evaluation du modèle
Comparer les données simulées à des
observations Si l’évaluation n’est pas acceptable
Les modèles déterministes consistent à relier différentes variables par des équations
mathématiques qui représentent des processus (lois fondamentales, empiriques). Les
processus qui relient ces variables sont donc représentés de façon explicite dans ces équations.
Avantages :
- processus physico-chimiques traités explicitement
- par nature extrapolables
Inconvénients :
- incertitudes associées à la formulation du modèle
- prend peu en compte des variations aléatoires
- souvent lourds à mettre en œuvre