0% ont trouvé ce document utile (0 vote)

52 vues96 pages

Guide sur la réplication logique PostgreSQL

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

52 vues96 pages

Guide sur la réplication logique PostgreSQL

Transféré par

Aymrn ben radha

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Module W5

Réplication logique

DALIBO
L'expertise PostgreSQL

23.06
Table des matières

Sur ce document . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Chers lectrices & lecteurs, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
À propos de DALIBO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
Remerciements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Licence Creative Commons CC‑BY‑NC‑SA . . . . . . . . . . . . . . . . . . . . . . . . . 2
Marques déposées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1/ Réplication logique 5
1.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.1 Au menu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Principes de la réplication logique native . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Réplication physique vs. logique . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2 Quelques termes essentiels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.3 Réplication en streaming . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.4 Granularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.5 Possibilités sur les tables répliquées . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.6 Limitations de la réplication logique . . . . . . . . . . . . . . . . . . . . . . . 14
1.3 Mise en place . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.1 Configurer le serveur origine . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2 Configuration du serveur destination . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.3 Créer une publication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3.4 Souscrire à une publication . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.3.5 Options de la souscription (1/2) . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.3.6 Options de la souscription (2/2) . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.4 Mise en place : exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.4.1 Serveurs et schéma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.4.2 Réplication complète . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.4.3 Configuration du serveur origine (1/2) . . . . . . . . . . . . . . . . . . . . . . 25
1.4.4 Configuration du serveur origine (2/2) . . . . . . . . . . . . . . . . . . . . . . 26
1.4.5 Configuration des 4 serveurs destinations . . . . . . . . . . . . . . . . . . . . 27
1.4.6 Créer une publication complète . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4.7 Souscrire à la publication . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.8 Tests de la réplication complète . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.9 Réplication partielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.4.10 Réplication croisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

iii
DALIBO Formations

1.4.11 Réplication de t3_1 de s1 vers s4 . . . . . . . . . . . . . . . . . . . . . . . . . 32

1.4.12 Réplication de t3_2 de s4 vers s1 . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.4.13 Tests de la réplication croisée . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.5 Administration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.5.1 Processus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.5.2 Synthèse des paramètres (serveur origine) . . . . . . . . . . . . . . . . . . . . 37
1.5.3 Synthèse des paramètres indispensables . . . . . . . . . . . . . . . . . . . . . 38
1.5.4 Synthèse des paramètres utiles . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.5.5 Fichiers (serveur origine) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.5.6 Empêcher les écritures sur un serveur destination . . . . . . . . . . . . . . . . 40
1.5.7 Que faire pour les DDL ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.5.8 Que faire pour les nouvelles tables ? . . . . . . . . . . . . . . . . . . . . . . . 43
1.5.9 Gérer les opérations de maintenance . . . . . . . . . . . . . . . . . . . . . . . 45
1.5.10 Gérer les sauvegardes & restaurations logiques . . . . . . . . . . . . . . . . . 45
1.5.11 Gérer les bascules & les restaurations physiques . . . . . . . . . . . . . . . . . 48
1.6 Supervision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.6.1 Catalogues systèmes ‑ méta‑données . . . . . . . . . . . . . . . . . . . . . . . 50
1.6.2 Vues statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1.6.3 Outils de supervision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
1.7 Migration majeure par réplication logique . . . . . . . . . . . . . . . . . . . . . . . . 57
1.8 Rappel des limitations de la réplication logique native . . . . . . . . . . . . . . . . . . 59
1.9 Outils de réplication logique externe . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
1.9.1 Slony : Carte d’identité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
1.9.2 Slony : Fonctionnalités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
1.9.3 Slony : Technique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
1.9.4 Slony : Points forts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
1.9.5 Slony : Limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
1.9.6 Slony : Utilisations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
1.9.7 Bucardo : Carte d’identité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
1.9.8 Bucardo : Limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
1.10 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
1.10.1 Questions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
1.11 Quiz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
1.12 Travaux pratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
1.12.1 Pré‑requis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
1.12.2 Réplication complète d’une base . . . . . . . . . . . . . . . . . . . . . . . . . 70
1.12.3 Réplication partielle d’une base . . . . . . . . . . . . . . . . . . . . . . . . . . 71
1.12.4 Réplication croisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

iv Réplication logique
DALIBO Formations

1.12.5 Réplication et partitionnement . . . . . . . . . . . . . . . . . . . . . . . . . . 72

1.13 Travaux pratiques (solutions) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
1.13.1 Pré‑requis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
1.13.2 Réplication complète d’une base . . . . . . . . . . . . . . . . . . . . . . . . . 75
1.13.3 Réplication partielle d’une base . . . . . . . . . . . . . . . . . . . . . . . . . . 78
1.13.4 Réplication croisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
1.13.5 Réplication et partitionnement . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Les formations Dalibo 85

Cursus des formations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Les livres blancs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Téléchargement gratuit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

Réplication logique v
DALIBO Formations

Sur ce document

Formation Module W5
Titre Réplication logique
Révision 23.06
PDF [Link]
EPUB [Link]
HTML [Link]
Slides [Link]

Vous trouverez en ligne les différentes versions complètes de ce document.

Chers lectrices & lecteurs,

Nos formations PostgreSQL sont issues de nombreuses années d’études, d’expérience de terrain et
de passion pour les logiciels libres. Pour Dalibo, l’utilisation de PostgreSQL n’est pas une marque
d’opportunisme commercial, mais l’expression d’un engagement de longue date. Le choix de l’Open
Source est aussi le choix de l’implication dans la communauté du logiciel.
Au‑delà du contenu technique en lui‑même, notre intention est de transmettre les valeurs qui animent
et unissent les développeurs de PostgreSQL depuis toujours : partage, ouverture, transparence, créati‑
vité, dynamisme… Le but premier de nos formations est de vous aider à mieux exploiter toute la puis‑
sance de PostgreSQL mais nous espérons également qu’elles vous inciteront à devenir un membre
actif de la communauté en partageant à votre tour le savoir‑faire que vous aurez acquis avec nous.
Nous mettons un point d’honneur à maintenir nos manuels à jour, avec des informations précises et
des exemples détaillés. Toutefois malgré nos efforts et nos multiples relectures, il est probable que ce
document contienne des oublis, des coquilles, des imprécisions ou des erreurs. Si vous constatez un
souci, n’hésitez pas à le signaler via l’adresse [email protected] !

À propos de DALIBO

DALIBO est le spécialiste français de PostgreSQL. Nous proposons du support, de la formation et du

conseil depuis 2005.
Retrouvez toutes nos formations sur [Link]
1
[Link]

Réplication logique 1
DALIBO Formations

Remerciements

Ce manuel de formation est une aventure collective qui se transmet au sein de notre société depuis
des années. Nous remercions chaleureusement ici toutes les personnes qui ont contribué directement
ou indirectement à cet ouvrage, notamment :

Jean‑Paul Argudo, Alexandre Anriot, Carole Arnaud, Alexandre Baron, David Bidoc, Sharon Bonan,
Franck Boudehen, Arnaud Bruniquel, Damien Clochard, Christophe Courtois, Marc Cousin, Gilles Da‑
rold, Jehan‑Guillaume de Rorthais, Ronan Dunklau, Vik Fearing, Stefan Fercot, Pierre Giraud, Nicolas
Gollet, Dimitri Fontaine, Florent Jardin, Virginie Jourdan, Luc Lamarle, Denis Laxalde, Guillaume Le‑
large, Alain Lesage, Benoit Lobréau, Jean‑Louis Louër, Thibaut Madelaine, Adrien Nayrat, Alexandre
Pereira, Flavie Perette, Robin Portigliatti, Thomas Reiss, Maël Rimbault, Julien Rouhaud, Stéphane
Schildknecht, Julien Tachoires, Nicolas Thauvin, Be Hai Tran, Christophe Truffier, Cédric Villemain,
Thibaud Walkowiak, Frédéric Yhuel.

Licence Creative Commons CC‑BY‑NC‑SA

Cette formation est sous licence CC‑BY‑NC‑SA2 . Vous êtes libre de la redistribuer et/ou modifier aux
conditions suivantes :

– Paternité
– Pas d’utilisation commerciale
– Partage des conditions initiales à l’identique

Vous n’avez pas le droit d’utiliser cette création à des fins commerciales.

Si vous modifiez, transformez ou adaptez cette création, vous n’avez le droit de distribuer la création
qui en résulte que sous un contrat identique à celui‑ci.

Vous devez citer le nom de l’auteur original de la manière indiquée par l’auteur de l’œuvre ou le ti‑
tulaire des droits qui vous confère cette autorisation (mais pas d’une manière qui suggérerait qu’ils
vous soutiennent ou approuvent votre utilisation de l’œuvre). À chaque réutilisation ou distribution
de cette création, vous devez faire apparaître clairement au public les conditions contractuelles de
sa mise à disposition. La meilleure manière de les indiquer est un lien vers cette page web. Chacune
de ces conditions peut être levée si vous obtenez l’autorisation du titulaire des droits sur cette œuvre.
Rien dans ce contrat ne diminue ou ne restreint le droit moral de l’auteur ou des auteurs.

Le texte complet de la licence est disponible sur [Link]

/fr/legalcode

Cela inclut les diapositives, les manuels eux‑mêmes et les travaux pratiques.
2
[Link]

2 Réplication logique
DALIBO Formations

Cette formation peut également contenir quelques images dont la redistribution est soumise à des
licences différentes qui sont alors précisées.

Marques déposées

PostgreSQL® Postgres® et le logo Slonik sont des marques déposées3 par PostgreSQL Community As‑
sociation of Canada.

3
[Link]

Réplication logique 3
1/ Réplication logique

5
DALIBO Formations

1.1 OBJECTIFS

® – Réplication logique native

– connaître les avantages et limites

– savoir la mettre en place
– savoir l’administrer et la superviser

– Connaître d’autres outils de réplication logique

La réplication logique a été ajoutée dans PostgreSQL depuis la version 10, et est améliorée régulière‑
ment à chaque version.

Nous verrons ici les principes derrière ce type de réplication, sa mise en place, son administration et
sa supervision.

Historiquement sont apparus des outils de réplication logique externes à PostgreSQL, qui peuvent
encore rendre des services.

1.1.1 Au menu

® – Principes
– Mise en place
– Exemple
– Administration
– Supervision
– Migration majeure avec la réplication logique
– Limitations
– Autres outils de réplication logique

6 Réplication logique
DALIBO Formations

1.2 PRINCIPES DE LA RÉPLICATION LOGIQUE NATIVE

® – Réplication logique

– résout certaines des limitations de la réplication physique

– native depuis la version 10
– avant v10 : solutions externes

La réplication physique, qui existe dans PostgreSQL depuis la version 9.0, fonctionne par application
de bloc d’octets ou de delta de bloc. Elle a beaucoup évolué mais possède quelques limitations diffi‑
cilement contournables directement.

La réplication logique apporte des réponses à ces limitations. Seules des solutions tierces apportaient
ce type de réplication à PostgreSQL.

1.2.1 Réplication physique vs. logique

Physique Logique

Instance complète Tables aux choix

Par bloc Par ligne
Asymétrique (1 principal) Asymétrique / croisée
Toutes opérations Opération au choix
Réplica identique Destination modifiable
Même architecture ‑
Mêmes versions majeures ‑
Synchrone/Asynchrone Synchrone/Asynchrone

Principe & limites de la réplication physique :

La réplication physique est une réplication au niveau bloc. Le serveur primaire envoie au secondaire
les octets à ajouter/remplacer dans des fichiers. Le serveur secondaire n’a aucune information sur les

Réplication logique 7
DALIBO Formations

objets logiques (tables, index, vues matérialisées, bases de données). Il n’y a donc pas de granularité
possible, c’est forcément l’instance complète qui est répliquée. Cette réplication est par défaut en
asynchrone mais il est possible de la configurer en synchrone suivant différents modes.

Malgré ses nombreux avantages, la réplication physique souffre de quelques défauts.

Il est impossible de ne répliquer que certaines bases ou que certaines tables (pour ne pas répliquer
des tables de travail par exemple). Il est aussi impossible de créer des index spécifiques ou même des
tables de travail, y compris temporaires, sur les serveurs secondaires, vu qu’ils sont strictement en
lecture seule.

Un serveur secondaire ne peut se connecter qu’à un serveur primaire de même version majeure. On ne
peut donc pas se servir de la réplication physique pour mettre à jour la version majeure du serveur.

Enfin, il n’est pas possible de faire de la réplication entre des serveurs d’architectures matérielles ou
logicielles différentes (32/64 bits, little/big endian, version de bibliothèque C, etc.).

Réplication logique :

La réplication logique propose une solution à tous ces problèmes.

La réplication logique est une réplication du contenu des tables. Plus précisément, elle réplique les ré‑
sultats des ordres SQL exécutés sur la table publiée et l’applique sur la table cible. Les lignes insérées,
modifiées et/supprimées sur le serveur d’origine sont répliquées sur la destination. La table cible peut
être modifiée (index notamment), et son contenu différer de la table source.

Elle se paramètre donc table par table, et même opération par opération.

Elle est asymétrique dans le sens où il existe une seule origine des écritures pour une table. Si elle ne
permet pas un vrai fonctionnement multi‑maîtres, il est possible de réaliser des réplications croisées
où un ensemble de tables est répliqué du serveur 1 vers le serveur 2 et un autre ensemble de tables
est répliqué du serveur 2 vers le serveur 1.

Comme la réplication physique, la réplication logique peut fonctionner en asynchrone ou en syn‑

chrone, si l’on accepte l’impact sur les performances.

La réplication logique permet de répliquer entre deux serveurs PostgreSQL de versions différentes, et
ainsi de procéder à des migrations majeures.

8 Réplication logique
DALIBO Formations

1.2.2 Quelques termes essentiels

® – Serveur origine (publieur/éditeur)

– publication

– Serveur(s) abonné(s) (subscriber)

– souscription (abonnement)

Dans le cadre de la réplication logique, on ne réplique pas une instance vers une autre. On publie
les modifications effectuées sur le contenu d’une table à partir d’un serveur. Ce serveur est le ser‑
veur origine, ou publieur (publisher). De lui sont enregistrées les modifications que d’autres serveurs
pourront récupérer en s’abonnant (subscription) . Ces serveurs abonnés indiquent leur intérêt sur ces
modifications en s’abonnant à la publication.

De ceci, il découle que :

– le serveur origine est le serveur où les écritures sur une table sont enregistrées pour publication
vers d’autres serveurs ;
– les serveurs intéressés par ces enregistrements sont les serveurs destinations ;
– un serveur origine doit proposer une publication des modifications ;
– les serveurs destinations intéressés doivent s’abonner à une publication.

Dans un cluster de réplication, un serveur peut avoir un rôle de serveur origine ou de serveur destina‑
tion. Il peut aussi avoir les deux rôles. Dans ce cas, il sera origine pour certaines tables et destinations
pour d’autres. Il ne peut pas être à la fois origine et destination pour la même table.

NB : dans le texte qui suit, peuvent être utilisés indifféremment les termes publieur/éditeur/origine
d’une part, et abonné/souscripteur/destination et abonnement/souscription d’autre part.

Réplication logique 9
DALIBO Formations

1.2.3 Réplication en streaming

® – Paramètre wal_level
– Processus wal sender

– mais pas de wal receiver

– un logical replication worker à la place

– Asynchrone / synchrone
– Slots de réplication

La réplication logique utilise le même canal d’informations que la réplication physique : les en‑
registrements des journaux de transactions. Pour que les journaux disposent de suffisamment
d’informations, le paramètre wal_level doit être configuré avec la valeur logical.

Une fois cette configuration effectuée et PostgreSQL redémarré sur le serveur origine, le serveur desti‑
nation pourra se connecter au serveur origine dans le cadre de la réplication. Lorsque cette connexion
est faite, un processus wal sender apparaîtra sur le serveur origine. Ce processus sera en commu‑
nication avec un processus logical replication worker sur le serveur destination.

Comme la réplication physique, la réplication logique peut être configurée en asynchrone

comme en synchrone, suivant le même paramétrage (synchronous_commit, synchro-
nous_standby_names).

Chaque abonné maintient un slot de réplication sur l’instance de l’éditeur. Par défaut, il est créé et
supprimé automatiquement avec la souscription. La copie initiale des données crée également des
slots de réplication temporaires.

10 Réplication logique
DALIBO Formations

1.2.4 Granularité

® – Par table

– toutes les tables d’une base

– toutes les tables d’un schéma (v15+)
– quelques tables spécifiques

– Granularité d’une table

– table complète
– uniquement certaines lignes (v15+)
– uniquement certaines colonnes (v15+)

– Par opération

– INSERT, UPDATE, DELETE, TRUNCATE (v11)

La granularité de la réplication physique est simple : c’est l’intégralité de l’instance ou rien.

À l’inverse, la réplication logique propose une granularité à la table près, voire même un niveau en des‑
sous. Une publication se crée en indiquant la table pour laquelle on souhaite publier les modifications.
On peut en indiquer plusieurs. On peut en ajouter après en modifiant la publication. Cependant, une
nouvelle table ne sera pas ajoutée automatiquement à la publication, sauf dans deux cas précis : la
publication a été créée en demandant la publication de toutes les tables (clause FOR ALL TABLES)
ou, à partir de la version 15, la publication a été créée en demandant la publication de toutes les tables
d’un schéma (clause FOR TABLES IN SCHEMA).
À partir de la version 13, il est possible d’ajouter une table partitionnée à une publication. Cette fonc‑
tionnalité permet de laisser à PostgreSQL le soin d’ajouter et maintenir à jour la liste des partitions
dans la publication. Il est également possible de faire en sorte que les modifications soient publiées
avec le nom de la partition finale ou celui de la table partitionnée. Cela permet plus de flexibilité en
autorisant de répliquer des données entre des tables avec des structures hétérogènes (partitionnées
ou non). Dans le cas d’une réplication depuis une table partitionnée vers une autre table partitionnée,
l’agencement des partitions peut être différent.
À partir de la version 15, la granularité est encore plus basse. Il est possible de ne filtrer que certaines
colonnes et que certaines lignes.
La granularité peut aussi se voir au niveau des opérations de modification réalisées. On peut très bien

Réplication logique 11
DALIBO Formations

ne publier que les opérations d’insertion, de modification ou de suppression. Par défaut, tout est pu‑
blié. La réplication de la commande TRUNCATE n’a été ajoutée qu’à partir de la version 11.

1.2.5 Possibilités sur les tables répliquées

® – Possibilités

– index supplémentaires
– modification des valeurs
– colonnes supplémentaires
– triggers également activables sur la table répliquée

– Attention à la cohérence des modèles

– Attention à ne pas bloquer la réplication logique !

– aller au plus simple

La réplication logique permet plusieurs choses impensables en réplication physique. Les cas
d’utilisation sont en fait très différents.

On peut rajouter ou supprimer des index sur la table répliquée, pourvu que les lignes restent identi‑
fiables. Au besoin on peut préciser l’index, qui doit être unique sur colonne NOT NULL servant de
clé :

ALTER TABLE nomtable REPLICA IDENTITY USING INDEX nomtable_col_idx;

Il est possible de modifier des valeurs dans la table répliquée. Ces modifications sont susceptibles
d’être écrasées par des modifications de la table source sur les mêmes lignes. Il est aussi possible de
perdre la synchronisation entre les tables, notamment si on modifie la clé primaire.

Les triggers ne se déclenchent par défaut que sur la base d’origine. On peut activer ainsi un trigger sur
la table répliquée :

ALTER TABLE matable ENABLE REPLICA TRIGGER nom_trigger ;

Tout cela est parfois très pratique mais peut poser de sérieux problème de cohérence de données
entre les deux instances si l’on ne fait pas attention. On vérifiera régulièrement les erreurs dans les
traces.

12 Réplication logique
DALIBO Formations

Il est dangereux d’ajouter sur la destination des contraintes qui n’existent pas sur les
Á tables d’origine ! Elles ne sont pas forcément contrôlées à l’arrivée (clés étrangères, véri‑
fication par triggers…) Et si elles le sont, elles risquent de bloquer la réplication logique.
De même, sur la destination, ajouter ou modifier des lignes soumises à des contraintes
d’unicité peut empêcher l’insertion de lignes provenant de la source.

En cas de blocage, à cause d’une colonne absente, d’un doublon, d’une autre contrainte
Á sur la cible ou pour une autre raison, il faut corriger sur la destination, puis laisser le
stock de données bloquées s’insérer avant de pouvoir faire autre chose. L’alternative
est de désactiver ou reconstruire la réplication, ce qui peut poser des problèmes de ré‑
conciliation de données.

Il existe quelques cas surprenants. Par exemple, une colonne remplie grâce à une valeur DEFAULT sur
l’origine sera répliquée à l’identique sur la destination ; mais une colonne calculée (clause GENERA-
TED avec expression) sera calculée sur l’origine et sur la destination, éventuellement différemment.

Pour que la réplication logique fonctionne sans souci, il faut viser au plus simple, avec
b un modèle de données sur la destination aussi proche que possible de la source, soi‑
gneusement maintenu à jour à l’identique. Éviter de modifier les données répliquées.
Au plus, se contenter d’ajouter sur la destination des index non uniques ou des colonnes
calculées.
Prévoir dès le début le cas où cette réplication devra être arrêtée et reprise de zéro.

Réplication logique 13
DALIBO Formations

1.2.6 Limitations de la réplication logique

® – Pas de réplication des requêtes DDL

– à refaire manuellement
– être rigoureux et surveiller les traces !

– Pas de TRUNCATE en v10

– Pas de réplication des valeurs des séquences
– Pas de réplication des LO (table système)
– Contraintes d’unicité obligatoires pour les UPDATE/DELETE
– Coût en CPU et I/O non négligeable
– Réplication déclenchée uniquement lors du COMMIT (< v14)
– Attention en cas de bascule/restauration !

La réplication logique n’a pas que des atouts, elle a aussi ses propres limitations.

La première, et plus importante, est qu’elle ne réplique que les changements de données des tables
(commandes DML), et pas de la définition des objets de la base de données (commandes DDL). L’ajout
(ou la suppression) d’une colonne ne sera pas répliqué, causant de ce fait un problème de réplication
quand l’utilisateur y ajoutera des données. La mise à jour sera bloquée jusqu’à ce que les tables abon‑
nées soient aussi mises à jour.

D’autres opérations moins évidentes peuvent aussi poser problème, comme une contrainte ou un
index supprimé sur l’origine mais pas la cible ; ou un index fonctionnel dont la fonction n’est corrigée
que sur la source. Il faut être rigoureux et surveiller les erreurs dans les traces.

Une table nouvellement créée ne sera pas non plus automatiquement répliquée.

Le TRUNCATE n’est pas répliqué en version 10, mais il l’est bien à partir de la version 11.

Il n’y a pas non plus de réplication des valeurs des séquences. Les valeurs des séquences sur les ser‑
veurs destinations seront donc obsolètes.

Les Large Objects étant stockés dans une table système, ils ne sont pas pris en compte par la réplica‑
tion logique.

Les opérations UPDATE et DELETE nécessitent la présence d’une contrainte unique pour s’assurer de
modifier ou supprimer les bonnes lignes. Une clé primaire est conseillée de toute manière pour bien
identifier les lignes.

14 Réplication logique
DALIBO Formations

La réplication logique a un coût en CPU (sur les deux instances concernées) relativement important :
attention aux petites configurations. Il y a également un coût en disque (voir plus bas).

La situation peut devenir compliquée lors d’une restauration ou bascule d’un des serveurs impliqués
(voir plus bas).

Réplication logique 15
DALIBO Formations

1.3 MISE EN PLACE

® – Cas simple

– 2 serveurs
– une seule origine
– un seul destinataire
– une seule publication

– Plusieurs étapes

– configuration du serveur origine

– configuration du serveur destination
– création d’une publication
– ajout d’une souscription

Dans cette partie, nous allons aborder un cas simple avec uniquement deux serveurs. Le premier
sera l’origine, le second sera le destinataire des informations de réplication. Toujours pour simplifier
l’explication, il n’y aura pour l’instant qu’une seule publication.

La mise en place de la réplication logique consiste en plusieurs étapes :

– la configuration du serveur origine ;

– la configuration du serveur destination ;
– la création d’une publication ;
– la souscription à une publication.

Nous allons voir maintenant ces différents points.

16 Réplication logique
DALIBO Formations

1.3.1 Configurer le serveur origine

® – Création et configuration de l’utilisateur de réplication

– et lui donner les droits de lecture des tables à répliquer

– Configuration du fichier [Link]

– wal_level = logical
– logical_decoding_work_mem = 64MB (v13+)

– Configuration du fichier pg_hba.conf

– autoriser une connexion de réplication du serveur destination

Dans le cadre de la réplication avec PostgreSQL, c’est toujours le serveur destination qui se connecte
au serveur origine. Pour la réplication physique, on utilise plutôt les termes de serveur primaire et de
serveur secondaire mais c’est toujours du secondaire vers le primaire, de l’abonné vers l’éditeur.

Tout comme pour la réplication physique, il est nécessaire de disposer d’un utilisateur PostgreSQL
capable de se connecter au serveur origine et capable d’initier une connexion de réplication. Voici
donc la requête pour créer ce rôle :

CREATE ROLE logrepli LOGIN REPLICATION;

Cet utilisateur doit pouvoir lire le contenu des tables répliquées. Il lui faut donc le droit SELECT sur
ces objets :

GRANT SELECT ON ALL TABLES IN SCHEMA public TO logrepli;

Les journaux de transactions doivent disposer de suffisamment d’informations pour que le wal
sender puisse envoyer les bonnes informations au logical replication worker. Pour cela,
il faut configurer le paramètre wal_level à logical dans le fichier [Link].

La réplication logique, contrairement à la réplication physique, n’est déclenchée que lors d’un COM-
MIT (voir cet article1 ). Par défaut, il n’y a pas d’envoi des données tant que la transaction est en cours,
ce qui peut ajouter beaucoup de délai de réplication pour les transactions longues.

Le paramètre logical_decoding_work_mem contrôle la quantité de mémoire allouée à un

processus walsender pour conserver les modifications en mémoire avant de les stocker sur le
1
[Link]

Réplication logique 17
DALIBO Formations

disque. Avant PostgreSQL version 13 et l’apparition de ce paramètre, les modifications d’une tran‑
saction étaient stockées en mémoire jusqu’à ce que la transaction soit validée par un COMMIT. En
conséquence, si cette transaction possédait de nombreuses sous‑transactions, chaque walsender
pouvait allouer énormément de mémoire, menant parfois à un dépassement de mémoire. Avec
ce paramètre, il est possible de diminuer sa valeur pour réduire l’utilisation de la mémoire des
walsender ou définir une valeur plus élevée pour réduire les écritures sur le disque. La valeur par
défaut est de 64 Mo.

Enfin, la connexion du serveur destination doit être possible sur le serveur origine. Il est donc néces‑
saire d’avoir une ligne du style :

host base_publication logrepli [Link]/XX scram-sha-256

en remplaçant [Link]/XX par l’adresse CIDR du serveur destination. La méthode

d’authentification peut aussi être changée suivant la politique interne. Suivant la méthode
d’authentification, il sera nécessaire ou pas de configurer un mot de passe pour cet utilisateur.

Si le paramètre wal_level a été modifié, il est nécessaire de redémarrer le serveur PostgreSQL. Si

seul le fichier pg_hba.conf a été modifié, seul un rechargement de la configuration est demandé.

1.3.2 Configuration du serveur destination

® – Création de l’utilisateur de réplication

– Création, si nécessaire, des tables répliquées

pg_dump -h origine -s -t la_table la_base | psql la_base

– Souscription

CREATE SUBSCRIPTION ... PUBLICATION pub WITH (streaming = on);

Sur le serveur destination, il n’y a pas de configuration à réaliser dans les fichiers [Link]
et pg_hba.conf.

Ensuite, il faut récupérer la définition des objets répliqués pour les créer sur le serveur de destination.
Un moyen simple est d’utiliser pg_dump et d’envoyer le résultat directement à psql pour restaurer
immédiatement les objets. Cela se fait ainsi :

pg_dump -h origine --schema-only base | psql base

18 Réplication logique
DALIBO Formations

Il est aussi possible de sauvegarder la définition d’une seule table en ajoutant l’option -t suivi du nom
de la table pour avoir son script.

Il est conseillé de déclarer l’objet sur la destination avec la même définition que sur l’origine, mais
ce n’est pas obligatoire tant que les mises à jour arrivent à sa faire. Les index, notamment, peuvent
différer, des types être plus laxistes, des colonnes supplémentaires ajoutées.

Avant la version 14, le walsender attendait toujours le COMMIT avant d’envoyer une transaction
aux abonnés, et de grosses transactions pouvaient entraîner l’apparition d’énormes fichiers dans le
répertoire pg_replslot du serveur d’origine. Depuis la version 14, cela reste le comportement par
défaut, mais il est possible de forcer l’envoi des données au serveur destinataire sans attendre le COM-
MIT. Le serveur distant stockera les données dans un fichier et ne les rejouera qu’à partir du moment
où le COMMIT est reçu.

Cette fonctionnalité doit s’activer explicitement au niveau de la souscription :

CREATE SUBSCRIPTION sub_stream

CONNECTION 'connection string'
PUBLICATION pub WITH (streaming = on);

ALTER SUBSCRIPTION sub_stream SET (streaming = on);

1.3.3 Créer une publication

® CREATE PUBLICATION nom

[ FOR TABLE [ ONLY ] nom_table [ * ] [ ( nom_colonne [, ... ] ) ] [
↪ WHERE ( expression ) ] [, ...] |
FOR TABLES IN SCHEMA nom_schema [ * ] [, ...] |
FOR ALL TABLES ]
[ WITH ( parametre_publication [= valeur] [, ... ] ) ]

– parametre_publication = publish

– insert, update, delete, et/ou truncate

– tous par défaut

– parametre_publication = publish_via_partition_root

Une fois que les tables sont définies des deux côtés (origine et destination), il faut créer une publi‑
cation sur le serveur origine. Cette publication indiquera à PostgreSQL les tables répliquées et les

Réplication logique 19
DALIBO Formations

opérations concernées.

La clause FOR ALL TABLES permet de répliquer toutes les tables de la base, sans avoir à les nommer
spécifiquement. De plus, toute nouvelle table sera répliquée automatiquement dès sa création.

À partir de la version 15, la clause FOR TABLES IN SCHEMA permet de répliquer toutes les tables
du schéma indiqué sans avoir à nommer les tables spécifiquement. De plus, toute nouvelle table de
ce schéma sera répliquée automatiquement dès sa création.

Si on ne souhaite répliquer qu’un sous‑ensemble, il faut spécifier toutes les tables à répliquer en uti‑
lisant la clause FOR TABLE et en séparant les noms des tables par des virgules.

Depuis la version 15, il est possible de ne répliquer que certaines colonnes d’une table. Dans ce cas, il
faut indiquer les colonnes en question. En voici un exemple :

CREATE PUBLICATION pub1

FOR TABLE t1 (c1, c3);

Toujours depuis cette version, il est possible de ne répliquer que les lignes validant une certaine ex‑
pression. Par exemple :

CREATE PUBLICATION pub_brest

FOR TABLE employes WHERE (ville='Brest');

Par défaut, une table est répliquée intégralement, donc toutes les colonnes et toutes les lignes.

Cette publication est concernée par défaut par toutes les opérations d’écriture (INSERT, UPDATE,
DELETE, TRUNCATE). Cependant, il est possible de préciser les opérations si on ne les souhaite pas
toutes. Pour cela, il faut utiliser le paramètre de publication publish en utilisant les valeurs insert,
update, delete et/ou truncate et en les séparant par des virgules si on en indique plusieurs.

Lorsque l’on publie les modifications sur une table partitionnée, PostgreSQL utilise par défaut le nom
de la partition finale. Il est possible de lui demander d’utiliser le nom de la table partitionnée grâce
à l’option publish_via_partition_root = true. Cela permet de répliquer d’une table par‑
titionnée vers une table normale ou une table partitionnée avec un agencement de partitions diffé‑
rent.

20 Réplication logique
DALIBO Formations

1.3.4 Souscrire à une publication

® CREATE SUBSCRIPTION nom

CONNECTION 'infos_connexion'
PUBLICATION nom_publication [, ...]
[ WITH ( parametre_souscription [= value] [, ... ] ) ]

– infos_connexion : chaîne de connexion habituelle

Une fois la publication créée, le serveur destination doit s’y abonner. Il doit pour cela indiquer sur quel
serveur se connecter et à quel publication souscrire.

Le serveur s’indique avec la chaîne infos_connexion, dont la syntaxe est la syntaxe habituelle des
chaînes de connexion. Pour rappel, on utilise les mots clés host, port, user, password, dbname,
etc.

Le champ nom_publication doit être remplacé par le nom de la publication créée précédemment
sur le serveur origine.

Les paramètres de souscription sont détaillés dans la slide suivante.

Réplication logique 21
DALIBO Formations

1.3.5 Options de la souscription (1/2)

® – copy_data

– copie initiale des données (activé par défaut)

– create_slot

– création du slot de réplication (activé par défaut)

– enabled

– activation immédiate de la souscription (activé par défaut)

– slot_name

– nom du slot (par défaut : nom de la souscription)

– synchronous_commit

– surcharge synchronous_commit

– binary (désactivé par défaut, v14+)

– envoie les données sous un format binaire (désactivé par défaut)

Les options de souscription sont assez nombreuses et permettent de créer une souscription pour des
cas particuliers. Par exemple, si le serveur destination possède déjà les données du serveur origine, il
faut placer le paramètre copy_data à la valeur off.

22 Réplication logique
DALIBO Formations

1.3.6 Options de la souscription (2/2)

® – connect

– connexion immédiate (activé par défaut)

– streaming (désactivé par défaut, v14+)

– pour envoyer les modifications des transactions en flux

– two_phase (désactivé par défaut, v15+)

– activation de la validation en deux phases

– disable_on_error (désactivé par défaut, v15+)

– désactivation de la souscription en cas d’erreurs détectées

Réplication logique 23
DALIBO Formations

1.4 MISE EN PLACE : EXEMPLE

® – Réplication complète d’une base

– Réplication partielle d’une base
– Réplication croisée

Pour rendre la mise en place plus concrète, voici trois exemples de mise en place de la réplication
logique. On commence par une réplication complète d’une base, qui permettrait notamment de faire
une montée de version. On continue avec une réplication partielle, ne prenant en compte que 2 des 3
tables de la base. Et on finit par une réplication croisée sur la table partitionnée.

1.4.1 Serveurs et schéma

® – 4 serveurs

– s1, [Link] : origine de toutes les réplications, et destination de la répli‑

cation croisée
– s2, [Link] : destination de la réplication complète
– s3, [Link] : destination de la réplication partielle
– s4, [Link] : origine et destination de la réplication croisée

– Schéma

– 2 tables ordinaires
– 1 table partitionnée, avec trois partitions

Voici le schéma de la base d’exemple, b1 :

CREATE TABLE t1 (id_t1 serial, label_t1 text);

CREATE TABLE t2 (id_t2 serial, label_t2 text);

CREATE TABLE t3 (id_t3 serial, label_t3 text, clepartition_t3 integer)

PARTITION BY LIST (clepartition_t3);

24 Réplication logique
DALIBO Formations

CREATE TABLE t3_1 PARTITION OF t3 FOR VALUES IN (1);

CREATE TABLE t3_2 PARTITION OF t3 FOR VALUES IN (2);
CREATE TABLE t3_3 PARTITION OF t3 FOR VALUES IN (3);

INSERT INTO t1 SELECT i, 't1, ligne '||i FROM generate_series(1, 100) i;

INSERT INTO t2 SELECT i, 't2, ligne '||i FROM generate_series(1, 1000) i;
INSERT INTO t3 SELECT i, 't3, ligne '||i, 1 FROM generate_series( 1, 100) i;
INSERT INTO t3 SELECT i, 't3, ligne '||i, 2 FROM generate_series(101, 300) i;
INSERT INTO t3 SELECT i, 't3, ligne '||i, 3 FROM generate_series(301, 600) i;

ALTER TABLE t1 ADD PRIMARY KEY(id_t1);

ALTER TABLE t2 ADD PRIMARY KEY(id_t2);
ALTER TABLE t3 ADD PRIMARY KEY(id_t3, clepartition_t3);

1.4.2 Réplication complète

® – Configuration du serveur origine

– Configuration du serveur destination
– Création de la publication
– Ajout de la souscription

Pour ce premier exemple, nous allons détailler les quatre étapes nécessaires.

1.4.3 Configuration du serveur origine (1/2)

® – Création et configuration de l’utilisateur de réplication

CREATE ROLE logrepli LOGIN REPLICATION;

GRANT SELECT ON ALL TABLES IN SCHEMA public TO logrepli;

– Fichier [Link]

wal_level = logical

Réplication logique 25
DALIBO Formations

La configuration du serveur d’origine commence par la création du rôle de réplication. On lui donne
ensuite les droits sur toutes les tables. Ici, la commande ne s’occupe que des tables du schéma pu-
blic, étant donné que nous n’avons que ce schéma. Dans le cas où la base dispose d’autres schémas,
il serait nécessaire d’ajouter les ordres SQL pour ces schémas.

Les fichiers [Link] et pg_hba.conf sont modifiés pour y ajouter la configuration né‑
cessaire.

1.4.4 Configuration du serveur origine (2/2)

® – Fichier pg_hba.conf

host b1 logrepli [Link]/24 trust

– Redémarrer le serveur origine

– Attention, dans la vraie vie, ne pas utiliser trust

– et utiliser le fichier .pgpass

Comme dit précédemment, les fichiers [Link] et pg_hba.conf sont modifiés pour
y ajouter la configuration nécessaire. Le serveur PostgreSQL du serveur d’origine est alors redémarré
pour qu’il prenne en compte cette nouvelle configuration.

Il est important de répéter que la méthode d’authentification trust ne devrait jamais être utilisée
en production. Elle n’est utilisée ici que pour se faciliter la vie.

26 Réplication logique
DALIBO Formations

1.4.5 Configuration des 4 serveurs destinations

® – Création de l’utilisateur de réplication

CREATE ROLE logrepli LOGIN REPLICATION;

– Création des tables répliquées (sans contenu)

createdb -h s2 b1
pg_dump -h s1 -s b1 | psql -h s2 b1

Pour cet exemple, nous ne devrions configurer que le serveur s2 mais tant qu’à y être, autant le faire
pour les quatre serveurs destinations.

La configuration consiste en la création de l’utilisateur de réplication. Puis, nous utilisons pg_dump

pour récupérer la définition de tous les objets grâce à l’option -s (ou --schema-only). Ces ordres
SQL sont passés à psql pour qu’il les intègre dans la base b1 du serveur s2.

1.4.6 Créer une publication complète

® – Création d’une publication de toutes les tables de la base b1 sur le serveur origine
s1

CREATE PUBLICATION publi_complete

FOR ALL TABLES;

On utilise la clause ALL TABLES pour une réplication complète d’une base.

Réplication logique 27
DALIBO Formations

1.4.7 Souscrire à la publication

® – Souscrire sur s2 à la publication de s1

CREATE SUBSCRIPTION subscr_complete

CONNECTION 'host=[Link] user=logrepli dbname=b1'
PUBLICATION publi_complete;

– Un slot de réplication est créé

– Les données initiales sont immédiatement transférées

Maintenant que le serveur s1 est capable de publier les informations de réplication, le serveur inté‑
ressé doit s’y abonner. Lors de la création de la souscription, il doit préciser comment se connecter
au serveur origine et le nom de la publication.

La création de la souscription ajoute immédiatement un slot de réplication sur le serveur origine.

Les données initiales de la table t1 sont envoyées du serveur s1 vers le serveur s2.

1.4.8 Tests de la réplication complète

® – Insertion, modification, suppression sur les différentes tables de s1

– Vérifications sur s2

– toutes doivent avoir les mêmes données entre s1 et s2

Toute opération d’écriture sur la table t1 du serveur s1 doit être répliquée sur le serveur s2.

Sur le serveur s1 :

b1=# INSERT INTO t1 VALUES (101, 't1, ligne 101');

b1=# UPDATE t1 SET label_t1=upper(label_t1) WHERE id_t1=10;
b1=# DELETE FROM t1 WHERE id_t1=11;
b1=# SELECT * FROM t1 WHERE id_t1 IN (101, 10, 11);

28 Réplication logique
DALIBO Formations

id_t1 | label_t1
-------+---------------
101 | t1, ligne 101
10 | T1, LIGNE 10
(2 rows)

Sur le serveur s2 :
b1=# SELECT count(*) FROM t1;

count
-------
100

b1=# SELECT * FROM t1 WHERE id_t1 IN (101, 10, 11);

id_t1 | label_t1
-------+---------------
101 | t1, ligne 101
10 | T1, LIGNE 10
(2 rows)

1.4.9 Réplication partielle

® – Identique à la réplication complète, à une exception…

– Créer la publication partielle

CREATE PUBLICATION publi_partielle

FOR TABLE t1,t2 ;

– Souscrire sur s3 à cette nouvelle publication de s1

CREATE SUBSCRIPTION subscr_partielle

CONNECTION 'host=[Link] user=logrepli dbname=b1'
PUBLICATION publi_partielle;

La mise en place d’une réplication partielle est identique à la mise en place d’une réplication complète
à une exception près : la publication doit mentionner la liste des tables à répliquer. Chaque nom de
table est séparé par une virgule.
Mise en place :
Cela donne donc dans notre exemple :

Réplication logique 29
DALIBO Formations

CREATE PUBLICATION publi_partielle

FOR TABLE t1,t2;

Il ne reste plus qu’à souscrire à cette publication à partir du serveur s3 avec la requête indiquée.

Vérification :

Sur s3, nous n’avons que les données des deux tables répliquées :

b1=# SELECT count(*) FROM t1;

count
-------
100

b1=# SELECT count(*) FROM t2;

count
-------
1000

b1=# SELECT count(*) FROM t3;

count
-------
0

À noter que nous avons déjà les données précédemment modifiées :

b1=# SELECT * FROM t1 WHERE id_t1 IN (101, 10, 11);

id_t1 | label_t1
-------+---------------
101 | t1, ligne 101
10 | T1, LIGNE 10

Maintenant, ajoutons une ligne dans chaque table de s1 :

b1=# INSERT INTO t1 VALUES (102, 't1, ligne 102');

b1=# INSERT INTO t2 VALUES (1001, 't2, ligne 1002');
b1=# INSERT INTO t3 VALUES (-1, 't3, cle 1, ligne -1', 1);

Et vérifions qu’elles apparaissent bien sur s3 pour t1 et t2, mais pas pour t3 :

b1=# SELECT * FROM t1 WHERE id_t1=102;

id_t1 | label_t1
-------+---------------
102 | t1, ligne 102

b1=# SELECT * FROM t2 WHERE id_t2=1001;

30 Réplication logique
DALIBO Formations

id_t2 | label_t2
-------+----------------
1001 | t2, ligne 1002

b1=# SELECT * FROM t3 WHERE id_t3 < 0;

id_t3 | label_t3 | clepartition_t3

-------+----------+-----------------
(0 rows)

1.4.10 Réplication croisée

® – Écrire sur une table sur s1

– et répliquer sur s4

– Écrire sur une (autre) table sur s4

– et répliquer sur s1

– Pour compliquer :

– on utilisera la table partitionnée

La réplication logique ne permet pas pour l’instant de faire du multi‑maîtres pour une même table.
Cependant, il est tout à fait possible de croiser les réplications, c’est‑à‑dire de répliquer un ensemble
de tables de serveur s1 (origine) vers s4 (destination), de répliquer un autre ensemble en sens inverse,
du serveur s4 vers s1.

Pour rendre cela encore plus intéressant, nous allons utiliser la table t3 et ses partitions. Le but est de
pouvoir écrire dans la partition t3_1 sur s1 et dans la partition t3_2 sur s2, simulant ainsi une table
où il sera possible d’écrire sur les deux serveurs à condition de respecter la clé de partitionnement.

Pour le mettre en place, nous allons travailler en deux temps :

– nous allons commencer par mettre en réplication t3_1 ;

– et nous finirons en mettant en réplication t3_2.

Réplication logique 31
DALIBO Formations

1.4.11 Réplication de t3_1 de s1 vers s4

® – Créer la publication partielle sur s1

CREATE PUBLICATION publi_t3_1

FOR TABLE t3_1;

– Y souscrire sur s4

CREATE SUBSCRIPTION subscr_t3_1

CONNECTION 'host=[Link] user=logrepli dbname=b1'
PUBLICATION publi_t3_1;

– Configurer s4 comme serveur origine

– wal_level , pg_hba.conf

Rien de bien nouveau ici, il s’agit d’une réplication partielle. On commence par créer la publication
sur le serveur s1 et on souscrit à cette publication sur le serveur s4.

Cependant, le serveur s4 n’est plus seulement un serveur destination, il devient aussi un serveur ori‑
gine. Il est donc nécessaire de le configurer pour ce nouveau rôle. Cela passe par une configuration
similaire et symétrique à celle vue pour s1 :

– Fichier [Link] :

wal_level = logical

(Si ce n’était pas déjà fait, il faudra redémarrer l’instance PostgreSQL sur s4).

– Fichier pg_hba.conf :

host all logrepli [Link]/24 trust

(Ne pas oublier de recharger la configuration.)

32 Réplication logique
DALIBO Formations

1.4.12 Réplication de t3_2 de s4 vers s1

® – Créer la publication partielle sur s4

CREATE PUBLICATION publi_t3_2

FOR TABLE t3_2;

– Y souscrire sur s1

CREATE SUBSCRIPTION subscr_t3_2

CONNECTION 'host=[Link] user=logrepli dbname=b1'
PUBLICATION publi_t3_2;

Là‑aussi, rien de bien nouveau. On crée la publication sur le serveur s4 et on souscrit à cette publica‑
tion sur le serveur s1.

1.4.13 Tests de la réplication croisée

® – Insertion, modification, suppression sur t3 (partition 1) sur s1

– Vérifications sur s4 : les nouvelles données doivent être présentes

– Insertion, modification, suppression sur t3 (partition 2) sur s4

– Vérifications sur s1 : les nouvelles données doivent être présentes

Sur s1 :

b1=# SELECT * FROM t3 WHERE id_t3 > 999;

id_t3 | label_t3 | clepartition_t3

-------+----------+-----------------
(0 rows)

b1=# INSERT INTO t3 VALUES (1001, 't3, ligne 1001', 1);

INSERT 0 1

Réplication logique 33
DALIBO Formations

b1=# SELECT * FROM t3 WHERE id_t3>999;

id_t3 | label_t3 | clepartition_t3

-------+----------------+-----------------
1001 | t3, ligne 1001 | 1

Sur s4 :

b1=# SELECT * FROM t3 WHERE id_t3 > 999;

id_t3 | label_t3 | clepartition_t3

-------+----------------+-----------------
1001 | t3, ligne 1001 | 1

b1=# INSERT INTO t3 VALUES (1002, 't3, ligne 1002', 2);

INSERT 0 1

b1=# SELECT * FROM t3 WHERE id_t3 > 999;

id_t3 | label_t3 | clepartition_t3

-------+----------------+-----------------
1001 | t3, ligne 1001 | 1
1002 | t3, ligne 1002 | 2

Sur s1 :

b1=# SELECT * FROM t3 WHERE id_t3>999;

id_t3 | label_t3 | clepartition_t3

-------+----------------+-----------------
1001 | t3, ligne 1001 | 1
1002 | t3, ligne 1002 | 2
(2 rows)

34 Réplication logique
DALIBO Formations

1.5 ADMINISTRATION

® – Processus
– Fichiers
– Procédures

– Empêcher les écritures sur un serveur destination

– Que faire pour les DDL ?
– Gérer les opérations de maintenance
– Gérer les sauvegardes

Dans cette partie, nous allons tout d’abord voir les changements de la réplication logique du niveau
du système d’exploitation, et tout particulièrement au niveau des processus et des fichiers.
Ensuite, nous regarderons quelques procédures importantes d’administration et de maintenance.

1.5.1 Processus

® – Serveur origine

– wal sender

– Serveur destination

– logical replication launcher

– logical replication worker

Tout comme il existe un processus wal sender communiquant avec un processus wal receiver
dans le cadre de la réplication physique, il y a aussi deux processus discutant ensemble dans le cadre
de la réplication logique.
Pour commencer, un serveur en version 10 dispose d’un processus supplémentaire, le logical re-
plication launcher. Ce processus a pour but de demander le lancement d’un logical re-
plication worker lors de la création d’une souscription. Ce worker se connecte au serveur ori‑

Réplication logique 35
DALIBO Formations

gine et applique toutes les modifications dont s1 lui fait part (on a aussi le terme de apply worker, no‑
tamment dans certains messages des traces). Si la connexion se passe bien, un processus wal sen-
der est ajouté sur le serveur origine pour communiquer avec le worker sur le serveur destination.

Sur notre serveur s2, destinataire pour la publication complète du serveur s1, nous avons les proces‑
sus suivant :

postmaster -D /opt/postgresql/datas/s2
postgres: checkpointer process
postgres: writer process
postgres: wal writer process
postgres: autovacuum launcher process
postgres: bgworker: logical replication launcher
postgres: bgworker: logical replication worker for subscription 16445

Le serveur s1 est origine de trois publications (d’où les 3 wal sender) et destinataire d’une sous‑
cription (d’où le seul logical replication worker). Il a donc les processus suivants :

postmaster -D /opt/postgresql/datas/s1
postgres: checkpointer process
postgres: writer process
postgres: wal writer process
postgres: autovacuum launcher process
postgres: bgworker: logical replication launcher
postgres: bgworker: logical replication worker for subscription 16573
postgres: wal sender process logrepli [local] idle
postgres: wal sender process logrepli [local] idle
postgres: wal sender process logrepli [local] idle

36 Réplication logique
DALIBO Formations

1.5.2 Synthèse des paramètres (serveur origine)

Streaming Logique

wal_level = replica wal_level = logical

logical_decoding_work_mem*
wal_keep_size*
max_wal_keep_size*
wal_sender_timeout*
max_wal_senders max_wal_senders
max_connections ** max_connections **
max_replication_slots* max_replication_slots

(*) paramètres utiles mais pas indispensables.

(**) avant la version 12 max_wal_senders compte dans max_connections.

Réplication logique 37
DALIBO Formations

1.5.3 Synthèse des paramètres indispensables

Streaming Logique

primary_conninfo
wal_level=replica
standby_mode
max_worker_processes max_worker_processes
max_logical_replication_workers

1.5.4 Synthèse des paramètres utiles

Streaming Logique

restore_command
primary_slot_name
hot_standby
promote_trigger_file
max_replication_slots
hot_standby_feedback

Ce sont les paramètres utiles mais pas indispensables.

38 Réplication logique
DALIBO Formations

1.5.5 Fichiers (serveur origine)

® – 2 répertoires importants
– pg_replslot

– slots de réplication
– 1 répertoire par slot (+ slots temporaires)
– 1 fichier state dans le répertoire
– fichiers .snap (volumétrie !)

– pg_logical

– métadonnées
– snapshots

La réplication logique maintient des données dans deux répertoires : pg_replslot et pg_logical.

pg_replslot contient un répertoire par slot de réplication physique ou logique. On y trouvera aussi
des slots temporaires lors de l’initialisation de la réplication logique.

pg_replslot contient aussi les snapshots des transactions en cours (fichiers .snap). Il peut donc
atteindre une taille importante si le serveur exécute beaucoup de transactions longues avec du vo‑
lume en écriture, ou si l’abonné met du temps à répliquer les données. Il est donc important de sur‑
veiller la place prise par ce répertoire.

pg_logical contient des métadonnées et une volumétrie beaucoup plus faible.

À cela s’ajoutent les journaux de transaction conservés en fonction de l’avancement des slots de répli‑
cation.

Réplication logique 39
DALIBO Formations

1.5.6 Empêcher les écritures sur un serveur destination

® – Par défaut, toutes les écritures sont autorisées sur le serveur destination

– y compris écrire dans une table répliquée avec un autre serveur comme ori‑
gine

– Problèmes

– serveurs non synchronisés

– blocage de la réplication en cas de conflit sur la clé primaire

– Solution

– révoquer le droit d’écriture sur le serveur destination

– mais ne pas révoquer ce droit pour le rôle de réplication !

Sur s2, nous allons créer un utilisateur applicatif en lui donnant tous les droits sur les tables répliquées,
entre autres :

b1=# CREATE ROLE u1 LOGIN;

CREATE ROLE
b1=# GRANT ALL ON ALL TABLES IN SCHEMA public TO u1;
GRANT

Maintenant, nous nous connectons avec cet utilisateur et vérifions s’il peut écrire dans la table répli‑
quée :

b1=# \c b1 u1
You are now connected to database "b1" as user "u1".
b1=> INSERT INTO t1 VALUES (103, 't1 sur s2, ligne 103');
INSERT 0 1

C’est bien le cas, contrairement à ce que l’on aurait pu croire instinctivement. Le seul moyen
d’empêcher ce comportement par défaut est de lui supprimer les droits d’écriture :

b1=> \c b1 postgres
You are now connected to database "b1" as user "postgres".
b1=# REVOKE INSERT, UPDATE, DELETE ON ALL TABLES IN SCHEMA public FROM u1;
REVOKE
b1=# \c b1 u1
You are now connected to database "b1" as user "u1".

40 Réplication logique
DALIBO Formations

b1=> INSERT INTO t1 VALUES (104);

ERROR: permission denied for relation t1

L’utilisateur u1 ne peut plus écrire dans les tables répliquées.

Sans cette interdiction, on peut arriver à des problèmes très gênants. Par exemple, nous avons inséré
dans la table t1 de s2 la valeur 103 :
b1=# SELECT * FROM t1 WHERE id_t1=103;

id_t1 | label_t1
-------+----------------------
103 | t1 sur s2, ligne 103

Cette ligne n’apparaît pas sur s1 :

b1=# SELECT * FROM t1 WHERE id_t1=103;

id_t1 | label_t1
-------+----------
(0 rows)

De ce fait, on peut l’insérer sur la table t1 de s1 :

b1=> INSERT INTO t1 VALUES (103, 't1 sur s1, ligne 103');

INSERT 0 1

Et maintenant, on se trouve avec deux serveurs désynchronisés :

– sur s1 :
b1=# SELECT * FROM t1 WHERE id_t1=103;

id_t1 | label_t1
-------+----------------------
103 | t1 sur s1, ligne 103
(1 row)

– sur s2 :
b1=# SELECT * FROM t1 WHERE id_t1=103;

id_t1 | label_t1
-------+----------------------
103 | t1 sur s2, ligne 103
(1 row)

Notez que le contenu de la colonne label_t1 n’est pas identique sur les deux serveurs.

Ce n’est pas le seul problème : cette valeur insérée sur s1 va devoir être répliquée. Le processus de répli‑
cation logique n’arrive alors plus à appliquer les données sur s2, avec ces messages dans les traces :

Réplication logique 41
DALIBO Formations

LOG: logical replication apply worker for subscription "subscr_complete" has started
ERROR: duplicate key value violates unique constraint "t1_pkey"
DETAIL: Key (id_t1)=(103) already exists.
LOG: worker process: logical replication worker for subscription 16445 (PID 31113)
↪ exited with exit code 1

Il faut corriger manuellement la situation, par exemple en supprimant la ligne de t1 sur le serveur
s2 :

b1=# DELETE FROM t1 WHERE id_t1=103;

DELETE 1

b1=# SELECT * FROM t1 WHERE id_t1=103;

id_t1 | label_t1
-------+----------
(0 rows)

Au bout d’un certain temps, le worker est relancé, et la nouvelle ligne est finalement disponible :

b1=# SELECT * FROM t1 WHERE id_t1=103;

id_t1 | label_t1
-------+----------------------
103 | t1 sur s1, ligne 103
(1 row)

Dans des cas plus complexes et avec plus de données, la réconciliation des données peut devenir très
complexe et chronophage.

1.5.7 Que faire pour les DDL ?

® – Les opérations DDL ne sont pas répliquées

– De nouveaux objets ?

– les déclarer sur tous les serveurs du cluster de réplication

– tout du moins, ceux intéressés par ces objets

– Changement de définition des objets ?

– à réaliser sur chaque serveur

42 Réplication logique
DALIBO Formations

Seules les opérations DML sont répliquées pour les tables ciblées par une publication. Toutes les opé‑
rations DDL sont ignorées, que ce soit l’ajout, la modification ou la suppression d’un objet, y compris
si cet objet fait partie d’une publication.

Il est donc important que toute modification de schéma soit effectuée sur toutes les instances d’un
cluster de réplication. Ce n’est cependant pas requis. Il est tout à fait possible d’ajouter un index sur
un serveur sans vouloir l’ajouter sur d’autres. C’est d’ailleurs une des raisons de passer à la réplication
logique.

Par contre, dans le cas du changement de définition d’une table répliquée (ajout ou suppression d’une
colonne, par exemple), il est nettement préférable de réaliser cette opération sur tous les serveurs
intégrés dans cette réplication.

1.5.8 Que faire pour les nouvelles tables ?

® – Créer la table sur la cible

– Si publication sans FOR ALL TABLES :

– ajouter la nouvelle table dans les souscriptions concernées

ALTER PUBLICATION … ADD TABLE … ;
ALTER SUBSCRIPTION … REFRESH PUBLICATION ;

La création d’une table est une opération DDL. Elle est donc ignorée dans le contexte de la réplication
logique.

Si l’on veut la répliquer, il faudra créer la table manuellement dans la base destinataire. Puis, deux
cas se présentent : la publication a été déclarée pour certaines tables uniquement, ou avec FOR ALL
TABLES.

Si elle ne concerne qu’un sous‑ensemble de tables, il faut ajouter la nouvelle table à la publication :

ALTER PUBLICATION … ADD TABLE … ;

Si la publication a été créée avec la clause FOR ALL TABLES, la nouvelle table est immédiatement
prise en compte dans la publication.

Dans les deux cas, sur les serveurs destinataires, il va falloir rafraîchir les souscriptions :

ALTER SUBSCRIPTION … REFRESH PUBLICATION ;

Réplication logique 43
DALIBO Formations

Si l’on a oublié de créer la table sur le destinataire, cela provoquera une erreur :

ERROR: relation "public.t4" does not exist

Si la publication contient des tables partitionnées, la même commande doit être exécutée lorsque
l’on ajoute ou retire des partitions à une de ces tables partitionnées.

Voici un exemple sans FOR ALL TABLES :

Sur le serveur s1, on crée la table t4, on lui donne les bons droits, et on insère des données :

b1=# CREATE TABLE t4 (id_t4 integer, primary key (id_t4));

CREATE TABLE

b1=# GRANT SELECT ON TABLE t4 TO logrepli;

GRANT

b1=# INSERT INTO t4 VALUES (1);

INSERT 0 1

Sur le serveur s2, on regarde le contenu de la table t4 :

b1=# SELECT * FROM t4;

ERROR: relation "t4" does not exist
LINE 1: SELECT * FROM t4;
^

La table n’existe pas. En effet, la réplication logique ne s’occupe que des modifications de contenu
des tables, pas des changements de définition. Il est donc nécessaire de créer la table sur le serveur
destination, ici s2 :

b1=# CREATE TABLE t4 (id_t4 integer, primary key (id_t4));

CREATE TABLE
b1=# SELECT * FROM t4;
id_t4
-------
(0 rows)

Elle ne contient toujours rien. Ceci est dû au fait que la souscription n’a pas connaissance de la répli‑
cation de cette nouvelle table. Il faut donc rafraîchir les informations de souscription :

b1=# ALTER SUBSCRIPTION subscr_complete REFRESH PUBLICATION;

ALTER SUBSCRIPTION
b1=# SELECT * FROM t4;
id_t4
-------
1
(1 row)

44 Réplication logique
DALIBO Formations

1.5.9 Gérer les opérations de maintenance

® – À faire séparément sur tous les serveurs

– VACUUM, ANALYZE, REINDEX

Dans la réplication physique, les opérations de maintenance ne sont réalisables que sur le serveur
primaire, qui va envoyer le résultat de ces opérations aux serveurs secondaires.

Ce n’est pas le cas dans la réplication logique. Il faut bien voir les serveurs d’une réplication logique
comme étant des serveurs indépendants les uns des autres.

Donc il faut configurer leur maintenance, avec les opérations VACUUM, ANALYZE, REINDEX, comme
pour n’importe quel serveur PostgreSQL.

1.5.10 Gérer les sauvegardes & restaurations logiques

® – pg_dumpall et pg_dump

– sauvegardent publications et souscriptions

– options --no-publications et --no-subscriptions

– Restauration d’une publication :

– nouveau slot de réplication !

– réconciliation de données à prévoir

– Restauration d’un abonnement :

– ENABLE et REFRESH PUBLICATION

– reprendre à zéro la copie… ou copier manuellement ?

Les sauvegardes logiques incluent les publications et souscriptions. Deux options (--no-
publications et --no-subscriptions) permettent de les exclure.

Réplication logique 45
DALIBO Formations

Par contre, les slots de réplication liées aux publications, et leur position dans le flux de transaction,
ne sont pas sauvegardés. Cela peut poser problème pour une restauration sans perte.

Après une restauration, il faudra soigneusement vérifier dans les traces que les réplications logiques
ont repris leur fonctionnement, et qu’il n’y a pas de perte dans les données transmises.

Restauration d’une publication

Voici l’ordre SQL exécuté pour la restauration d’une publication complète :

CREATE PUBLICATION publi_complete FOR ALL TABLES

WITH (publish = 'insert, update, delete');

Et ceux correspondant à la restauration d’une publication partielle :

CREATE PUBLICATION publi_partielle

WITH (publish = 'insert, update, delete');
ALTER PUBLICATION publi_partielle ADD TABLE ONLY t1;

La publication sera fonctionnelle, mais il peut être délicat d’y raccrocher les abonne‑
Á ments existants. Selon ce qui s’est passé, le slot de réplication a souvent disparu, et il
peut être plus simple de recréer ces abonnements.

Si le slot manque, le recréer sur l’instance d’origine est possible :

SELECT pg_create_logical_replication_slot ('abonnement','pgoutput') ;

Ces opérations sont obligatoirement manuelles. De toute façon, il faudra se poser la question de la
resynchronisation des données. Généralement, l’origine aura été restaurée dans un état antérieur à
celui déjà répliqué : les données répliquées à présent absentes de l’origine sont‑elles toutes à conser‑
ver ? Comment gérer les clés primaires qui vont souvent entrer en conflit ?

Restauration d’une souscription

Pour une souscription, l’ordre SQL dans la sauvegarde est :

CREATE SUBSCRIPTION subscr_t3_2

CONNECTION 'port=5444 user=logrepli dbname=b1'
PUBLICATION publi_t3_2
WITH (connect = false, slot_name = 'subscr_t3_2');

Contrairement à l’ordre exécuté manuellement à la création, celui‑ci précise le nom du slot de répli‑
cation (au cas où il aurait été personnalisé) et désactive la connexion immédiate. Cette désactivation
a pour effet de désactiver la souscription, de ne pas créer le slot de réplication et d’empêcher la copie

46 Réplication logique
DALIBO Formations

initiale des données (dont nous n’avons pas besoin étant donné que nous les avons dans la sauve‑
garde, au moins en partie).

Une réplication restaurée est donc par défaut inactive.

Une fois la sauvegarde restaurée et les vérifications nécessaires effectuées, il est possible d’activer la
souscription et de la rafraîchir :

ALTER SUBSCRIPTION subscr_complete ENABLE ;

ALTER SUBSCRIPTION subscr_complete REFRESH PUBLICATION ;

Ces opérations sont obligatoirement manuelles.

La restauration logique d’un abonnement revient à en créer un nouveau, et ne permet

Á pas de savoir où la copie s’était arrêtée auparavant dans le flux des transactions : la copie
des données sera intégralement relancée.
Sans autre opération, et si le contenu des tables répliquées a été restauré, le contenu
déjà présent bloquera la réplication (s’il y a une clé primaire) ou de se retrouver en
double (sans clé primaire). Il peut être plus simple de ne pas restaurer les données sur la
destination, ou de tronquer les tables avant le ENABLE, pour reprendre la copie à zéro.
Une alternative est de ne pas effectuer la copie initiale :

ALTER SUBSCRIPTION nom_abonnement REFRESH PUBLICATION WITH (copy_data =

↪ false) ;

auquel cas on risque d’avoir un « trou » entre les données restaurées et celles qui vont
apparaître sur le publieur ; qu’il faudra corriger à la main dans les nombreux cas où cela
est important.

Réplication logique 47
DALIBO Formations

1.5.11 Gérer les bascules & les restaurations physiques

Comme pour la réplication physique :

®
– Sauvegarde PITR

– publications et souscriptions
– slots ?

– Slots perdus et « trous » dans la réplication si :

– bascule origine
– restauration origine
– restauration destination

– Contrôle délicat !

– interdire les écritures à ces moments ?

– Bascule de la destination

– si propre, devrait mieux se passer

Pendant ces opérations, il est fortement conseillé d’interdire les écritures dans les tables répliquées
pour avoir une vision claire de ce qui a été répliqué et ne l’a pas été. Les slots doivent souvent être
reconstruits, et il faut éviter que les tables soient modifiées entre‑temps.

Restauration de l’instance d’origine :

Cela dépend de la méthode de sauvegarde/restauration utilisée, mais la restauration du serveur ori‑

gine ne conserve généralement pas les slots de réplication (qui sont périmés de toute façon).

Il faudra recréer les slots, peut‑être recréer les souscriptions, et pendant ce temps des trous dans les
données répliquées peuvent apparaître, qu’il faudra vérifier ou corriger manuellement.

Bascule de l’instance d’origine :

Ici, l’instance d’origine est arrêtée et un de ses secondaires est promu comme nouveau serveur princi‑
pal. Les slots de réplication étant propres à une instance, il ne seront pas disponibles immédiatement
sur la nouvelle origine. Il faudra aussi reparamétrer la connexion des abonnements.

Il y a donc à nouveau un risque sérieux de perdre au moins quelques données répliquées.

Restauration de l’instance de destination :

48 Réplication logique
DALIBO Formations

Un slot de réplication sur l’origine garantit seulement que les journaux seront toujours disponibles
pendant une indisponibilité du souscripteur. Ils ne permettent pas de revenir sur des données déjà
répliquées.

En redémarrant, les abonnements vont tenter de se raccrocher au slot de réplication de l’origine, ce

qui fonctionnera, mais ils ne recevront que des données jamais répliqués. Là encore des « trous » dans
les données répliquées peuvent apparaître si l’instance destination n’a pas été restaurée dans un état
suffisamment récent !

Bascule de l’instance destination :

C’est le cas le plus favorable. Si la bascule s’est faite proprement sans perte entre l’ancienne destina‑
tion et la nouvelle, il ne devrait pas y avoir de perte de données répliquées. Cela devra tout de même
faire partie des contrôles

Réplication logique 49
DALIBO Formations

1.6 SUPERVISION

® – Méta‑données
– Statistiques
– Outils

1.6.1 Catalogues systèmes ‑ méta‑données

® – pg_publication

– définition des publications

– \dRp sous psql

– pg_publication_tables

– tables ciblées par chaque publication

– pg_subscription

– définition des souscriptions

– \dRs sous psql

Le catalogue système pg_publication contient la liste des publications, avec leur méta‑
données :

b1=# SELECT * FROM pg_publication;

pubname | pubowner | puballtables | pubinsert | pubupdate | pubdelete

-----------------+----------+--------------+-----------+-----------+-----------
publi_complete | 10 | t | t | t | t
publi_partielle | 10 | f | t | t | t
publi_t3_1 | 10 | f | t | t | t

Le catalogue système pg_publication_tables contient une ligne par table par publication :

b1=# SELECT * FROM pg_publication_tables;

50 Réplication logique
DALIBO Formations

pubname | schemaname | tablename

On peut en déduire deux versions abrégées :

– la liste des tables par publication :

SELECT pubname, array_agg(tablename ORDER BY tablename) AS tables_list

FROM pg_publication_tables
GROUP BY 1
ORDER BY 1;

pubname | tables_list
-----------------+------------------------------
publi_complete | {t1,t2,t3_1,t3_2,t3_3,t4,t5}
publi_partielle | {t1,t2}
publi_t3_1 | {t3_1}

– la liste des publications par table :

SELECT tablename, array_agg(pubname ORDER BY pubname) AS publications_list

FROM pg_publication_tables
GROUP BY 1
ORDER BY 1 ;

tablename | publicationss_list
-----------+----------------------------------
t1 | {publi_complete,publi_partielle}
t2 | {publi_complete,publi_partielle}
t3_1 | {publi_complete,publi_t3_1}
t3_2 | {publi_complete}
t3_3 | {publi_complete}
t4 | {publi_complete}
t5 | {publi_complete}

Enfin, il y a aussi un catalogue système contenant la liste des souscriptions :

b1=# \x
Expanded display is on.
b1=# SELECT * FROM pg_subscription;

Réplication logique 51
DALIBO Formations

-[ RECORD 1 ]---+----------------------------------
subdbid | 16443
subname | subscr_t3_2
subowner | 10
subenabled | t
subconninfo | port=5444 user=logrepli dbname=b1
subslotname | subscr_t3_2
subsynccommit | off
subpublications | {publi_t3_2}

1.6.2 Vues statistiques

® – pg_stat_replication

– statut de réplication

– pg_stat_replication_slots (v14)

– volumes écrits/envoyés en streaming via les slots de réplication logique

– pg_stat_subscription

– état des souscriptions

– pg_replication_origin_status

– statut des origines de réplication

Comme pour la réplication physique, le retard de réplication est calculable en utilisant les informa‑
tions de la vue pg_stat_replication sur le serveur origine :

SELECT * FROM pg_stat_replication ;

52 Réplication logique
DALIBO Formations

Réplication logique 53
DALIBO Formations

Depuis la version 14, une autre vue, pg_stat_replication_slots (description complète dans
la documentation2 , permet de suivre les volumétries (octets, nombre de transactions) écrites sur
disque (spilled) ou envoyées en streaming :

SELECT * FROM pg_stat_replication_slots \gx

L’état des souscriptions est disponible sur les serveurs destination à partir de la vue pg_stat_subscription :

SELECT * FROM pg_stat_subscription ;

2
[Link]

54 Réplication logique
DALIBO Formations

1.6.3 Outils de supervision

® – check_pgactivity

– replication_slots

– check_postgres

– same_schema

Peu d’outils ont déjà été mis à jour pour ce type de réplication.

Néanmoins, il est possible de surveiller le retard de réplication via l’état des slots de réplication,
comme le propose l’outil check_pgactivity (disponible sur github3 ). Ici, il n’y a pas de retard sur
la réplication, pour les trois slots :

$ ./check_pgactivity -s replication_slots -p 5441 -F human

Service : POSTGRES_REPLICATION_SLOTS
Returns : 0 (OK)
Message : Replication slots OK
Perfdata : subscr_complete_wal=0File
Perfdata : subscr_complete_spilled=0File
Perfdata : subscr_t3_1_wal=0File
Perfdata : subscr_t3_1_spilled=0File
Perfdata : subscr_partielle_wal=0File
Perfdata : subscr_partielle_spilled=0File

Faisons quelques insertions après l’arrêt de s3 (qui correspond à la souscription pour la réplication
partielle) :

b1=# INSERT INTO t1 SELECT generate_series(1000000, 2000000);

INSERT 0 1000001

L’outil détecte bien que le slot subscr_partielle a un retard conséquent (8 journaux de transac‑
tions) et affiche le nombre de fichiers de débordement créés :

$ ./check_pgactivity -s replication_slots -p 5441 -F human

Service : POSTGRES_REPLICATION_SLOTS

3
[Link]

Réplication logique 55
DALIBO Formations

Returns : 0 (OK)
Message : Replication slots OK
Perfdata : subscr_t3_1_wal=8File
Perfdata : subscr_t3_1_spilled=0File
Perfdata : subscr_partielle_wal=8File
Perfdata : subscr_partielle_spilled=9File
Perfdata : subscr_complete_wal=8File
Perfdata : subscr_complete_spilled=9File

Il est aussi possible d’utiliser l’action same_schema avec l’outil check_postgres (disponible
aussi sur github4 ) pour détecter des différences de schémas entre deux serveurs (l’origine et une
destination).

4
[Link]

56 Réplication logique
DALIBO Formations

1.7 MIGRATION MAJEURE PAR RÉPLICATION LOGIQUE

® – Possible entre versions 10 et supérieures

– Remplace Slony, Bucardo…
– Bascule très rapide
– Et retour possible
– Des limitations

La réplication logique rend possible une migration entre deux instances de version majeure différente
avec une indisponibilité très courte. La base à migrer doit bien sûr être en version 10 ou supérieure.
C’était déjà possible avec des outils de réplication par trigger comme Slony ou Bucardo. Ces outils
externes ne sont maintenant plus nécessaires. (Noter que Slony en particulier reste parfaitement uti‑
lisable et recommandable, et sert encore pour nombre de migrations).
Le principe est de répliquer une base à l’identique alors que la production tourne. Lors de la bascule, il
suffit d’attendre que les dernières données soient répliquées, ce qui peut être très rapide, et de connec‑
ter les applications au nouveau serveur. La réplication peut alors être inversée pour garder l’ancienne
production synchrone, permettant de rebasculer dessus en cas de problème sans perdre les données
modifiées depuis la bascule.
Les étapes sont :

– copie des structures et des objets globaux concernés ;

– mise en place d’une publication sur la source et d’un abonnement sur la cible ;
– suivi de la réplication (lag entre les serveurs) ;
– arrêt des connexions applicatives ;
– attente de la fin de la réplication logique ;
– synchronisation manuelle des valeurs des séquences (non répliquées) ;
– suppression de la publication et de l’abonnement ;
– éventuellement création d’un abonnement et d’une publication en sens inverse ;
– isolation de la base source des connexions applicatives ;
– ouverture de la base cible aux applications.

Les restrictions liées à la réplication logique subsistent :

– les modifications de schéma effectuées pendant la synchronisation ne sont pas répliquées (cela
est problématique si l’application elle‑même effectue du DDL sur des tables non temporaires) ;

Réplication logique 57
DALIBO Formations

– les TRUNCATE depuis une base v10 ne sont pas répliqués ;

– les large objects et les séquences ne sont pas répliqués ;
– il est fortement conseillé que toutes les tables aient des clés primaires ;
– la réplication fonctionnant uniquement pour les tables « de base », les vues matérialisées sont
à reconstruire sur la cible et jusqu’en 13 le partitionnement doit être identique des deux côtés.

Cette méthode reste donc plus complexe et fastidieuse qu’une migration par pg_dump/pg_restore
ou pg_upgrade.

58 Réplication logique
DALIBO Formations

1.8 RAPPEL DES LIMITATIONS DE LA RÉPLICATION LOGIQUE NATIVE

® – Pas de réplication des requêtes DDL

– ni TRUNCATE en v10

– Pas de réplication des tables partitionnées ( < v13)

– mais réplication possible des partitions

– Pas de réplication vers une table partitionnée ( < v13)

– Pas de réplication des valeurs des séquences
– Pas de réplication des LO (table système)
– Contraintes d’unicité obligatoires pour les UPDATE/DELETE
– Réplication déclenchée uniquement lors du COMMIT (< v14)
– Que faire lors des restaurations/bascules ?

La réplication logique native ne réplique pas les ordres DDL. Elle se base uniquement au niveau des
données (donc les ordres DML). Une exception a été faite à partir de la version 11 pour répliquer les
ordres TRUNCATE car, même s’il s’agit d’un ordre DDL d’après le standard, cet ordre modifie les don‑
nées d’une table.

Avant la version 13, il n’était pas possible d’ajouter une table partitionnée à une publication pour
qu’elle et ses partitions soient répliquées. Il fallait ajouter chaque partition individuellement. Cette
limitation a été supprimée en version 13.

Toujours avant la version 13, il n’était pas possible d’envoyer des données dans une table partition‑
née.

Les valeurs des séquences et les Larges Objects ne sont pas répliqués.

Pour les versions inférieures à 14, la réplication logique n’est déclenchée que lors d’un COMMIT. Il
n’y a pas d’envoi des données tant que la transaction est en cours, ce qui peut rajouter un délai de
réplication pour les transactions longues.

Réplication logique 59
DALIBO Formations

Enfin, la réplication logique doit tenir compte des cas de restauration, ou bascule, d’une
Á des instances impliquées. Le concept de flux unique de transaction unique ne s’applique
plus ici, et il n’est pas prévu de moyen pour garantir que la réplication se fera sans au‑
cune perte ou risque de doublon. La mise en place de la réplication logique doit toujours
prévoir ce qu’il faudra faire dans ce cas.

Certaines applications supporteront cette limite. Dans d’autres, il sera plus ou moins facile de re‑
prendre la réplication à zéro. Parfois, une réconciliation manuelle sera nécessaire (la présence de clés
primaires peut grandement aider). Dans certains cas, ce problème peut devenir bloquant ou réclamer
des développements.

60 Réplication logique
DALIBO Formations

1.9 OUTILS DE RÉPLICATION LOGIQUE EXTERNE

® – Slony
– Bucardo

1.9.1 Slony : Carte d’identité

® – Projet libre (BSD)

– Asynchrone / Asymétrique
– Diffusion des résultats (triggers)

Slony5 est un très ancien projet libre de réplication pour PostgreSQL. C’était l’outil de choix avant
l’arrivée de la réplication native dans PostgreSQL.

1.9.2 Slony : Fonctionnalités

® – Réplication de tables sélectionnées

– Procédures de bascule

– switchover / switchback
– failover / failback

Slony permet de choisir les tables à répliquer. Il faudra ajouter à la réplication toute nouvelle table qui
serait créée après sa mise en place.
5
[Link]

Réplication logique 61
DALIBO Formations

Les procédures de bascule chez Slony sont très simples. Il est ainsi possible de basculer un serveur
primaire et son serveur secondaire autant de fois qu’on le souhaite, très rapidement, sans avoir à
reconstruire quoi que ce soit.

1.9.3 Slony : Technique

® – Réplication basée sur des triggers

– Démons externes, écrits en C
– Le primaire est un provider
– Les secondaires sont des subscribers

Slony est un système de réplication asynchrone/asymétrique, donc un seul primaire et un ou plusieurs

serveurs secondaires mis à jour à intervalle régulier. La récupération des données modifiées se fait par
des triggers, qui stockent les modifications dans des tables propres à Slony avant leur transfert vers
les secondaires. Un système de démon récupère les données pour les envoyer sur les secondaires et
les applique.

Les démons et les triggers sont écrits en C, ce qui permet à Slony d’être très performant.

Au niveau du vocabulaire utilisé, le primaire est souvent appelé un « provider » (il fournit les données
aux serveurs secondaires) et les secondaires sont souvent des « subscribers » (ils s’abonnent au flux
de réplication pour récupérer les données modifiées).

1.9.4 Slony : Points forts

® – Choix des tables et séquences à répliquer

– Indépendance des versions de PostgreSQL
– Technique de propagation des DDL
– Robustesse

Slony dispose de nombreux points forts, parfois liés au simple fait qu’il s’agit d’une réplication lo‑
gique.

62 Réplication logique
DALIBO Formations

Il permet de ne répliquer qu’un sous‑ensemble des objets d’une instance : pas forcément toutes les
bases, pas forcément toutes les tables d’une base particulière, etc.

Le serveur primaire et les serveurs secondaires n’ont pas besoin d’utiliser la même version majeure
de PostgreSQL. Il est donc possible de mettre à jour en plusieurs étapes (plutôt que tous les serveurs
à la fois). Cela facilite aussi le passage à une version majeure ultérieure.

Même si la réplication des DDL est impossible, leur envoi aux différents serveurs est possible grâce à
un outil fourni. Tous les systèmes de réplication par triggers ne peuvent pas en dire autant.

1.9.5 Slony : Limites

® – Le réseau doit être fiable : peu de lag, pas ou peu de coupures

– Supervision délicate
– Modifications de schémas complexes

Slony peut survivre avec un réseau coupé. Cependant, il n’aime pas quand le réseau passe son temps à
être disponible puis indisponible. Les démons slon ont tendance à croire qu’ils sont toujours connec‑
tés alors que ce n’est plus le cas.

Superviser Slony n’est possible que via une table statistique appelée sl_status. Elle fournit princi‑
palement deux informations : le retard en nombre d’événements de synchronisation et la date de la
dernière synchronisation.

Enfin, la modification de la structure d’une base, même si elle est simplifiée avec le script fourni, n’est
pas simple, en tout cas beaucoup moins simple que d’exécuter une requête DDL seule.

1.9.6 Slony : Utilisations

® – Réplications complexes
– Infocentre (many to one)
– Bases spécialisées (recherche plein texte, traitements lourds, etc.)
– Migrations de versions majeures avec indisponibilité réduite

Réplication logique 63
DALIBO Formations

Bien que la réplication logique soit arrivée avec PostgreSQL 10, Slony garde son utilité pour les nom‑
breuses instances des versions précédentes.
Slony peut se révéler intéressant car il est possible d’avoir des tables de travail en écriture sur le secon‑
daire avec Slony. Il est aussi possible d’ajouter des index sur le secondaire qui ne seront pas présents
sur le serveur primaire (on évite donc la charge de maintenance des index par le serveur primaire, tout
en permettant de bonnes performances pour la création des rapports).
Il est fréquent d’utiliser Slony pour des migrations entre deux versions majeures avec une indispo‑
nibilité réduite, voire avec un retour en arrière possible. La réplication logique native n’a pas encore
atteint le niveau de robustesse de Slony.
Pour plus d’informations sur Slony, n’hésitez pas à lire un de nos articles disponibles sur notre site6 .
Le thème des réplications complexes a aussi été abordé lors du PostgreSQL Sessions 20127 .

1.9.7 Bucardo : Carte d’identité

® – Projet libre (BSD)

– Triggers et démons externes
– Intérêt :

– cluster maître/maître simple

– Plusieurs méthodes de résolution des conflits

– Failover manuel

Bucardo8 est un des rares outils à proposer du multi‑maîtres, avec plusieurs primaires possibles. Il
s’agit aussi de réplication logique par triggers, mais sa mise en place est vraiment différente par rap‑
port à Slony.
Bucardo offre plusieurs types de réplication, mais le plus intéressant sur un PostgreSQL moderne est
le mode de synchronisation multi‑maîtres.
Le problème de toute réplication logique étant la résolution d’éventuels conflits, Bucardo offre plu‑
sieurs méthodes de résolution :

– source : la base de données d’origine gagne toujours

6
[Link]
7
[Link]
8
[Link]

64 Réplication logique
DALIBO Formations

– target : la base de destination gagne toujours

– random : l’une des deux bases est choisie au hasard comme étant la gagnante
– latest : la ligne modifiée le plus récemment gagne
– abort : la réplication est arrêtée
– skip : aucune décision ni action n’est prise

Il est également possible de créer son propre gestionnaire de résolution de conflit personnalisé.

Bucardo ne s’attelle qu’à la réplication des données, c’est à l’administrateur de réagir en cas de panne
et de réaliser les opérations de bascule et de remise en réplication.

1.9.8 Bucardo : Limites

® – Aucune technique de propagation des DDL

– Limité à deux nœuds en mode multi‑maîtres
– Le réseau doit être fiable

– peu de retard, pas ou peu de coupures

– Sous Linux/Unix uniquement

La propagation des DDL n’est pas prise en compte. Il faut donc, comme pour Slony, exécuter les DDL
sur chaque serveur séparément.

Le projet est porté surtout par Greg Sabino Mulane, développeur très connu (et apprécié) dans la com‑
munauté PostgreSQL. Cela explique un développement apparemment peu actif9 , même si la correc‑
tion des bugs est généralement très rapide.

La mise en place de Bucardo est intéressante quand on tient à un cluster maître/maître sur les mêmes
tables. Le réseau doit être fiable. La moindre erreur peut tout de même poser des soucis de réconci‑
liation des données. En dehors de cela, il est préférable de se baser sur des solutions comme la répli‑
cation interne ou Slony, surtout si l’on peut séparer nettement les données dont chaque serveur est
responsable.

9
[Link]

Réplication logique 65
DALIBO Formations

1.10 CONCLUSION

® – Réplication logique simple et pratique

– …avec ses subtilités

La réplication logique de PostgreSQL apparue en version 10 continue de s’améliorer avec les versions.
Elle complète la réplication physique sans la remplacer.

Les cas d’utilisation sont nombreux, mais la supervision est délicate et il faut prévoir les sauve‑
gardes/restaurations et bascules.

1.10.1 Questions

N’hésitez pas, c’est le moment !

66 Réplication logique
DALIBO Formations

1.11 QUIZ

[Link]
®

Réplication logique 67
DALIBO Formations

1.12 TRAVAUX PRATIQUES

1.12.1 Pré‑requis

En préalable, nettoyer les instances précédemment créés sur le serveur.

Ensuite, afin de réaliser l’ensemble des TP, créer 4 nouvelles instances PostgreSQL « instance[1‑4] »,
en leur attribuant des ports différents :

# systemctl stop instance1

# systemctl stop instance2
# systemctl stop instance3
# systemctl stop instance4

# rm -rf /var/lib/pgsql/15/instance1
# rm -rf /var/lib/pgsql/15/instance2
# rm -rf /var/lib/pgsql/15/instance3
# rm -rf /var/lib/pgsql/15/instance4

# export PGSETUP_INITDB_OPTIONS='--data-checksums'
# /usr/pgsql-15/bin/postgresql-14-setup initdb instance1
# /usr/pgsql-15/bin/postgresql-14-setup initdb instance2
# /usr/pgsql-15/bin/postgresql-14-setup initdb instance3
# /usr/pgsql-15/bin/postgresql-14-setup initdb instance4

# sed -i "s/#port = 5432/port = 5433/" /var/lib/pgsql/15/instance2/[Link]

# sed -i "s/#port = 5432/port = 5434/" /var/lib/pgsql/15/instance3/[Link]
# sed -i "s/#port = 5432/port = 5435/" /var/lib/pgsql/15/instance4/[Link]

# systemctl start instance1

# systemctl start instance2
# systemctl start instance3
# systemctl start instance4

$ ps -o pid,cmd fx

PID CMD
7077 /usr/pgsql-15/bin/postmaster -D /var/lib/pgsql/14/instance4/
7079 \_ postgres: logger
7081 \_ postgres: checkpointer
7082 \_ postgres: background writer
7083 \_ postgres: walwriter
7084 \_ postgres: autovacuum launcher
7085 \_ postgres: logical replication launcher
7056 /usr/pgsql-15/bin/postmaster -D /var/lib/pgsql/14/instance3/
7058 \_ postgres: logger
7060 \_ postgres: checkpointer

68 Réplication logique
DALIBO Formations

7061 \_ postgres: background writer

7062 \_ postgres: walwriter
7063 \_ postgres: autovacuum launcher
7064 \_ postgres: logical replication launcher
7035 /usr/pgsql-15/bin/postmaster -D /var/lib/pgsql/14/instance2/
7037 \_ postgres: logger
7039 \_ postgres: checkpointer
7040 \_ postgres: background writer
7041 \_ postgres: walwriter
7042 \_ postgres: autovacuum launcher
7043 \_ postgres: logical replication launcher
7015 /usr/pgsql-14/bin/postmaster -D /var/lib/pgsql/14/instance1/
7016 \_ postgres: logger
7018 \_ postgres: checkpointer
7019 \_ postgres: background writer
7020 \_ postgres: walwriter
7021 \_ postgres: autovacuum launcher
7022 \_ postgres: logical replication launcher

Le schéma de la base b1 de l’instance origine (instance1) est le suivant. Noter que la table t3 est
partitionnée.

CREATE TABLE t1 (id_t1 serial, label_t1 text);

CREATE TABLE t2 (id_t2 serial, label_t2 text);

CREATE TABLE t3 (id_t3 serial, label_t3 text, clepartition_t3 integer)

PARTITION BY LIST (clepartition_t3);
CREATE TABLE t3_1 PARTITION OF t3 FOR VALUES IN (1);
CREATE TABLE t3_2 PARTITION OF t3 FOR VALUES IN (2);
CREATE TABLE t3_3 PARTITION OF t3 FOR VALUES IN (3);
CREATE TABLE t3_4 PARTITION OF t3 FOR VALUES IN (4);

INSERT INTO t1 SELECT i, 't1, ligne '||i FROM generate_series(1, 100) i;

INSERT INTO t2 SELECT i, 't2, ligne '||i FROM generate_series(1, 1000) i;

INSERT INTO t3 SELECT i, 't3, ligne '||i, 1 FROM generate_series( 1, 100) i;

INSERT INTO t3 SELECT i, 't3, ligne '||i, 2 FROM generate_series(101, 300) i;
INSERT INTO t3 SELECT i, 't3, ligne '||i, 3 FROM generate_series(301, 600) i;

ALTER TABLE t1 ADD PRIMARY KEY(id_t1);

ALTER TABLE t2 ADD PRIMARY KEY(id_t2);
ALTER TABLE t3 ADD PRIMARY KEY(id_t3, clepartition_t3);

Réplication logique 69
DALIBO Formations

1.12.2 Réplication complète d’une base

But : Mettre en place la réplication complète d’une base avec la réplication logique.
®
Pour répliquer toute la base b1 sur le serveur instance2 :

Sur instance1, créer l’utilisateur de réplication logrepli et lui donner les droits de lecture sur les
tables de la base b1.

Sur instance1, modifier la configuration du paramètre wal_level dans le fichier post-

[Link].

Sur instance1, modifier la configuration des connexions dans le fichier pg_hba.conf.

Redémarrer instance1.

Sur instance2, créer l’utilisateur de réplication.

Sur instance2, créer la base b1.

Sur instance2, ajouter dans la base b1 les tables répliquées (sans contenu).

Sur instance1, créer la publication pour toutes les tables.

Sur instance2, créer la souscription.

Vérifier sur instance1, dans la vue pg_stat_replication l’état de la réplication logique.

Sur instance2, consulter pg_stat_subscription.

Vérifier que les tables ont le même contenu que sur instance1 et que les modifications sont éga‑
lement répliquées.

70 Réplication logique
DALIBO Formations

1.12.3 Réplication partielle d’une base

But : Mettre en place la réplication partielle d’une base avec la réplication logique.
®
On veut répliquer uniquement les tables t1 et t2 de la base b1 sur le serveur instance3.

Sur instance1, créer la publication pour t1 et t2.

Sur instance3, créer la base b1, les tables à répliquer, puis souscrire à la nouvelle publication de
instance1.

Vérifier sur instance1, dans la vue pg_stat_replication l’état de la réplication logique.

Sur instance3, consulter pg_stat_subcription.

1.12.4 Réplication croisée

But : Mettre en place une réplication croisée avec la réplication logique.

®
Pour répliquer la partition t3_1 du serveur instance1 vers le serveur instance4, puis répliquer la
partition t3_2 du serveur instance4 vers le serveur instance2 :

Sur instance1, créer la publication pour la partition t3_1.

Sur instance4, créer l’utilisateur de réplication.

Sur instance4, souscrire à cette nouvelle publication de instance1. Pour créer la table t3_1, il
faut aussi créer la table mère t3.

Sur instance4, adapter la valeur du paramètre wal_level dans [Link].

Réplication logique 71
DALIBO Formations

Sur instance4, adapter les autorisations dans pg_hba.conf pour permettre une réplication
depuis instance4.

Redémarrer instance4.

Sur instance4, créer la publication pour t3_4. Il faudra importer la partition t3_4 et donner les
droits de lecture à logrepli.

Sur instance1, souscrire à cette nouvelle publication de instance4.

Insérer des données dans t3_4 sur instance4 et vérifier que la réplication se fait de instance4
à instance1.

1.12.5 Réplication et partitionnement

But : Mettre en évidence des particularités de la réplication logique et du partitionne‑

® ment.

Voici un exemple de réplication entre des tables qui n’ont pas le même schéma de partitionnement
:
– Sur instance1, créer une base bench_part.

– Sur instance2, créer une base bench_part.

– Sur instance1, utiliser pgbench pour créer la table pgbench_account

– avec un partitionnement de type hash et cinq partitions.

– Sur instance2, utiliser pgbench pour créer la table pgbench_account

– avec un partitionnement de type range et trois partitions,
– mais sans insérer de données.

72 Réplication logique
DALIBO Formations

– Sur instance1, autoriser l’utilisateur de réplication à accéder aux tables.

– Créer une publication pour toutes les tables de la base.

– Sur instance2, créer la souscription associée. Que constatez‑vous ?

– Sur instance1, supprimer la publication et la recréer avec l’option publish_via_partition_root.

– Sur instance2, recréer la souscription.

– Sur instance1 et instance2, compter les lignes dans chaque partition de pgbench_accounts.
Qu’observez‑vous ?

Réplication logique 73
DALIBO Formations

1.13 TRAVAUX PRATIQUES (SOLUTIONS)

1.13.1 Pré‑requis

En préalable, nettoyer les instances précédemment créés sur le serveur.

Ensuite, afin de réaliser l’ensemble des TP, créer 4 nouvelles instances PostgreSQL « instance[1‑4] »,
en leur attribuant des ports différents :

# systemctl stop instance1

# systemctl stop instance2
# systemctl stop instance3
# systemctl stop instance4

# rm -rf /var/lib/pgsql/15/instance1
# rm -rf /var/lib/pgsql/15/instance2
# rm -rf /var/lib/pgsql/15/instance3
# rm -rf /var/lib/pgsql/15/instance4

# sed -i "s/#port = 5432/port = 5433/" /var/lib/pgsql/15/instance2/[Link]

# sed -i "s/#port = 5432/port = 5434/" /var/lib/pgsql/15/instance3/[Link]
# sed -i "s/#port = 5432/port = 5435/" /var/lib/pgsql/15/instance4/[Link]

# systemctl start instance1

# systemctl start instance2
# systemctl start instance3
# systemctl start instance4

$ ps -o pid,cmd fx

74 Réplication logique
DALIBO Formations

7061 \_ postgres: background writer

Le schéma de la base b1 de l’instance origine (instance1) est le suivant. Noter que la table t3 est
partitionnée.

CREATE TABLE t1 (id_t1 serial, label_t1 text);

CREATE TABLE t2 (id_t2 serial, label_t2 text);

CREATE TABLE t3 (id_t3 serial, label_t3 text, clepartition_t3 integer)

INSERT INTO t1 SELECT i, 't1, ligne '||i FROM generate_series(1, 100) i;

INSERT INTO t2 SELECT i, 't2, ligne '||i FROM generate_series(1, 1000) i;

INSERT INTO t3 SELECT i, 't3, ligne '||i, 1 FROM generate_series( 1, 100) i;

INSERT INTO t3 SELECT i, 't3, ligne '||i, 2 FROM generate_series(101, 300) i;
INSERT INTO t3 SELECT i, 't3, ligne '||i, 3 FROM generate_series(301, 600) i;

ALTER TABLE t1 ADD PRIMARY KEY(id_t1);

ALTER TABLE t2 ADD PRIMARY KEY(id_t2);
ALTER TABLE t3 ADD PRIMARY KEY(id_t3, clepartition_t3);

1.13.2 Réplication complète d’une base

Réplication logique 75
DALIBO Formations

Sur instance1, créer l’utilisateur de réplication logrepli et lui donner les droits de lecture sur les
tables de la base b1.

CREATE ROLE logrepli LOGIN REPLICATION;

GRANT SELECT ON ALL TABLES IN SCHEMA public TO logrepli;

Sur instance1, modifier la configuration du paramètre wal_level dans le fichier post-

[Link].

wal_level = logical

Sur instance1, modifier la configuration des connexions dans le fichier pg_hba.conf.

host b1 logrepli [Link]/24 trust

Redémarrer instance1.

Sur instance2, créer l’utilisateur de réplication.

CREATE ROLE logrepli LOGIN REPLICATION;

Sur instance2, créer la base b1.

$ createdb -p 5433 b1

Sur instance2, ajouter dans la base b1 les tables répliquées (sans contenu).

$ pg_dump -p 5432 -s b1 | psql -p 5433 b1

Sur instance1, créer la publication pour toutes les tables.

CREATE PUBLICATION publi_complete FOR ALL TABLES;

Sur instance2, créer la souscription.

CREATE SUBSCRIPTION subscr_complete

CONNECTION 'host=[Link] port=5432 user=logrepli dbname=b1'
PUBLICATION publi_complete;

Vérifier sur instance1, dans la vue pg_stat_replication l’état de la réplication logique. Sur
instance2, consulter pg_stat_subscription.

Sur instance1 :

76 Réplication logique
DALIBO Formations

b1=# SELECT * FROM pg_stat_replication \gx

Sur instance2 :

b1=# select * from pg_stat_subscription \gx

Vérifier que les tables ont le même contenu que sur instance1 et que les modifications sont éga‑
lement répliquées.

Toute opération d’écriture sur la base b1 du serveur instance1 est répliquée sur instance2.

Sur instance1 :

b1=# INSERT INTO t1 VALUES (101, 't1, ligne 101');

Réplication logique 77
DALIBO Formations

INSERT 0 1

b1=# UPDATE t1 SET label_t1=upper(label_t1) WHERE id_t1=10;

UPDATE 1

b1=# DELETE FROM t1 WHERE id_t1=11;

DELETE 1

b1=# SELECT * FROM t1 WHERE id_t1 IN (101, 10, 11);

id_t1 | label_t1
-------+---------------
101 | t1, ligne 101
10 | T1, LIGNE 10
(2 rows)

Sur instance2 :

b1=# SELECT count(*) FROM t1;

count
-------
100

b1=# SELECT * FROM t1 WHERE id_t1 IN (101, 10, 11);

id_t1 | label_t1
-------+---------------
101 | t1, ligne 101
10 | T1, LIGNE 10

1.13.3 Réplication partielle d’une base

On veut répliquer uniquement les tables t1 et t2 de la base b1 sur instance3.

Sur instance1, créer la publication pour t1 et t2.

CREATE PUBLICATION publi_partielle

FOR TABLE t1,t2;

Sur instance3, créer la base b1, les tables à répliquer, puis souscrire à la nouvelle publication de
instance1.

$ psql -p 5434 -c "CREATE ROLE logrepli LOGIN REPLICATION;"

$ createdb -p 5434 b1
$ pg_dump -p 5432 -s -t t1 -t t2 b1 | psql -p 5434 b1

78 Réplication logique
DALIBO Formations

CREATE SUBSCRIPTION subscr_partielle

CONNECTION 'host=[Link] port=5432 user=logrepli dbname=b1'
PUBLICATION publi_partielle;

Vérifier sur instance1, dans la vue pg_stat_replication l’état de la réplication logique.

Réplication logique 79
DALIBO Formations

replay_lag |
sync_priority | 0
sync_state | async
reply_time | ...

Sur instance3, consulter pg_stat_subcription.

Sur instance3 :

b1=# SELECT * FROM pg_stat_subscription \gx

1.13.4 Réplication croisée

Sur instance1, créer la publication pour la partition t3_1.

CREATE PUBLICATION publi_t3_1

FOR TABLE t3_1;

Sur instance4, créer l’utilisateur de réplication.

$ psql -p 5435 -c "CREATE ROLE logrepli LOGIN REPLICATION;"

Sur instance4, souscrire à cette nouvelle publication de instance1. Pour créer la table t3_1, il
faut aussi créer la table mère t3.

$ createdb -p 5435 b1
$ pg_dump -p 5432 -s -t t3 -t t3_1 b1 | psql -p 5435 b1

CREATE SUBSCRIPTION subscr_t3_1

CONNECTION 'host=[Link] port=5432 user=logrepli dbname=b1'
PUBLICATION publi_t3_1;

Sur instance4, adapter la valeur du paramètre wal_level dans [Link].

wal_level = logical

80 Réplication logique
DALIBO Formations

Sur instance4, adapter les autorisations dans pg_hba.conf pour permettre une réplication
depuis instance4.

host all logrepli [Link]/24 trust

Redémarrer instance4.

Sur instance4, créer la publication pour t3_4. Il faudra importer la partition t3_4 et donner les
droits de lecture à logrepli.

$ pg_dump -p 5432 -s -t t3_4 b1 | psql -p 5435 b1

GRANT SELECT ON t3_4 TO logrepli;

CREATE PUBLICATION publi_t3_4

FOR TABLE t3_4;

Sur instance1, souscrire à cette nouvelle publication de instance4.

CREATE SUBSCRIPTION subscr_t3_4

CONNECTION 'host=[Link] port=5435 user=logrepli dbname=b1'
PUBLICATION publi_t3_4;

Insérer des données dans t3_4 sur instance4 et vérifier que la réplication se fait de instance4
à instance1.

Sur instance1 :

b1=# SELECT * FROM t3 WHERE id_t3 > 999;

id_t3 | label_t3 | clepartition_t3

-------+----------+-----------------
(0 rows)

b1=# INSERT INTO t3 VALUES (1001, 't3, ligne 1001', 1);

INSERT 0 1

b1=# SELECT * FROM t3 WHERE id_t3>999;

id_t3 | label_t3 | clepartition_t3

-------+----------------+-----------------
1001 | t3, ligne 1001 | 1

Sur instance4 :

b1=# SELECT * FROM t3 WHERE id_t3 > 999;

Réplication logique 81
DALIBO Formations

id_t3 | label_t3 | clepartition_t3

-------+----------------+-----------------
1001 | t3, ligne 1001 | 1

b1=# INSERT INTO t3 VALUES (1002, 't3, ligne 1002', 4);

INSERT 0 1

b1=# SELECT * FROM t3 WHERE id_t3 > 999;

id_t3 | label_t3 | clepartition_t3

-------+----------------+-----------------
1001 | t3, ligne 1001 | 1
1002 | t3, ligne 1002 | 4

Sur instance1 :

b1=# SELECT * FROM t3 WHERE id_t3>999;

id_t3 | label_t3 | clepartition_t3

-------+----------------+-----------------
1001 | t3, ligne 1001 | 1
1002 | t3, ligne 1002 | 4

1.13.5 Réplication et partitionnement

– Sur instance1, créer une base bench_part.

createdb --port 5432 bench_part

– Sur instance2, créer une base bench_part.

createdb --port 5433 bench_part

– Sur instance1, utiliser pgbench pour créer la table pgbench_account

– avec un partitionnement de type hash et cinq partitions.

pgbench --initialize \
--partition-method=hash \
--partitions=5 \
--port=5432 bench_part

– Sur instance2, utiliser pgbench pour créer la table pgbench_account

– avec un partitionnement de type range et trois partitions,
– mais sans insérer de données.

82 Réplication logique
DALIBO Formations

pgbench --initialize \
--init-steps=dtp \
--partition-method=range \
--partitions=3 \
--port=5433 bench_part

– Sur instance1, autoriser l’utilisateur de réplication à accéder aux tables.

– Créer une publication pour toutes les tables de la base.

GRANT SELECT ON ALL TABLES IN SCHEMA public TO logrepli ;

CREATE PUBLICATION pub_bench FOR ALL TABLES;

– Sur instance2, créer la souscription associée. Que constatez‑vous ?

CREATE SUBSCRIPTION sub_bench

CONNECTION 'host=[Link] port=5432 user=logrepli dbname=bench_part'
PUBLICATION pub_bench;

La commande échoue avec le message suivant :

ERROR: relation "public.pgbench_accounts_5" does not exist

L’erreur fait référence à une partition qui n’existe pas sur la souscription. C’est normal puisque le
schéma de partitionnement est différent. Un autre cas de figure peut se présenter : la partition existe,
mais les lignes ne correspondent pas aux contraintes de partitionnement. Dans ce cas la souscription
sera créée, mais des erreurs seront présentes dans les traces de PostgreSQL.

– Sur instance1, supprimer la publication et la recréer avec l’option publish_via_partition_root.

L’option de publication publish_via_partition_root permet de répondre à ce problème en

publiant les modifications avec le nom de la partition mère.

DROP PUBLICATION pub_bench;

CREATE PUBLICATION pub_bench
FOR ALL TABLES
WITH ( publish_via_partition_root = true );

– Sur instance2, recréer la souscription.

CREATE SUBSCRIPTION sub_bench

CONNECTION 'host=[Link] port=5432 user=logrepli dbname=bench_part'
PUBLICATION pub_bench;

Réplication logique 83
DALIBO Formations

– Sur instance1 et instance2, compter les lignes dans chaque partition de pgbench_accounts.
Qu’observez‑vous ?

Sur instance1, la répartition des lignes dans pgbench_account est la suivante :

bench_part=# SELECT tableoid::regclass, count(*)

bench_part-# FROM pgbench_accounts
bench_part-# GROUP BY ROLLUP (1) ORDER BY 1;

Sur instance2, la répartition des lignes est la suivante :

bench_part=# SELECT tableoid::regclass, count(*)

bench_part-# FROM pgbench_accounts
bench_part-# GROUP BY ROLLUP (1) ORDER BY 1;

On constate que toutes les lignes sont répliquées et qu’elles sont ventilées différemment sur les deux
serveurs.

Ce paramétrage peut également être utilisé pour répliquer depuis une table partitionnée vers une
table classique.

84 Réplication logique
Les formations Dalibo

Retrouvez nos formations et le calendrier sur [Link]

Pour toute information ou question, n’hésitez pas à nous écrire sur contact@[Link].

Cursus des formations

85
DALIBO Formations

Retrouvez nos formations dans leur dernière version :

– DBA1 : Administration PostgreSQL

[Link]

– DBA2 : Administration PostgreSQL avancé

[Link]

– DBA3 : Sauvegarde et réplication avec PostgreSQL

[Link]

– DEVPG : Développer avec PostgreSQL

[Link]

– PERF1 : PostgreSQL Performances

[Link]

– PERF2 : Indexation et SQL avancés

[Link]

– MIGORPG : Migrer d’Oracle à PostgreSQL

[Link]

– HAPAT : Haute disponibilité avec PostgreSQL

[Link]

Les livres blancs

– Migrer d’Oracle à PostgreSQL

[Link]

– Industrialiser PostgreSQL
[Link]

– Bonnes pratiques de modélisation avec PostgreSQL

[Link]

– Bonnes pratiques de développement avec PostgreSQL

[Link]

Téléchargement gratuit

Les versions électroniques de nos publications sont disponibles gratuitement sous licence open
source ou sous licence Creative Commons.

86 Réplication logique

Vous aimerez peut-être aussi

w2b Handout
Pas encore d'évaluation
w2b Handout
68 pages
BDA MR Tsiory
Pas encore d'évaluation
BDA MR Tsiory
40 pages
Patroni Handout
Pas encore d'évaluation
Patroni Handout
300 pages
Dba2 No-Tp Handout
Pas encore d'évaluation
Dba2 No-Tp Handout
296 pages
Formation Développement PostgreSQL
Pas encore d'évaluation
Formation Développement PostgreSQL
520 pages
Django: Python
33% (3)
Django: Python
13 pages
Dba2 Handout
Pas encore d'évaluation
Dba2 Handout
384 pages
SQL Transactionnel Avancé
Pas encore d'évaluation
SQL Transactionnel Avancé
64 pages
A2 Handout
Pas encore d'évaluation
A2 Handout
52 pages
Papyrus Sy SML in Action
Pas encore d'évaluation
Papyrus Sy SML in Action
102 pages
PostgreSQL : Histoire et Communauté
Pas encore d'évaluation
PostgreSQL : Histoire et Communauté
64 pages
r58 Handout
Pas encore d'évaluation
r58 Handout
108 pages
s3 Handout
Pas encore d'évaluation
s3 Handout
96 pages
Configuration PSTGSQL
Pas encore d'évaluation
Configuration PSTGSQL
72 pages
Syllabus Wrong 4 NF
Pas encore d'évaluation
Syllabus Wrong 4 NF
170 pages
PostgreSQL Sauvegardes Et Réplication
Pas encore d'évaluation
PostgreSQL Sauvegardes Et Réplication
352 pages
Introduction au PL/SQL Oracle
Pas encore d'évaluation
Introduction au PL/SQL Oracle
79 pages
Dba3 Handout
100% (1)
Dba3 Handout
372 pages
Devpg Handout PDF
Pas encore d'évaluation
Devpg Handout PDF
408 pages
Programmation, Génie Logiciel, Preuves - Book - 2024-2025
Pas encore d'évaluation
Programmation, Génie Logiciel, Preuves - Book - 2024-2025
68 pages
Introduction au langage SQL et SGBDR
Pas encore d'évaluation
Introduction au langage SQL et SGBDR
40 pages
Cours Bases de Données IUT Villetaneuse
Pas encore d'évaluation
Cours Bases de Données IUT Villetaneuse
44 pages
Introduction au langage SQL
Pas encore d'évaluation
Introduction au langage SQL
40 pages
Httpsenseignement - Alexandre Mesle - Comsqlsql PDF
Pas encore d'évaluation
Httpsenseignement - Alexandre Mesle - Comsqlsql PDF
40 pages
Introduction au SQL et SGBDR
Pas encore d'évaluation
Introduction au SQL et SGBDR
40 pages
Cours
Pas encore d'évaluation
Cours
101 pages
Formation Python Cours 3
Pas encore d'évaluation
Formation Python Cours 3
476 pages
Table Des Matieres
Pas encore d'évaluation
Table Des Matieres
22 pages
Initiation Via Python All
Pas encore d'évaluation
Initiation Via Python All
1 062 pages
Shell
Pas encore d'évaluation
Shell
49 pages
Analyse BTS IG/SIO: Merise & UML
100% (1)
Analyse BTS IG/SIO: Merise & UML
49 pages
Replication Des Donnees
Pas encore d'évaluation
Replication Des Donnees
108 pages
Guide complet pour travailler avec R
Pas encore d'évaluation
Guide complet pour travailler avec R
196 pages
Cours Complet sur Oracle et SQL
Pas encore d'évaluation
Cours Complet sur Oracle et SQL
134 pages
Formation Scribe : Guide d'Administration
Pas encore d'évaluation
Formation Scribe : Guide d'Administration
82 pages
NSI Term
Pas encore d'évaluation
NSI Term
106 pages
Cours sur les Grilles Informatiques
Pas encore d'évaluation
Cours sur les Grilles Informatiques
53 pages
Introduction aux bases de données
Pas encore d'évaluation
Introduction aux bases de données
253 pages
INF5171 Programmation Concurrente Et Parallèle Notes de Cours. Guy Tremblay
Pas encore d'évaluation
INF5171 Programmation Concurrente Et Parallèle Notes de Cours. Guy Tremblay
480 pages
Introduction au langage SQL et SGBDR
Pas encore d'évaluation
Introduction au langage SQL et SGBDR
65 pages
Mfront
Pas encore d'évaluation
Mfront
40 pages
Programmation Parallèle Haute Performance PDF
Pas encore d'évaluation
Programmation Parallèle Haute Performance PDF
795 pages
Migorpg
Pas encore d'évaluation
Migorpg
232 pages
Patroni Arch Et Fonctionnement
Pas encore d'évaluation
Patroni Arch Et Fonctionnement
120 pages
Developpement PostgreSQL
Pas encore d'évaluation
Developpement PostgreSQL
412 pages
IDRIS MPI Cours Couleurs
Pas encore d'évaluation
IDRIS MPI Cours Couleurs
343 pages
SQL Oracle PDF
Pas encore d'évaluation
SQL Oracle PDF
130 pages
Python Cours 1CB - Manuel 2023
Pas encore d'évaluation
Python Cours 1CB - Manuel 2023
94 pages
Cours de Bases de Données
100% (1)
Cours de Bases de Données
217 pages
Apprendre La Rogrammation Rientée Bjet Langage: P O O Python
Pas encore d'évaluation
Apprendre La Rogrammation Rientée Bjet Langage: P O O Python
14 pages
Cours VHDL Tres Important
100% (1)
Cours VHDL Tres Important
196 pages
Bon Bon Fax de BD
Pas encore d'évaluation
Bon Bon Fax de BD
221 pages
Cours sur les Bases de Données
Pas encore d'évaluation
Cours sur les Bases de Données
85 pages
Tpe Bdsi1
Pas encore d'évaluation
Tpe Bdsi1
49 pages
CBD Base de Donnee Merise
Pas encore d'évaluation
CBD Base de Donnee Merise
177 pages
PostgreSQL 10: Nouveautés Essentielles
Pas encore d'évaluation
PostgreSQL 10: Nouveautés Essentielles
108 pages
Atelier: Haute Disponibilité avec Patroni
Pas encore d'évaluation
Atelier: Haute Disponibilité avec Patroni
32 pages
Les Racines du National-Socialisme
Pas encore d'évaluation
Les Racines du National-Socialisme
7 pages
Les Racines du National-Socialisme
Pas encore d'évaluation
Les Racines du National-Socialisme
7 pages
Ces Gestes Qui Vous Trahissent PDF
100% (2)
Ces Gestes Qui Vous Trahissent PDF
335 pages
QCM de Culture Generale
100% (1)
QCM de Culture Generale
180 pages
Travaux Pratiques en Microbiologie Alimentaire
Pas encore d'évaluation
Travaux Pratiques en Microbiologie Alimentaire
7 pages
Boucle Locale
Pas encore d'évaluation
Boucle Locale
16 pages
Urbanisme Et Foncier Urbain
100% (1)
Urbanisme Et Foncier Urbain
2 pages
Demande de Visa de Court Sejour (Moins de 3 Mois) Visite Familiale, Visite Privée, Tourisme
Pas encore d'évaluation
Demande de Visa de Court Sejour (Moins de 3 Mois) Visite Familiale, Visite Privée, Tourisme
3 pages
EDBM V19 Creation 2020
Pas encore d'évaluation
EDBM V19 Creation 2020
2 pages
Conception 1 Cours1
Pas encore d'évaluation
Conception 1 Cours1
5 pages
Best Buy Canada
0% (1)
Best Buy Canada
2 pages
Problème Du Coloriage de Graphe
Pas encore d'évaluation
Problème Du Coloriage de Graphe
16 pages
Transfert d'argent Airtel Congo expliqué
Pas encore d'évaluation
Transfert d'argent Airtel Congo expliqué
1 page
FR CFSDFSDFSD WCWXWCWX
Pas encore d'évaluation
FR CFSDFSDFSD WCWXWCWX
14 pages
Apprendre L'informatique de A À Z - 10 Étapes Clés !
100% (5)
Apprendre L'informatique de A À Z - 10 Étapes Clés !
45 pages
Master en Énergie Électrique à UCAD
Pas encore d'évaluation
Master en Énergie Électrique à UCAD
2 pages
Dimensions Humaines Du Travail
100% (3)
Dimensions Humaines Du Travail
649 pages
Statuts de Vitalis Assurance Qualité SARL
Pas encore d'évaluation
Statuts de Vitalis Assurance Qualité SARL
14 pages
Formation After Effects: Techniques Avancées
Pas encore d'évaluation
Formation After Effects: Techniques Avancées
3 pages
Nature et Développement Durable
Pas encore d'évaluation
Nature et Développement Durable
6 pages
Procédure de Consignation Électrique
Pas encore d'évaluation
Procédure de Consignation Électrique
23 pages
Examen - Réseaux de Terrain - M2 - RT - Fei - Usthb - 2019 - 1
Pas encore d'évaluation
Examen - Réseaux de Terrain - M2 - RT - Fei - Usthb - 2019 - 1
3 pages
Attestation de Paiement Caf Janvier 2024
Pas encore d'évaluation
Attestation de Paiement Caf Janvier 2024
3 pages
Réduction des Rebuts en Ingénierie Mécanique
Pas encore d'évaluation
Réduction des Rebuts en Ingénierie Mécanique
100 pages
Calcul Des Charges Mortes Et Vives
Pas encore d'évaluation
Calcul Des Charges Mortes Et Vives
30 pages
Guide de culture de la courgette
Pas encore d'évaluation
Guide de culture de la courgette
2 pages
Tableau Sorbet Sicoly
Pas encore d'évaluation
Tableau Sorbet Sicoly
2 pages
Périmètres, Aires Et Volume
Pas encore d'évaluation
Périmètres, Aires Et Volume
3 pages
Réalité Augmentée pour l'Industrie
Pas encore d'évaluation
Réalité Augmentée pour l'Industrie
19 pages
Réservation Alger-Toronto Lufthansa 2024
Pas encore d'évaluation
Réservation Alger-Toronto Lufthansa 2024
4 pages
Recrutement du Personnel : Processus et Stratégies
Pas encore d'évaluation
Recrutement du Personnel : Processus et Stratégies
15 pages
Techniques et applications de l'immunohistochimie
Pas encore d'évaluation
Techniques et applications de l'immunohistochimie
17 pages
Exercice de comptabilité générale 2023
Pas encore d'évaluation
Exercice de comptabilité générale 2023
2 pages
Session Et Cookies
Pas encore d'évaluation
Session Et Cookies
38 pages