0% ont trouvé ce document utile (0 vote)

25 vues16 pages

Guide complet sur les expressions régulières

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

25 vues16 pages

Guide complet sur les expressions régulières

Transféré par

konphap.thien

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Un outil bien utile: les expressions régulières

Applications:
Valider, rechercher ou remplacer du texte (dans DW: filtrer&nettoyer données).
Apparaissent dans:
langages de scripts/programmes UNIX: grep, sed, awk...
perl
PHP, javascript (valider input, reformater), SQL (pattern matching)
librairies dans langages de programmation: perl, python, java, c++...
parseurs, analyse de paquets dans les réseaux. . .
éditeurs de texte/IDE (Find&Replace))

Caveat:
Plusieurs ”standards”, fonctionnalités varient légèrement. Variantes principales:
variantes POSIX: Basic et Extended (BRE, ERE)
PCRE (originaires de Perl).
Les outils proposent de nombreuses options, mais varient beaucoup entre outils.

Moteurs de Regex:
PCRE, Oniguruma, RE2 (Google), Boost (C++), RegExp (Javascript). . .
Pour tester les regex des transparents suivants:
grep -E --color='auto' pattern <(printf 'text')
pcregrep --color='auto' pattern <(printf 'text')
[Link] 1
Expressions régulières: pense-bête
a symbole a Classes de caractères:

(r) r (délimiteur/capture) [ a1 ...an ] 1 caractère: a1 ou a2 ou...

r1 r2 r1 or r2 (alternative) [ a-d ] a, b, c ou d
r1 r2 concaténation [ˆ... ] tout caractère sauf ...
[\x00-\x7F] ASCII ([:ascii:] POSIX)
Caractères spéciaux:
. tout symbole (sauf \n) Classes de caractères prédéfinies (POSIX and PCRE):

ˆ début du texte Posix Description PCRE

$ fin du texte [:alpha:] [A-Za-z]

[:alnum:] [A-Za-z0-9]

d
Quantification:
[:digit:] [0-9] \d
r? 0 ou 1 occurrence de r [:space:] [\t\r\n\v\f]=espaces \s
r⇤ 0 ou plus occurrences [:blank:] espaces horizontaux \h
r+ 1 ou plus occurrences [:punct:] ponctuation
[:upper:] majuscule \u
r {n} exactement n occ.
[:word:] [A-Za-z0-9_] \w
r {n, } au moins n occ. [:print:] [\x20-\x7E]=car visibl+ espace
r {min, max} entre min et max occ. [= a =] classe d’équivalence de "a"
PCRE: maj. pour inverser: \D = non-chiﬀre.
Sous-expr capturées:
Métacaractères PCRE/ERE:
\n la sous-chaîne correspondant à la ˆ . [ ] $ ( ) * + ? | { } \ échappés par \
nième sous-expression capturée
Métacaractères pour BRE:
(définie par la nième parenthèse ouvrante) ˆ.[]$*\

[Link] 2
Expressions régulières: règles de comportement
Algorithme de recherche des occurrences:

par défaut, moteur POSIX cherche la première et plus longue occurrence. Moteur
PCRE cherche la première occurrence avec quantificateur glouton.
ancres et autres assertions (ˆ, $, \b, \B, (?= r ). . . ) ne “matchent” pas de symboles.
Classes de caractères:
classes de caract. POSIX s’utilisent entre “[ ]”: ex: [[:alpha:]]
classes de caract. prédéfinies déterminées par catégorie LC_CTYPE de la locale (UNIX)
classe d’équivalence [= a =] ' [aàáâäåãAÀ...] définie par cat. LC_COLLATE (UNIX).
attention aux digraphes, é peut être 1 ou 2 caractère, etc.
inclure des caract. spéciaux dans classe de caractère:
meta status est en général perdu dans une classe de caract.
quand - en premier ou dernier dans “[ ]” : pas intervalle mais symbole - lui-même.
classes jamais vides ni imbriquées, donc les crochets sont reconnus dans [a [ b] et [ ]ab]
Captures:
\0 capture toute le motif
parfois $n (hors motif) au lieu de \n (dans le motif) pour référence arrière
Métacaractères:
langages de scripts et programmation interprètent le motif avant de le passer au
moteur ) d’où double échappement! ) penser à échapper les symboles ex: ( ) \
préférez PCRE, ou au moins ERE: en BRE il faut échapper ( ) { }. De plus: BRE n’a
[Link] pas d’alternation |. Et \? \+ sont parfois supportés, mais pas standards. 3
Expressions régulières: règles de comportement (2)

L’ordre de priorité des opérateurs est le suivant:

1 Collation-related bracket symbols [==] [::] [..]
2 Escaped characters \
3 Character set (bracket expression) []
4 Grouping ()
5 Single-character-ERE duplication * + ? {m,n}
6 Concatenation
7 Anchoring ˆ$
8 Alternation |

[Link] 4
Expressions régulières: exemples
Exemples (PCRE ou ERE):

[a-z]+0 reconnaît texte contenant une ou plusieurs minuscules suivies de 0.

ˆ[0-9]{10}$ reconnaît texte (ligne) qui consiste en un nombre à 10 chiﬀres.

[ˆ0-9]{1,4} va sélectionner: 12ac34589:#@$45

[[:alpha:]]*[[:digit:]][ˆ[:alnum:],]+ va sélectionner: A#589:#@,aa$b45

(ab|cd)+ee|ˆab va sélectionner: abaacdzcdabeez

([a-c])z\1\1 reconnaît azaa mais pas azcc.

Find:
PCRE: (\d{4})-(\d{2})-(\d{2})
ERE (POSIX classes): ([[:digit:]]{4})-([[:digit:]]{2})-([[:digit:]]{2})
ERE: ([0-9]{4})-([0-9]{2})-([0-9]{2})
BRE: $[0-9]\{4\}$-$[0-9]\{2\}$-$[0-9]\{2\}$
Replace: $3/$2/$1

[Link] 5
Expressions régulières PCRE: pense-bête (avancé)
Divers:
\b limite de mot (assertion, comme ˆ et $, et autres ancres: \< début de mot \> fin)
\B pas une limite de mot (ancre)
(?: r) groupe non-capturant
Assertions : ! si négative, = si positive, < pour en-arrière ( positive/neg. look-ahead/look-behind)
(?= r ) assertion avant positive
(?! r ) assertion avant négative
(?<= r ) assertion arrière positive
(?<! r ) assertion arrière négative
Motif conditionnel (seulement dans certains moteurs: python, perl, pcre)
(?( if ) then | else )
Capture nommée (pcre, python)
Capture Référence Remplacement
(?P< nomGroupe > r ) (?P= nomGroupe ) \g< nomGroupe > Python, Perl, ...
(?< nomGroupe > r ) \k< nomGroupe > ${ nomGroupe } .Net, Java
(?< nomGroupe > r ) \k< nomGroupe > $+{ nomGroupe } Perl
Références et remplacements peuvent aussi utiliser le numéro de groupe, ex: \1.
Options (pas standard, mais presque toujours proposées sous une forme ou une autre)
i insensible à la casse
m multiline: si le texte a des symboles, ˆ et $ reconnaissent extrémités de chaque ligne
s single-line: permet à “.” de reconnaître symbole newline
x expanded: espaces seront ignorés sauf si échappés. . .

[Link] 6
Expressions régulières PCRE: exemples
Exemples:
new(?!s) sur "Those news seem newer than new"
(?ms)ˆa(.)*z$ sur "abcd\ngfz\na"
regexp pour valider mots de passe ( 8 symboles, chiﬀre, ponctuation, majuscule) ?

([a-c])z\1\1 équivaut à (?P<lettre>[a-c])z\1\1 et à (?<le>[a-c])z\k<le>\k<le>

Find: (?P<annee>\d{4})-(?P<mois>\d{2})-(?P<jour>\d{2})
Replace: \g<jour>/\g<mois>/\g<annee>

[Link] 7
Expressions régulières: quantificateurs gourmands, paresseux, possessifs
Greedy, lazy/reluctant, possessive quantifiers:

Par défaut, les quantificateurs PCRE sont gloutons: à partir d’une position, autant
d’occurrences que possible, puis backtrack si pas trouvé de solution pour le motif global.
Avec ? le quantificateur devient paresseux: le moins d’occurrences, puis augmente si
pas de solution.
Avec + le quantificateur devient possessif (Java, Python, Perl...): maximum
d’occurrences, sans backtracking même si cela fait échouer.

Exemples:
ba* sur "abaaac"
ba*ac sur "abaaac"
ba+? sur "abaaac"
ba+?c sur "abaaac"
ab{2,}+[a-z] sur "aabbc"
ab{2,}+[a-z] sur "aabbb"
([a-c])*+cz n’a jamais de match.

[Link] 8
Expressions régulières sous UNIX: grep, sed. BRE par défaut, mais ERE avec option -E
egrep = grep -E : dans fichier(s) en entrée, renvoie les lignes où le motif est trouvé.
-i insensible casse
-n affiche numéros de ligne
-R (recursive) tous les fichiers du répertoire
-l n’affiche que le nom des fichiers (donc s’arrête à la 1ère occ. par fichier)
-a cherche dans fichier binaire comme si c’était du texte
-A / -B / -C affiche les lignes autour de l’occ.
--include / --exclude / --exclude-dir précise les fichiers à traiter : utile avec -R.

sed est un outil très complet pour sélectionner ou modifier du texte.

-E ERE au lieu de BRE (sous Mac&GNU), -r (GNU)
-i modifie le fichier d’origine
-e à écrire avant chaque action si il y en a plusieurs (ou -f scriptfile : script passé dans un fichier)
. . . beaucoup d’autres possibilités (options, syntaxe)
sed -e 's/before/after/g' [Link] > [Link]
. . . remplace chaque occ. de before par after.

Exemples:
egrep 'ion$' /usr/dict/words . . . retourne mots se terminant par ion.
grep -rE --color='auto' '\best\b' Desktop/ . . . recherche le mot est dans Desktop.
grep -Ein -B4 --color='auto' 'port' Desktop/[Link]
. . . cherche port (majuscules possibles), aﬃche les 4 lignes avant, numérotées
find / -type f -exec grep -l 'motif' {} \; (associé à find pour préciser les fichiers)
sed -[Link] 's#([0-9]{4})-([0-9]{2})-([0-9]{2})#\3/\2/\1#g' [Link]
[Link] . . . change format de date sur-place, sauvegarde. 9
Outils de scripts plus riches que sed et grep: syntaxe PCRE

ack: usage plus pratique que grep (voir [Link]

- mêmes regexp que perl
- par défaut: recherche récursive et restreinte aux fichiers de code (pas binaires, .git. . . )
- coloration
ag: similaire à ack (clone) réputé rapide
awk: réputé plus pratique que sed si le fichier a une structure.
perl:

Exemples:
perl -pi -e 's/a/b/g' [Link] similaire à sed -i -e ... †
perl -[Link] -pe 's/(?<annee>\d{4})-\d{2}-\d{2}/$+{annee}/g' [Link]
. . . mais sous perl ou awk on peut utiliser une fonction strftime

perl -ne '/\B\u/ && print' [Link] similaire à grep -e ... †

awk -F',' '{print $2}' [Link] renvoie la deuxième colonne d’un csv
awk -F';' '/ˆ[0-5;]*$/{print $9}' [Link] la 9e col. des lignes satisfaisant la regexp

†
mais syntaxe PCRE
[Link] 10
Expressions régulières: Java
Java:
import [Link].*; //Matcher, Pattern
public class Regexptest
{
public static void main(String[] args)
{
[Link]([Link]("\\w* mops", "with 7 mops")); //false

Pattern p = [Link]("([a-z ])\\sside");

Matcher m = [Link]("from side to");

while ([Link]( )) {
[Link]("Line: " + [Link](0)); //"Line: from side"
[Link]("Value: " + [Link](1)); //"Value: from "
[Link]([Link]() + " " + [Link]()); //0 9
}

[Link]([Link]()); //false: should match entire region

[Link]([Link]("z")); //z to
}
}

Classes non supportées: \l \L \u \U. Conditions pas supportées non plus.

[Link] 11
Expressions régulières : Scala
Scala: utilise la librairie Java.
import [Link]

val motif: Regex = """(\d\d\d\d)-(\d\d)-(\d\d)""".r // .r transforme en regexp

val dates = "historique: 2004-01-20, 1958-09-05, 2010-10-06, 2011-07-15"

val allYears = for (m <- [Link](dates)) yield [Link](1)

// itérateur: [Link]() renvoie successivement "2004" , "1958" , "2010"

val YearsOnly = [Link](dates, m => [Link](1))

// historique: 2004, 1958, 2010, 2011

[Link] 12
Expressions régulières : Python
Python: fonctions match, search, findall, sub.
import re
c = [Link]('(\d\d?) \w+ \d{4}', 'le 16 avril 2017')
print [Link](1) # 16

motif = [Link]('\d\d? \w+ \d{4}')

c = [Link]('le 16 avril 2017')
print [Link]() # '16 avril 2017'

[Link]('([0-9]{4})-([0-9]{2})-([0-9]{2})','\\1/\\2/\\3','2016-04-16')
# '2016/04/16'
[Link](r'a?\\[zb]',r'a\z\b') # ['a\\z', '\\b'] Raw string: r'a\z' == 'a\\z'

[Link]('ab','zabc') is None # matches only from start of string.

[Link]('zab','zabc') is None # matches only whole string.

[Link](r'\W','et tu, Brute') == ['et', 'tu', '', 'Brute']

# [Link](delim,str), like [Link](str2) but for regex

Peut évaluer des expressions définies par des caractères Unicode (par défaut), ou par
des caractères ASCII.

[Link] 13
Expressions régulières: SQL
Oracle : conforme avec POSIX ERE.
UPDATE countries
SET name = REGEXP_REPLACE(name,'(.)','\1 ') WHERE name != France;
-- name Brazil devient: B r a z i l
SELECT first_name, last_name FROM employees
WHERE REGEXP_LIKE (first_name, '^Ste(v|ph)en$')
PostgreSQL : implémente motifs regexp-like avec SIMILAR TO et permet quelques
fonctions regexp POSIX:
SELECT col FROM t WHERE (col similar to '%(b|d)%');
-- retourne "abc", mais pas "aca"
SELECT regexp_replace('foobarbaz', 'b..', 'X', 'g')
-- fooXX
MySQL : la librairie regex de Herbert Spencer (POSIX)
MariaDB : librairie PCRE (anciennes versions: regex)
Microsoft SQL Server : prise en charge partielle avec LIKE (afaik)
DB2 : pas directement pris en charge (afaik) ) UDF.

On peut aussi appeler une librairie regexp à travers des UDF.

[Link] 14
Bibliographie

- [Link]
- [Link]

[Link] 15
Bibliographie
- [Link] (très complet et agréable)
- [Link]
- [Link]
- [Link] (très complet)
- [Link]
les-expressions-regulieres-partie-1-2
- https:
//[Link]/questions/22937618/reference-what-does-this-regex-mean
- [Link] (tester/débuger une regex)
- [Link] (perl one-liners)

À la B.U. (Paris-Sud) :

[Link] includes some book reviews.

[Link] 16

Vous aimerez peut-être aussi

Expressions Regulieres Pcre
Pas encore d'évaluation
Expressions Regulieres Pcre
9 pages
Expressions Régulières
Pas encore d'évaluation
Expressions Régulières
7 pages
Maîtriser les expressions régulières Linux
Pas encore d'évaluation
Maîtriser les expressions régulières Linux
14 pages
Filtre Grep Sed Awk
100% (1)
Filtre Grep Sed Awk
26 pages
Expressions régulières en Python
Pas encore d'évaluation
Expressions régulières en Python
41 pages
Utilisation des expressions régulières Linux
Pas encore d'évaluation
Utilisation des expressions régulières Linux
43 pages
Optimisation des expressions régulières PCRE
Pas encore d'évaluation
Optimisation des expressions régulières PCRE
29 pages
Maîtrise Des Expressions Régulières 2ed FR
Pas encore d'évaluation
Maîtrise Des Expressions Régulières 2ed FR
479 pages
Utilisation de grep et expressions régulières
Pas encore d'évaluation
Utilisation de grep et expressions régulières
18 pages
Filtres de données Unix : Guide complet
Pas encore d'évaluation
Filtres de données Unix : Guide complet
5 pages
Perl Regex
Pas encore d'évaluation
Perl Regex
14 pages
Guide pratique de la commande grep
Pas encore d'évaluation
Guide pratique de la commande grep
8 pages
Guide complet sur les expressions régulières
Pas encore d'évaluation
Guide complet sur les expressions régulières
98 pages
Les Expressions Rationnelles2
Pas encore d'évaluation
Les Expressions Rationnelles2
23 pages
Guide des expressions régulières et Grep
Pas encore d'évaluation
Guide des expressions régulières et Grep
43 pages
Guide Complet des Expressions Régulières
Pas encore d'évaluation
Guide Complet des Expressions Régulières
30 pages
Guide des Expressions Régulières
Pas encore d'évaluation
Guide des Expressions Régulières
4 pages
Introduction au langage Perl
100% (1)
Introduction au langage Perl
18 pages
Introduction aux Expressions Régulières
Pas encore d'évaluation
Introduction aux Expressions Régulières
4 pages
Commandes Linux pour gestion de fichiers et regex
Pas encore d'évaluation
Commandes Linux pour gestion de fichiers et regex
9 pages
Regex, Grep Et Sed: Langages de Scripts
Pas encore d'évaluation
Regex, Grep Et Sed: Langages de Scripts
5 pages
Expressions Régulières en PHP
Pas encore d'évaluation
Expressions Régulières en PHP
15 pages
Filtres et expressions régulières sous Linux
Pas encore d'évaluation
Filtres et expressions régulières sous Linux
12 pages
Introduction aux expressions régulières
Pas encore d'évaluation
Introduction aux expressions régulières
16 pages
Perl Pour Litteraires
Pas encore d'évaluation
Perl Pour Litteraires
24 pages
Gestion des REGEX en Cybersécurité
Pas encore d'évaluation
Gestion des REGEX en Cybersécurité
31 pages
Exemples d'expressions régulières
Pas encore d'évaluation
Exemples d'expressions régulières
3 pages
Cours 3
Pas encore d'évaluation
Cours 3
15 pages
Guide complet sur le langage Perl
Pas encore d'évaluation
Guide complet sur le langage Perl
42 pages
Cours PHP : Expressions Régulières
Pas encore d'évaluation
Cours PHP : Expressions Régulières
21 pages
Expressions régulières en Python
100% (1)
Expressions régulières en Python
11 pages
Opérateurs logiques et tests en shell
Pas encore d'évaluation
Opérateurs logiques et tests en shell
37 pages
Mémento Regex PHP & MySQL
Pas encore d'évaluation
Mémento Regex PHP & MySQL
5 pages
Introduction au langage Perl
Pas encore d'évaluation
Introduction au langage Perl
32 pages
Commandes POSIX pour l'administration Linux
Pas encore d'évaluation
Commandes POSIX pour l'administration Linux
47 pages
Cours Regexp
Pas encore d'évaluation
Cours Regexp
22 pages
Tutoriel Pour Maîtriser Les Expressions Régulières - Regex PDF
Pas encore d'évaluation
Tutoriel Pour Maîtriser Les Expressions Régulières - Regex PDF
7 pages
Perl Moderne
Pas encore d'évaluation
Perl Moderne
465 pages
Examen de Compilation 2014 - Corrigé
Pas encore d'évaluation
Examen de Compilation 2014 - Corrigé
4 pages
Guide pratique de Perl en bioinformatique
Pas encore d'évaluation
Guide pratique de Perl en bioinformatique
137 pages
Flux de Redirection et Gestion des Processus
Pas encore d'évaluation
Flux de Redirection et Gestion des Processus
15 pages
Memo Linux A Z Final 1
Pas encore d'évaluation
Memo Linux A Z Final 1
4 pages
Commandes de base et filtres en ligne de commande
Pas encore d'évaluation
Commandes de base et filtres en ligne de commande
14 pages
Commandes grep et find en Unix
Pas encore d'évaluation
Commandes grep et find en Unix
9 pages
Commandes avancées sous GNU/Linux
Pas encore d'évaluation
Commandes avancées sous GNU/Linux
64 pages
TP-3 TecWeb-2024-2025-oujda
Pas encore d'évaluation
TP-3 TecWeb-2024-2025-oujda
6 pages
Introduction à ANTLR et ANTLRWorks
Pas encore d'évaluation
Introduction à ANTLR et ANTLRWorks
41 pages
Guide de référence des commandes Unix
Pas encore d'évaluation
Guide de référence des commandes Unix
2 pages
Guide sur Lex pour l'analyse lexicale
Pas encore d'évaluation
Guide sur Lex pour l'analyse lexicale
2 pages
Génération d'analyseurs avec Flex&Bison
Pas encore d'évaluation
Génération d'analyseurs avec Flex&Bison
22 pages
Correction Exerciceds
Pas encore d'évaluation
Correction Exerciceds
3 pages
Tutoriel Regex PHP : Guide Complet et Exemples
Pas encore d'évaluation
Tutoriel Regex PHP : Guide Complet et Exemples
5 pages
Manuel FLEX pour étudiants en informatique
100% (1)
Manuel FLEX pour étudiants en informatique
4 pages
Expressions régulières Java : Guide API Regex
Pas encore d'évaluation
Expressions régulières Java : Guide API Regex
36 pages
Scripts Bash: Fichiers, Processus et Analyse de Texte
Pas encore d'évaluation
Scripts Bash: Fichiers, Processus et Analyse de Texte
6 pages
Résumé Du Voyage Au Pays Des Images Truquées, Article de Manon PAULIC
Pas encore d'évaluation
Résumé Du Voyage Au Pays Des Images Truquées, Article de Manon PAULIC
1 page
Liste Des Chaines Fransat 26 - Fevrier - 2025
Pas encore d'évaluation
Liste Des Chaines Fransat 26 - Fevrier - 2025
2 pages
Analyse du Risque Foudre LIDL Cestas
Pas encore d'évaluation
Analyse du Risque Foudre LIDL Cestas
60 pages
Lean Manufacturing Maitriser Les Outils
Pas encore d'évaluation
Lean Manufacturing Maitriser Les Outils
4 pages
L'ecole Ivoirienne
Pas encore d'évaluation
L'ecole Ivoirienne
2 pages
Rapport MAROC
Pas encore d'évaluation
Rapport MAROC
88 pages
Aciers D'usage Général. Classification Et Métallurgie
Pas encore d'évaluation
Aciers D'usage Général. Classification Et Métallurgie
12 pages
TP Entrepreneuriat-Revue Empirique
Pas encore d'évaluation
TP Entrepreneuriat-Revue Empirique
5 pages
Exercices Cinetique Enzymatique
Pas encore d'évaluation
Exercices Cinetique Enzymatique
7 pages
Partie Pratique AKDITAL Autosaved
Pas encore d'évaluation
Partie Pratique AKDITAL Autosaved
6 pages
FP Test Calatase Et Oxydase
Pas encore d'évaluation
FP Test Calatase Et Oxydase
2 pages
Résolution des litiges au sein des clubs
Pas encore d'évaluation
Résolution des litiges au sein des clubs
2 pages
Cours de Droit Rural à Madagascar
Pas encore d'évaluation
Cours de Droit Rural à Madagascar
28 pages
Loi sur la Transplantation d'Organes
Pas encore d'évaluation
Loi sur la Transplantation d'Organes
9 pages
Bulmi 0037-9328 1969 Num 92 4 6387 t1 0400 0000 3
Pas encore d'évaluation
Bulmi 0037-9328 1969 Num 92 4 6387 t1 0400 0000 3
2 pages
Projet de fin d'études sur le raffinage d'huiles
Pas encore d'évaluation
Projet de fin d'études sur le raffinage d'huiles
45 pages
Mesurez Ce Qui Compte. John Doerr
Pas encore d'évaluation
Mesurez Ce Qui Compte. John Doerr
21 pages
SCADA
100% (1)
SCADA
19 pages
Contrôle de Gestion et Audits : Guide Complet
Pas encore d'évaluation
Contrôle de Gestion et Audits : Guide Complet
60 pages
Sikaproof A 08
Pas encore d'évaluation
Sikaproof A 08
6 pages
1 Rapport Installation Et Configuration D'un Serveur IPBX Asterisk
Pas encore d'évaluation
1 Rapport Installation Et Configuration D'un Serveur IPBX Asterisk
10 pages
TDRs Pour RecruteAssis Tech SBR
Pas encore d'évaluation
TDRs Pour RecruteAssis Tech SBR
11 pages
Signalisation Verticale à Paris
Pas encore d'évaluation
Signalisation Verticale à Paris
43 pages
BilanetCR PackInbox - XLSX 1
Pas encore d'évaluation
BilanetCR PackInbox - XLSX 1
14 pages
Révisions Math
Pas encore d'évaluation
Révisions Math
4 pages
Gagnez 1000€ par semaine avec WIGL
100% (1)
Gagnez 1000€ par semaine avec WIGL
6 pages
Organiser une réunion efficace pour projet immobilier
Pas encore d'évaluation
Organiser une réunion efficace pour projet immobilier
2 pages
Capteur numérique GT2 : Précision et Durabilité
Pas encore d'évaluation
Capteur numérique GT2 : Précision et Durabilité
22 pages
Ue 3 Oc PDF
Pas encore d'évaluation
Ue 3 Oc PDF
14 pages
Stratégie BRIC d'ACCOR
Pas encore d'évaluation
Stratégie BRIC d'ACCOR
85 pages

Guide complet sur les expressions régulières

Transféré par

Guide complet sur les expressions régulières

Transféré par

Un outil bien utile: les expressions régulières

(r) r (délimiteur/capture) [ a1 ...an ] 1 caractère: a1 ou a2 ou...

ˆ début du texte Posix Description PCRE

$ fin du texte [:alpha:] [A-Za-z]

L’ordre de priorité des opérateurs est le suivant:

[a-z]+0 reconnaît texte contenant une ou plusieurs minuscules suivies de 0.

ˆ[0-9]{10}$ reconnaît texte (ligne) qui consiste en un nombre à 10 chiﬀres.

[ˆ0-9]{1,4} va sélectionner: 12ac34589:#@$45

[[:alpha:]]*[[:digit:]][ˆ[:alnum:],]+ va sélectionner: A#589:#@,aa$b45

(ab|cd)+ee|ˆab va sélectionner: abaacdzcdabeez

([a-c])z\1\1 reconnaît azaa mais pas azcc.

([a-c])z\1\1 équivaut à (?P<lettre>[a-c])z\1\1 et à (?<le>[a-c])z\k<le>\k<le>

sed est un outil très complet pour sélectionner ou modifier du texte.

ack: usage plus pratique que grep (voir [Link]

perl -ne '/\B\u/ && print' [Link] similaire à grep -e ... †

Pattern p = [Link]("([a-z ]*)\\s*side");

[Link]([Link]()); //false: should match entire region

Classes non supportées: \l \L \u \U. Conditions pas supportées non plus.

val motif: Regex = """(\d\d\d\d)-(\d\d)-(\d\d)""".r // .r transforme en regexp

val allYears = for (m <- [Link](dates)) yield [Link](1)

val YearsOnly = [Link](dates, m => [Link](1))

motif = [Link]('\d\d? \w+ \d{4}')

[Link]('ab','zabc') is None # matches only from start of string.

[Link](r'\W','et tu, Brute') == ['et', 'tu', '', 'Brute']

On peut aussi appeler une librairie regexp à travers des UDF.

[Link] includes some book reviews.

Vous aimerez peut-être aussi

Pattern p = [Link]("([a-z ])\\sside");