100% ont trouvé ce document utile (3 votes)
554 vues247 pages

Orchestration musicale par optimisation

Ce document présente une thèse de doctorat préparée à l'IRCAM sur l'approche computationnelle de l'orchestration musicale. Il introduit les concepts clés liés à l'informatique musicale, au timbre, à l'orchestration et à l'optimisation multicritère sous contraintes pour l'aide à l'orchestration.

Transféré par

Cibelle J. Donza
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (3 votes)
554 vues247 pages

Orchestration musicale par optimisation

Ce document présente une thèse de doctorat préparée à l'IRCAM sur l'approche computationnelle de l'orchestration musicale. Il introduit les concepts clés liés à l'informatique musicale, au timbre, à l'orchestration et à l'optimisation multicritère sous contraintes pour l'aide à l'orchestration.

Transféré par

Cibelle J. Donza
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

THESE DE DOCTORAT

UNIVERSITE PARIS VI PIERRE ET MARIE CURIE

ECOLE DOCTORALE DINFORMATIQUE, TELECOMUNICATIONS


ET ELECTRONIQUE (EDITE) DE PARIS
Spcialit Informatique

Prpare lIRCAM
par
Grgoire Carpentier

En vue de lobtention du titre de

DOCTEUR DE LUNIVERSITE PIERRE ET MARIE CURIE

Approche computationnelle de lorchestration musicale


Optimisation multicritre sous contraintes
de combinaisons instrumentales dans de grandes banques de sons

Thse soutenue le 16 dcembre 2008

devant le jury compos de :

Emmanuel Saint-James Co-directeur LIP6-CNRS


Grard Assayag Co-directeur IRCAM-CNRS
Myriam Desainte-Catherine Rapporteure Universit de Bordeaux-1
Narendra Jussien Rapporteur Ecole des Mines de Nantes
Patrice Perny Prsident LIP6-CNRS
Camilo Rueda Examinateur Pontifica Universidad Javeriana-Cali, Colombie
Stephen McAdams Examinateur McGill University, Montral
Fabien Lvy (compositeur) Examinateur Columbia University, New-York
Thse prpare lIRCAM
(Institut de recherche et de coordination acoustique/musique)

Sous la direction de Grard Assayag et Emmanuel Saint-James

IRCAM-CNRS UMR STMS 9912


Equipe Reprsentations musicales
1 place Igor Stravinsky
F-75004 Paris France
Merci. . .

. . . Grard Assayag pour sa confiance et son soutien, Emmanuel Saint-James pour ses
conseils et sa prcieuse relecture du manuscrit ;

. . . Hugues Vinet pour son accueil au sein du dpartement scientifique de lIRCAM, Arshia
Cont pour son enthousiasme et pour les rencontres qui nauraient pas eu lieu sans lui ;

. . . Yan Maresz pour son implication et sa foi dans le projet Orchestration, ainsi qu Damien
Tardieu pour la richesse de nos changes ;

. . . Georges Bloch pour sa sagesse et sa bienveillance ;

. . . aux nombreux compositeurs avec qui jai collabor, Marco Suarez, Oscar Bianchi, Jonathan
Harvey, Joshua Fineberg, Grard Buquet, Mauro Lanza, Tristan Murail, Raphal Cendo ;

. . . au personnel de lIRCAM, au service informatique, lquipe Reprsentations musicales,


aux doctorants, aux gars du bureau A107, et tous ceux qui font vivre linstitut au quotidien,
Sylvie, Carole, Didier, Bruno, Michel ;

. . . mes parents, mes grand-parents, tous ceux qui mont soutenu, Sigrid.

v
Table des matires

Remerciements v

Rsum xi

Abstract xiii

Introduction xv
0.1 Dmarche scientifique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvi
0.2 Structure du manuscrit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviii
0.3 Grilles de lectures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xx
0.4 Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xx

I Etats des arts 23

1 Informatique musicale 25
1.1 Musique et technologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2 Le tournant de llectronique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3 Fonctions de lInformatique musicale . . . . . . . . . . . . . . . . . . . . . . . . 26

2 Le timbre, objet et fonction 29


2.1 Emergence du timbre dans la musique du XXe sicle . . . . . . . . . . . . . . . 29
2.2 Paradoxes et polysmies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3 Le timbre comme langage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4 Fonctions du timbre : contraste et continuit . . . . . . . . . . . . . . . . . . . . 33
2.5 Espaces de timbres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.6 Timbre et description du signal audio . . . . . . . . . . . . . . . . . . . . . . . . 35

3 Orchestration : un savoir empirique en mutation 37


3.1 Orchestration et instrumentation . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2 Les traits clbres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3 Vers un trait dorchestration contemporain ? . . . . . . . . . . . . . . . . . . . 40
3.4 Orchestrer avec lordinateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4 Aide lorchestration 43
4.1 Convergence et maturit des savoirs . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Discours de compositeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

vii
4.3 Outils actuels daide lorchestration . . . . . . . . . . . . . . . . . . . . . . . . 45

5 Optimisation combinatoire multicritre 49


5.1 Recherche oprationnelle, complexit . . . . . . . . . . . . . . . . . . . . . . . . 49
5.2 Thorie des approches multicritres . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.3 Classification des mthodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.4 Convexit du front de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.5 Introduction aux algorithmes gntiques . . . . . . . . . . . . . . . . . . . . . . 56
5.6 Algorithmes de rfrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.7 Fonctions scalarisantes de Tchebycheff . . . . . . . . . . . . . . . . . . . . . 63
5.8 Maintien de la diversit par la mthode PADE . . . . . . . . . . . . . . . . . . 65

6 Programmation par contraintes 69


6.1 Principes gnraux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.2 Contraintes et informatique musicale . . . . . . . . . . . . . . . . . . . . . . . . 70
6.3 Mthodes compltes de rsolution . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.4 Mtaheuristiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.5 Recherche adaptative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.6 Lheuristique CN -tabou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.7 Contraintes et algorithmes gntiques . . . . . . . . . . . . . . . . . . . . . . . . 77

Rsum de la premire partie 81

II Algorithme de recherche dorchestrations 83

7 Formulation du problme 85
7.1 Donnes du systme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
7.2 Paradigmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.3 Dfinitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.4 Formalismes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.5 Contraintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.6 Dun espace lautre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

8 Validation sur une description rduite 101


8.1 Description rduite du timbre instrumental . . . . . . . . . . . . . . . . . . 101
8.2 Cration dune base de test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
8.3 Evaluation des fonctions dagrgation et de comparaison . . . . . . . . . . . . . 110
8.4 Position de la solution thorique dans lespace des critres . . . . . . . . . . . . 113
8.5 Qualit des solutions du front de Pareto . . . . . . . . . . . . . . . . . . . . . . 117

9 Algorithme dorchestration 129


9.1 Un problme de sac dos ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
9.2 Modlisation et encodage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
9.3 Calcul de fitness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
9.4 Maintien de la diversit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
9.5 Pseudo-code . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
9.6 Extension aux modles dinstruments . . . . . . . . . . . . . . . . . . . . . . . . 138
10 Gestion des contraintes 139
10.1 Contraintes en orchestration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
10.2 Contraintes de design, contraintes de conflit . . . . . . . . . . . . . . . . . . . . 144
10.3 CDCSolver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
10.4 Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
10.5 Intgration de dans lalgorithme dorchestration . . . . . . . . . . . . . . . . . . 154
10.6 Contraintes et volution temporelle . . . . . . . . . . . . . . . . . . . . . . . . . 155

11 Tests de performances 159


11.1 Evaluation des mthodes multicritres . . . . . . . . . . . . . . . . . . . . . . . 159
11.2 Mesures de qualit retenues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
11.3 Performances de lalgorithme dorchestration . . . . . . . . . . . . . . . . . . . . 165

Rsum de la deuxime partie 173

III Outil daide lorchestration 175

12 Prototype actuel 177


12.1 Architecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
12.2 Composantes hrites des outils existants . . . . . . . . . . . . . . . . . . . . . 179
12.3 Considrations sur les limites actuelles . . . . . . . . . . . . . . . . . . . . . . . 183

13 Scnario dutilisation 189


13.1 Donnes dentre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
13.2 Visualisation des solutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
13.3 Edition, affinage, transformation . . . . . . . . . . . . . . . . . . . . . . . . . . 196

14 Exemples et productions 201


14.1 Deux orchestrations de klaxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
14.2 Une cible construite dans OpenMusic (Tristan Murail) . . . . . . . . . . . . . 203
14.3 Une cible dynamique (Oscar Bianchi) . . . . . . . . . . . . . . . . . . . . . . . . 204
14.4 Speakings (Jonathan Harvey) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
14.5 Un exemple de production sonore (Grard Buquet) . . . . . . . . . . . . . . . . 210

Rsum de la troisime partie 213

Conclusion 217

IV Annexes 223

A Descripteurs : extraction, agrgation, comparaison 225

B Norme induite par une configuration 231

Table des figures 234


Liste des tableaux 235

Liste des algorithmes 237

Glossaire 239

Bibliographie 247
Rsum

De toutes les composantes de lcriture musicale, lorchestration ou lart dassembler


les timbres intrumentaux est longtemps demeure, dans son enseignement comme dans sa
pratique, une activit empirique. La difficult de formaliser de manire rigoureuse lensemble
des techniques inhrentes cette discipline fait quaujourdhui encore, lorchestration reste un
domaine peu abord par linformatique musicale et laide la composition.
Les rares outils actuels ramnent le problme de lorchestration la dcouverte, au sein
de banques dchantillons sonores instrumentaux, de combinaisons approchant au mieux un
timbre fix par le compositeur. Cette approche sera galement la ntre. Mais l o les mthodes
actuelles contournent systmatiquement le problme combinatoire de lorchestration par le
recours des principes de dcomposition ou des algorithmes de matching pursuit, loriginalit
de notre dmarche est de placer les enjeux combinatoires au cur de nos travaux et de traiter
lorchestration la mesure de sa complexit.
Envisageant tout dabord la question comme un problme de sac dos multi-objectifs,
nous montrons que les non-linarits dans les modles de perception du timbre imposent un
cadre thorique plus large pour laide lorchestration. Nous proposons une formalisation g-
nrique et extensible en nous plaant dans un cadre de recherche combinatoire multicritre
sous contraintes, dans lequel plusieurs dimensions perceptives sont optimises conjointement
pour approcher un timbre cible dfini par le compositeur. Nous validons dans un premier
temps notre approche thorique en montrant, sur un ensemble de problmes de petite taille
et pour une caractrisation exclusivement spectrale du timbre, que les solutions du problme
formel correspondent des propositions dorchestration pertinentes. Nous prsentons alors
un algorithme volutionnaire permettant de dcouvrir en un temps raisonnable un ensemble
de solutions optimales. Sappuyant sur la prdiction des proprits acoustiques des alliages
instrumentaux, cette mthode propose des solutions dorchestration en fonction de critres
perceptifs et encourage ainsi la dcouverte de mlanges de timbres auxquels le savoir et lex-
prience nauraient pas ncessairement conduit. En outre, la recherche peut-tre tout moment
oriente dans une direction privilgie. Paralllement, nous dfinissons un cadre formel pour
lexpression de contraintes globales et introduisons une mtaheuristique innovante de rsolu-
tion, permettant de guider la recherche vers des orchestrations satisfaisant un ensemble de
proprits symboliques en lien direct avec lcriture musicale.
Nous prsentons enfin un prototype exprimental doutil daide lorchestration utilisable
directement par les compositeurs, dans lequel lexploration des possibilits de timbres est
facilite travers une reprsentation multi-points de vue des solutions et un mcanisme inter-
actif des prfrences dcoute. Nous terminons avec une srie dexemples dapplication de nos
travaux des problmes compositionnels concrets.

xi
Mots cls : Orchestration, composition assiste par ordinateur, informatique musicale, timbre,
description du signal, descripteurs perceptifs, optimisation multicritre, algorithmes volution-
naires, programmation par contraintes, contraintes globales, recherche locale.
Abstract

Among all techniques of musical composition, orchestration has never gone further than
an empirical activity. Practicing and teaching orchestration the art of blending instrument
timbres together involve hard-to-formalize knowledge and experience that computer music
and composition systems have for years stayed away from.
The state-of-the-art orchestration tools search for sound combinations within instrument
sample databases that best match a target timbre defined by the composer. To this end, those
methods use either decomposition or matching pursuit algorithms, and therefore circumvent
to the combinatorial problem of orchestration. We propose in this thesis an original approach
for the discovery of relevant sound combinations, in which we explicitly address combinatorial
issues and tackle orchestration in its inner complexity.
Initial considerations of the problem in a multiobjective knapsack framework shows that
non-linearity and non-additivity of objective functions require a wider theoretic approach. We
suggest a generic and easily extendible formalization of orchestration as a constrained mul-
tiobjective search towards a target timbre, in which several perceptual dimensions are jointly
optimized. We first validate our approach on a small-size problems test set, with a rather
simple, spectral-based timbre description. We show that theoretic solutions of the optimiza-
tion problem correspond to perceptually relevant orchestration proposals. We then introduce
a time-efficient evolutionnary orchestration algorithm allowing the discovery of optimal solu-
tions. By estimating acoustic properties of sound mixtures, our method suggests orchestration
proposals in relation with perceptual criteria and favors the exploration of somehow non-
intuitive sound mixtures. From there, the search may be pursued in specific directions. To
enhance the control of symbolic features in orchestrations proposals, we define a formal fra-
mework for global constraints specification and introduce an innovative repair metaheuristic.
Thanks to this method the search is led towards regions fulfulling a set of musical-related
requirements.
We finally present a composer-friendly computer-aided orchestration prototype, in which
timbre space exploration is encouraged by a multiple viewpoints representation and an inter-
active mecanism for guessing the composers listening preferences. We end this thesis with
relevant application examples in real musical works.

Key words : Orchestration, computer-aided composition, computer music, audio signal des-
cription, perceptual audio features, multi-objective optimization, evolutionary algorithms,
constraint programming, global constraints, local search.

xiii
Introduction

La musique est un art-science dont laspect en tant quart change ncessaire-


ment lorsque la science lui offre de nouvelles possibilits structurelles et que la vie
rclame delle ce dont elle a besoin.
Edgar Varse

Nos travaux sont ns dune problmatique dcriture musicale, terrain dlicat pour la re-
cherche scientifique qui touche l une technique dont lapprciation est soumise un jugement
esthtique, et dont les mcanismes paraissent difficilement formalisables. Au yeux des no-
phytes, linformatique musicale est souvent perue comme un non-sens, et la question des
rapports entre musique et ordinateur, dplace. Pourtant Varse lexprime travers la no-
tion d art-science la musique nest pas un simple cran de projection pour les techniques,
mais une entit bicphale o lart et la technologie ne cessent de sinterroger.
A ceux qui avancent que les compositeurs nont pas besoin dun ordinateur pour crire, nous
pourrions rpondre que lhomme na pas besoin non plus dun systme symbolique complexe
de notation, ni mme dinstruments pour produire de la musique. Il lui suffit douvrir la
bouche. Mais depuis les temps primitifs o le chant tait la seule pratique musicale, les socits
ont volu vers des formes bien plus complexes, et la musique ne peut faire autrement que
cristalliser cette complexit. En tmoignent aujourdhui la richesse des formes et des pratiques
dexpression musicale, ainsi que la rcurrence avec laquelle sont mis en question les rapports
entre musique et socit.
Lhistoire de la musique est jalonne de ruptures qui marquent ces moments critiques o
les ressources du systme musical ne suffisent plus pourvoir son besoin de complexit .
La musique se tourne alors vers la technologie, dont lapport nest pas synonyme dun ap-
pauvrissement des comptences, mais au contraire dun enrichissement du vocabulaire et des
pratiques. En retour la recherche scientifique, lorsquelle se penche sur des problmatiques mu-
sicales, na dautre choix que de laborder dans sa complexit. Imprgne de la complexit
du monde contemporain, la musique sollicite la science tout autant quelle la dfie : la seconde
peut-elle penser la complexit comme la premire la reflte ?
Les problmatiques musicales qui nous intressent ici concernent une discipline particulire
de lcriture : lorchestration, ou lart de mlanger les timbres, dallier les potentialits sonores
des instruments pour produire des couleurs particulires. Aujourdhui, lorchestration de-
meure le seul domaine de lcriture musicale ntre que trs peu abord par linformatique,
alors que les compositeurs rclament depuis plusieurs dcennies un outil dexploration et de
contrle du timbre orchestral qui tiennent compte de la formidable extension, depuis le dbut
du XXe xicle, des possibilits instrumentales. Daprs nous, cette lacune tient la difficult de

xv
xvi INTRODUCTION

formaliser les relations complexes entre les variables symboliques de lcriture et les proprits
perceptives des mlanges instrumentaux. A y regarder de prs, la complexit de lorchestration
se dcline selon trois axes : complexit combinatoire, complexit de la perception du timbre,
et complexit de lvolution temporelle. Si quelques rares systmes daide lorchestration
existent aujourdhui, aucun dentre eux ne traite ne serait-ce que lune de ces dimensions : le
temps nest jamais modlis, le problme combinatoire est toujours contourn, le timbre est
rduit une unique dimension.
Le travail que nous prsentons dans cette thse a t motiv par le dsir daborder, autant
que faire ce pouvait, le problme de lorchestration dans toute sa complexit.

0.1 Dmarche scientifique


Sensible la demande insistante des compositeurs de disposer, au sein dun environnement
de composition assiste par ordinateur, dun outil puissant pour le contrle et dexploration
du timbre orchestral, lIRCAM1 a encourag il y a quelques annes la cration dun groupe
de travail runissant chercheurs et compositeurs sur ce sujet. Il en est ressorti un cahier des
charges dfinissant un ensemble de priorits de recherche court et moyen terme. Devant
lampleur des travaux quun domaine si vaste et si complexe ouvrait, deux thses de doctorat
sur laide lorchestration ont dbut lIRCAM durant lanne 2005, et furent conduites en
parallle. La prsente thse a t mene dans lquipe Reprsentations musicales de lIRCAM
(en charge notamment du dveloppement doutils avancs pour la composition assiste par
ordinateur), en collaboration troite avec Damien Tardieu, doctorant dans lquipe Analyse-
synthse (dont les travaux sont, entre autres, consacrs la description et la modlisation du
signal audio).
Cette sparation des tches tait indispensable pour aborder le problme de lorchestration
assiste par ordinateur selon diffrents axes de complexit. Les travaux de Damien Tardieu
ont essentiellement consist en llaboration dun cadre formel adapt la caractrisation du
timbre instrumental et orchestral. Il sagissait dabord didentifier un ensemble de dimensions
perceptives pertinentes pour la description du timbre, puis de trouver un moyen dextraire
automatiquement ces proprits partir de grandes banques dchantillons, pour enfin mettre
au point un modle capable de prdire les caractristiques acoustiques de mlanges instrumen-
taux. Ce travail a dbouch sur llaboration de modles dinstruments qui permettent des-
timer la probabilit quune combinaison instrumentale possde une caractristique du timbre
dsir par le compositeur.
Nous nous sommes quant nous concentr sur les difficults lies aux aspects combinatoires
du problme. Lorchestration est en effet lart subtil et dlicat des alliages instrumentaux, et il
suffit de considrer lventail de timbres couvert par chaque instrument pour se faire une ide
de ltendue des possibilits sonores offertes par un orchestre. Une telle explosion combinatoire
interdisant le recours des mthodes compltes de rsolution, nous nous sommes tourn du
ct des mtaheuristiques dont lutilisation de plus en plus frquente ces dernires annes
en optimisation combinatoire et en programmation par contraintes a permis de traiter des
problmes trs complexes.
Menes en parallle, ces deux approches de lorchestration ont permis de daborder deux
dimensions de sa complexit : celle inhrente au caractre multidimensionnel de la perception
du timbre et celle lie aux enjeux combinatoires. Les aspects temporels du timbre, o se
1
Institut de recherche et de coordination acoustique/musique. http://www/ircam.fr/
0.1. DMARCHE SCIENTIFIQUE xvii

conjuguent verticalit et horizontalit de lcriture2 , ont t dans un premier temps laisss de


ct. Ils nauront t abords dans nos travaux respectifs que de manire partielle ou indirecte,
dans la limite de ce que les cadres thoriques dans lequels nous traitons le problme statique
du timbre pouvaient supporter.

En thorie, le dveloppement dun algorithme doptimisation combinatoire ne pouvait d-


buter quune fois les recherches sur la modlisation du timbre instrumental parvenues un
degr suffisant de maturit. Or, les deux thses ayant t mens simultanment, il nous tait
impossible dattendre le terme de ce travail de modlisation. Nous avons donc labor la
stratgie dcrite ci-dessous.

Le timbre vu comme un ensemble de descripteurs du signal

Aprs avoir pos le problme de laide lorchestration comme la recherche de combinaisons


de sons sapprochant le plus possible dun timbre dfini par le compositeur, nous avons fait le
choix dun cadre thorique dans lequel traiter rapidement le problme de la caractrisation du
timbre. Nous avons opt pour une approche par descripteurs, qui consiste calculer directe-
ment sur le signal audio une information lie aux proprits perceptives du son. On peut ainsi,
partir de grandes banques dchantillons sonores, parvenir une connaissance synthtique
et formalise des possibilits de timbres offertes par les instruments. Ntant toutefois pas sp-
cialiste du domaine, nous nous sommes restreint des descripteurs exclusivement spectraux,
et pour lesquels la construction de fonctions daddition tait accessible notre expertise.
En effet, il ne suffit pas dextraire les proprits sonores dchantillons instrumentaux, en-
core faut-il pouvoir calculer ces proprits pour des combinaisons de sons. Nous avons retenu
trois descripteurs spectraux pour la caractrisation du timbre instrumental, et avons montr
que leurs fonctions daddition respectives permettaient bien destimer les descripteurs de
mixtures instrumentales.

Lorchestration comme recherche multicritre de combinaisons

Le problme de lorchestration a alors pu tre reformul : partir dune cible sonore


dfinie par un ensemble de descripteurs, comment dcouvrir les combinaisons de sons dont les
descripteurs sapprochent le plus possible de ceux de la cible ? Le timbre tant dcrit dans
un espace multidimensionnel, nous avons montr que les distances perceptives selon chaque
dimension ne pouvaient tre agrges en une valeur unique et quil fallait nous rsoudre
une approche multicritre, dans laquelle les diffrentes dimensions du timbre sont optimises
conjointement. Nous avons alors montr sur des instances de petite taille et pour une descrip-
tion rduite du timbre que les solutions optimales du problme doptimisation sont bien des
propostions pertinentes dun point de vue perceptif. Nous nous sommes ainsi assur que le
problme de lorchestration, formul comme une tche doptimisation multicritre, tait bien
pos .

2
Ces deux dimensions de lcriture se rfrent au plan de la partition. Lcriture verticale dsigne lagen-
cement des diffrentes voix (cest--dire les instruments de lorchestre) un instant donn, l o lcriture
horizontale concerne le dveloppement dans le temps dune seule voix.
xviii INTRODUCTION

Recherche de combinaisons laide de mtaheuristiques


La recherche de sous-ensembles limits par une contrainte de capacit celle lie au
nombre restreint dinstruments disposition dans lorchestre nous a dabord incit nous
ramener un problme de sac dos, pour lequel il existe une multitude dapproches et de
mthodes de rsolution. Malheureusement le caractre fortement non-linaire et non-additif
de nos fonctions objectifs nous a impos un cadre thorique plus large. Nous avons alors in-
troduit une reprsentation des propositions dorchestration facilement manipulable par une
mtaheuristique doptimisation, grce laquelle les contraintes lies leffectif orchestral sont
implicitement satisfaites. Nous avons par ailleurs conu un algorithme gntique multicritre
permettant de dcouvrir en un temps raisonnable un ensemble diversifi de propositions effi-
cientes dorchestration. Notre algorithme utilise un principe dagrgation des critres laide
de fonctions scalarisantes alatoires, favorisant ainsi loptimisation de la population selon plu-
sieurs critres perceptifs considrs conjointement. Un mcanisme dinteraction avec le compo-
siteur permet en outre dinfrer un certain nombre dhypothses sur ses prfrences implicites
dcoute et de guider la recherche vers une rgion privilgie de lespace. Afin de faciliter lin-
tgration des solutions optimales dans un processus compositionnel de plus grande envergure,
nous avons imagin un langage lmentaire pour la spcification de contraintes globales sur les
variables symboliques de lcriture musicale. Nous avons ensuite propos une mtaheuristique
innovante de satisfaction des contraintes, base sur la distinction entre contraintes de design
et contraintes de conflit. Nous avons enfin montr comment le problme du temps en orches-
tration pouvait tre abord laide de contraintes. Toutes ces mthodes ont t valides sur
diffrentes classes de problmes dorchestration par un processus dvaluation multi-expert.

Dveloppement dun prototype


En parallle de nos recherches, nous avons tir parti de nos multiples changes avec les com-
positeurs pour concevoir et dvelopper un prototype doutil daide lorchestration. Celui-ci
a permis la fois de valider exprimentalement notre approche computationnelle de lorches-
tration et didentifier un certain nombre de pistes de recherches futures. Si les restrictions que
nous nous sommes imposes dans le cadre de ce travail confinent invitablement ce prototype
une certaine esthtique musicale, la satisfaction des compositeurs layant utilis nen constitue
pas moins la marque dune russite dont nous sommes fier.

Il nous faut encore signaler ici qu lheure o nous crivons ces lignes, lintgration au sein
de notre outil du travail de Damien Tardieu sur les modles dinstruments na pas encore t
effectue. Toutefois notre systme, bien que bas sur une connaissance rduite des possibilits
instrumentales, nous a dj permis dobtenir des rsultats significatifs, laissant augurer des
performances dcuples grce aux modles dinstruments. Aussi ne manquerons-nous pas de
discuter, en divers endroits de cette thse, leur apport potentiel pour laide lorchestration.

0.2 Structure du manuscrit


Ce document est organis en trois grandes parties. La premire partie est un tat des
arts qui, en guise dentre en matire dans une recherche pluridisciplinaire, commence par
interroger (chapitre 1) la nature des rapports entre musique et technologie ainsi que les en-
jeux de linformatique musicale. La question du timbre est souleve au chapitre 2. De son
0.2. STRUCTURE DU MANUSCRIT xix

mergence comme fonction essentielle de lcriture musicale au XXe sicle jusqu sa compr-
hension travers des tudes perceptives psychoacoustiques, et sa caractrisation par lanalyse
et la description du signal audio, un clairage multiple est port sur la complexit de cet
objet dtude. Le chapitre 3 traite de lorchestration musicale proprement dite, expose les
fondements et les limites de sa pratique traditionnelle et tente de dgager le rle potentiel de
lordinateur dans une vision contemporaine de lorchestration. Nous montrons ensuite (cha-
pitre 4) en quoi la rencontre entre, dune part, le besoin actuel des compositeurs, et dautre
part des technologies et des savoirs suffisament matures, ouvre un vaste champ de recherche
pour lorchestration assiste par ordinateur. Nous prsentons les contributions rcentes dans
le domaine, exposons leurs apports et leurs limites et discutons en quoi ces dernires peuvent
tre dpasses. Au chapitre 5, nous entrons au cur de notre sujet de recherche : nous intro-
duisons les concepts fondamentaux des approches multicritres et proposons un tat de lart
des mthodes doptimisation combinatoire, en portant une attention toute particulire aux
algorithmes gntiques. Nous dtaillons en outre deux concepts rcents dont sinspire notre al-
gorithme de recherche dorchestrations, lagrgation des critres par fonctions scalarisantes de
Tchebycheff et lestimation de la densit locale au sein de la population par la mthode PADE
(Population size Adaptive Density Estimation). Enfin, le chapitre 6 est consacr au paradigme
de programmation par contraintes et aux mthodes associes, ainsi qu leur utilisation en
informatique musicale. L encore, nous approfondissons deux heuristiques de recherche locale
ayant influenc nos travaux, la recherche adaptative et lheuristique CN -Tabou.

La seconde partie de ce manuscrit est consacre notre propre contribution au problme


de laide lorchestration. Nous commenons par poser, au chapitre 7, un cadre formel gn-
rique grce auquel lorchestration musicale peut tre saisie selon deux axes de complexit. Le
premier est celui de lexplosion combinatoire des possibilits sonores au sein de lorchestre, le
second celui du caractre multidimensionnel de la perception du timbre. Nous validons cette
approche au chapitre 8 sur des instances de complexit rduite. Nous calculons pour cela les
solutions optimales de problmes de petite taille et de faible dimensionnalit et montrons
quelles correspondent des alliages pertinents dun point de vue perceptif. Un algorithme
gntique multicritre de recherche dorchestrations est alors propos au chapitre 9. Bas sur
une agrgation alatoire des critres, il permet de chercher des solutions selon diffrentes pr-
frences dcoute. Nous le modifions au chapitre 10 afin de prendre en compte des contraintes
additionnelles. Nous introduisons un cadre formel pour lexpression de contraintes symbo-
liques globales ainsi quune heuristique de rsolution base sur la distinction entre contraintes
de design et contraintes de conflit. Enfin, nous prsentons au chapitre 11 une valuation multi-
expert et itrative de notre mthode de recherche. Lintrt de chaque module de lalgorithme
y est discut selon plusieurs critres de performance.

Un prototype exprimental doutil dorchestration fait lobjet de la troisime partie. Nous


en prsentons larchitecture gnrale au chapitre 12, montrons comment il sarticule avec les
technologies existantes, en discutons les limitations techniques et esthtiques actuelles. Au cha-
pitre 13, un scnario dutilisation retrace un processus complet daide lorchestration, depuis
la dfinition du timbre souhait jusqu la partition finale. Laccent est port sur linteraction
avec le compositeur et la dcouverte de ses prfrences dcoute. Le chapitre 14 rapporte enfin
cinq exemples concrets dutilisation de notre outil, dont certains sont issus de collaborations
troites avec des compositeurs et ont t utiliss dans lcriture de leurs uvres.
xx INTRODUCTION

0.3 Grilles de lectures


Selon les connaissances du lecteur et son intrt pour lun ou lautre des thmes abords,
de nombreux parcours de lecture sont possibles. Nous flchons quelques itinraires :
Le lecteur moins sensible aux problmatiques musicales contemporaines et au contexte
esthtique dans lequel sinscrit cette recherche peut se rendre directement au chapitre 4
qui, sans rentrer encore dans des considrations techniques, dfinit le cadre gnral de
nos travaux.
Les compositeurs sont tout particulirement concerns par la troisime partie. Dans la
premire, ils peuvent se contenter du chapitre 4, dans la seconde du chapitre 7, qui suffit
pour saisir notre approche formelle de laide lorchestration.
Pour le lecteur familier de la programmation par contrainte et de loptimisation com-
binatoire multicritre, la fin du chapitre 2 (en particulier les sections 2.5 et 2.6) et le
chapitre 4 doivent suffire pour saisir les enjeux et les difficults de notre sujet.
Le psychoacousticien ou le chercheur concern par des problmatiques de perception
auditive est invit se rendre aux chapitres 2, 7 et 8, ainsi bien sr qu la partie III.
Enfin, le chapitre 11 sadresse en priorit aux lecteurs familiers des mthodes multicri-
tres et de lvaluation de leurs performances.

En toutes circonstances, la lecture du chapitre 4 reste indispensable pour situer notre


dmarche par rapport la demande des compositeurs et aux solutions scientifiques qui leur
sont aujourdhui offertes. Quant au chapitre 7, il condense lessentiel de notre contribution
sur le plan thorique au problme de laide lorchestration. Le lecteur souhaitant reposer ses
yeux pourra en outre couter tous les exemples de la partie III (et bien dautres) sur le site :
http://recherche.ircam.fr/equipes/repmus/carpentier/phdsounds/.

0.4 Contributions
La contribution de notre travail la littrature se rsume en sept points :
une formalisation gnrique et extensible du problme de laide lorchestration (chapitre
7) comme une tche doptimisation multicritre sous contraintes ;
une validation exprimentale (chapitre 8) de la pertinence de descripteurs spectro-
harmoniques pour la caractrisation perceptive du timbre dans le cadre de sons com-
plexes ;
un algorithme volutionnaire doptimisation combinatoire multicritre adapt au pro-
blme de lorchestration (chapitre 9) ; respectant lquilibre entre intensification et di-
versification de la recherche et pouvant tenir compte des prfrences de lutilisateur.
une gnralisation des notions dinstanciation partielle et de consistance locale dans les
problmes de satisfaction de contraintes, travers les concepts de contraintes de design
et contraintes de conflit ;
une mtaheuristique de recherche locale pour la satisfaction de contraintes globales (cha-
pitre 10), sappuyant sur la distinction entre contraintes de design et contraintes de
conflit.
0.4. CONTRIBUTIONS xxi

une validation exprimentale, sur des instances de petite taille, de lefficacit des deux
mthodes prcdentes (chapitre 11) ;
un prototype exprimental daide lorchestration (chapitres 12, 13 et 14), facilitant lex-
ploration du timbre orchestral via une reprsentation multi-points de vue des solutions
et favorisant la dcouverte des prfrences implicites du compositeur.
xxii INTRODUCTION
Premire partie

Etats des arts

23
Chapitre 1

Informatique musicale

En quoi la musique a besoin de la technologie


La composition comme processus
Informatique musicale et paradigmes de programmation

Les amalgames trop frquents entre informatique musicale, musique assiste par ordina-
teur, musique lectronique et musique contemporaine sont source de bien des malentendus.
Si lordinateur est devenu un outil incontournable pour les musiciens actuels, linformatique
musicale se limite pour la plupart des utilisateurs aux squenceurs, instruments virtuels et
diteurs de partition. Les rapports riches et multiples entre ordinateur et cration musicale
contemporaine (et plus gnralement entre informatique et musique) sont la plupart du temps
dnigrs ou incompris du public. Du ct scientifique galement, les ides reues sont lgion.
Pour de nombreux aficionados des sciences dures , linformatique musicale fait rfrence
une poigne de chercheurs et musiciens contemporains profitant des technologies leur
disposition, et dont les objectifs thoriques ou esthtiques sont peu lisibles. En vrit, les
proccupations musicales ont toujours interrog de prs les ressources technologiques, et les
rapports entre informatique et musique vont aujourdhui bien au-del dune utilisation unila-
trale et aveugle des outils. A y regarder de prs, ils prennent davantage la forme dun change
stimulant o sont rgulirement souleves des problmatiques de reprsentation des structures
et de formalisation de la pense.

1.1 Musique et technologie


Les rapports entre musique et technologie ne sont pas un particularisme du XXe sicle.
Lhistoire de la musique occidentale est au contraire jalonne de confrontations avec la tech-
nique, motives tantt par une demande musicale, tantt par une irruption technologique.
Lorgue (du grec organon : machine) est en ce sens emblmatique de ces rapports com-
plexes. Initialement peru par le clerg comme une mcanique suspecte risquant de distraire
les croyants de leur pratique religieuse, son acceptation dans les glises na pas t sans peine :
en quoi la pratique musicale au sein du culte religieux, limite alors au chant choral, avait-elle
besoin de cette technologie infernale ?
Cest quen musique comme dans la plupart des expriences humaines, une technologie
nest jamais adopte par forage , mais uniquement si elle rpond un besoin ancien. En
ce sens, la notation musicale, le temprament gal ou encore le piano sont des technologies ,

25
26 CHAPITRE 1. INFORMATIQUE MUSICALE

et par l mme, des rvolutions : elles modifient en profondeur pratique et pense musicales. Le
codage, travers la partition, de la musique sous forme symbolique a permis la manipulation
du matriau musical un niveau dabstraction plus lev que la seule pratique instrumentale.
La notion occidentale de composition sest alors enrichie de nouveaux procds (inversions,
symtries, miroirs, rptitions, imitations, esquisses. . .), rvls par la reprsentation graphique
de la musique. De faon similaire, linstauration progressive du temprament gal a conduit
la possibilit (voire la ncessit) dune musique modulante, de mme que le piano a apport
les nuances de dynamiques dans le jeu au clavier.
Possibilit offerte dabord, puis volution ncessaire, un changement technologique ne sur-
vient que lorsque la pratique ou la pense pitinent dans une impasse et ne peuvent sen
extraire avec leurs outils du moment. En mme temps quelle comble un besoin, ladoption
dune technologie engendre toujours un changement de paradigme. Cest sous ce double rap-
port de cause effet que doit tre considre larticulation contemporaine entre informatique
et musique.

1.2 Le tournant de llectronique


Durant la premire moiti du XXe sicle, le monde musical occidental est en crise : les
tentatives dodcaphoniste et srielle, cherchant le renouveau dans une nouvelle organisation
des hauteurs, nont pu palier leffondrement de la tonalit. Le changement viendra avec lar-
rive de llectronique au milieu du XXe sicle, mais pas de la manire quon croit. Certes,
llectronique introduit de nouvelles possibilits sonores, mais la grande nouveaut est ailleurs,
dans les procds qui lui sont propres et qui vont engendrer de nouvelles manires de com-
poser. Les techniques de synthse sonore dune part, denregistrement sur bande dautre part
conduisent les compositeurs penser le son comme un objet part entire, totalement in-
dpendant du jeu instrumental traditionnel. Louis et Bebe Barron (avec Forbidden Planet),
Herbert Eimert, Karlheinz Stockhausen (avec Gesang der Jnglinge) ou encore John Cage
(avec Imaginary Landscapes) seront les premiers explorer ces potentialits. Dans le rapport
dintimit qui se cre avec le son objectiv , les structures usuelles de lcriture, thmes,
motifs, mlodies, contrepoints, cdent la place aux bouclages, ralentissements, acclrations,
superpositions, mixages, dcoupes, recombinaisons, stratifications. . . Cette pratique aura des
rpercussions immenses sur les musiques aussi bien lectroacoustiques que mixtes ou mme
purement instrumentales. Par exemple, le fait de considrer lorchestre comme un ensemble
de solistes, en divisant lextrme les pupitres1 , est un mode dcriture qui dcoule en par-
tie de lexprience des possibilits daccumulations offertes par la pratique du multipiste. De
mme, les canons asynchrones de Steve Reich nauraient sans doute pu tre imagins sans
la possibilit de jouer simultanment un son enregistr des vitesses et intervalles de temps
diffrents.

1.3 Fonctions de lInformatique musicale


Les rapports entre musique et informatique qui nous intressent ici sont ceux qui intro-
duisent des pratiques et des concepts nouveaux. Entre les annes 50 et 70, lordinateur se
1
Dans sa pice Atmosphres, Gyrgy Ligeti a recours une division totale des pupitres de cordes ; apparente
micropolyphonie, totalement asservie la texture de lorchestre. Il en va de mme, dans un tout autre registre,
pour la construction tonale et contrapuntique qui rythme In C de Terry Riley.
1.3. FONCTIONS DE LINFORMATIQUE MUSICALE 27

substitue au magntophone dont les possibilits en termes de matrise du temps et de mani-


pulation du son concret ont t rapidement puises par la musique lectronique et lectroa-
coustique. LInformatique musicale, dont le fondement est la reprsentation numrique des
donnes, se scinde alors rapidement en deux grands courants de recherche : lanalyse et la syn-
thse numrique des sons dune part, et la formalisation des processus musicaux dautre part.
Le second nous intresse particulirement, tant dun point de vue compositionnel quinforma-
tique, car la question de larticulation entre algorithmique et donnes musicales symboliques y
est centrale. Il donnera naissance, en 1956, au clbre quator cordes Illiac Suite de Hiller &
Isaacson, premire pice entirement compose par ordinateur partir dun ensemble de
rgles tires dun trait dharmonie. Les recherches en musique algorithmique (ou composition
algorithmique) se poursuivront par la suite en Europe avec Pierre Barbaud, Iannis Xenakis ou
encore Andr Riotte.
Toutefois, lide de concevoir un programme capable de gnrer de la musique de ma-
nire automatique rvle rapidement ses limites : on ne pourra jamais crire un ensemble
de procdures suffisamment gnriques pour anticiper les besoins de tous les compositeurs.
La composition algorithmique va alors peu peu cder le pas aux environnements de com-
position assiste par ordinateur (CAO), avec lesquels le compositeur interagit en tant que
programmeur et dfinit ses propres procdures. Les outils de CAO sont bass sur une mise
en correspondance de paradigmes de programmation avec la formalisation des structures et
des processus de lcriture musicale, et permettent dtablir une quivalence entre une in-
tention compositionnelle et un calcul. A titre dexemple, Agon & al. [AHA02] ont montr
quon peut reprsenter un rythme musical sous forme dun arbre (au sens informatique du
terme), un rythme ntant en effet rien dautre que la division dun intervalle de temps en
sous-intervalles, chacun dentre eux pouvant son tour se subdiviser en dures plus petites.
Comme un arbre, un rythme est donc une structure de donnes dfinissable de manire rcur-
sive. La manipulation des rythmes peut ds lors tre apprhende de manire nouvelle laide
doprations sur les arbres.
Parmi les principaux paradigmes de programmation utiliss dans la conception denviron-
nements de CAO, les plus rcurents sont la programmation par objets [Pop91], la program-
mation dclarative ou programmation par contraintes [RAQ+ 01], et surtout la programma-
tion fonctionnelle, dont les mcanismes dabstraction et dapplication permettent dtablir une
quivalence entre programmes et donnes. Cet aspect est fondamental en musique, o le mme
matriau est conu tantt comme un objet fig, tantt comme une structure dont on peut d-
river de nouveaux objets2 . Cette dualit entre donnes et processus a largement contribu au
succs du langage Lisp [Ste90] dans le dveloppement denvironnements de CAO.
Une tape majeure dans linteraction avec le compositeur/programmeur sera alors franchie
avec la programmation visuelle, dont le paradigme central postule lquivalence entre un pro-
gramme et sa reprsentation graphique. Dun point de vue formel, un programme visuel
est un graphe orient dont les nuds sont des donnes ou des fonctions et les arrtes des
connections symbolisant un passage darguments entre les entres/sorties (des fonctions)
ou les champs (des objets). En pratique, lvaluation dun nud dclenche lvaluation rcur-
sive (ventuellement avec des rgles de priorit) des nuds en amont . La CAO base sur
la programmation visuelle permet donc au compositeur de tirer facilement parti de la puis-
sance expressive des langages de programmation, et de concevoir (cons-voir) des programmes

2
Il suffit pour sen convaincre de considrer les multiples variations que lon peut engendrer partir dun
mme motif, procd omniprsent dans le rpertoire classique (chez Beethoven, par exemple).
28 CHAPITRE 1. INFORMATIQUE MUSICALE

dans lesquels les structures usuelles de lcriture musicale et lensemble des oprations sy
rapportant partagent le mme environnement graphique. Les environnements de CAO les plus
clbres ayant recours la programmation visuelle sont historiquement PatchWork [LD89],
Max/MSP [Puc91], Elody [OFL97] et OpenMusic [Ago98], dvelopp lIRCAM3 par
Grard Assayag, Carlos Agon et Jean Bresson, et que nous dtaillerons la partie III.
Aujourdhui, les deux courants de recherche en informatique musicale que nous voquions
en dbut de section se sont rejoints, et lon dispose actuellement doutils de CAO puissants
dans lesquels le son comme matire sensible coexiste et interagit avec des structures formelles.
Il devient donc possible pour le compositeur de relier lexploration du sonore lorganisation
de donnes symboliques, et dainsi renouer avec une conception plus classique de lcriture
dont la musique lectronique stait loigne (cf. paragraphe 1.2). Cette convergence est
toute bienvenue pour nos travaux : car lorchestration est en effet lart de contrler le timbre de
lorchestre laide des paramtres symboliques de lcriture musicale (voir chapitre 3). Aussi
verrons-nous au cours de cette thse quun des intrts thoriques majeurs de lorchestration
assiste par ordinateur rside dans le recours des reprsentations multi-chelle permettant
la mise en relation de donnes htrognes. Se dessinera ainsi, au travers de notre recherche,
un des enjeux contemporains de linformatique musicale : lintraction signal/symbolique.

3
Institut de recherche et de coordination acoustique/musique. http://www/ircam.fr/
Chapitre 2

Le timbre, objet et fonction

Tentatives de dfinition du timbre en musique


Le rle essentiel du timbre dans lcriture contemporaine
Approches scientifiques du timbre : psychoacoustique et description du signal

2.1 Emergence du timbre dans la musique du XXe sicle


Depuis la fin du XIXe sicle, lemploi de plus en plus frquent des percussions permet
la fois de retrouver ce ct primitif (au sens dun rapport immdiat entre un geste et le
son qui en rsulte) de la production sonore, et de se familiariser avec de nouveaux timbres
pour lesquels la notion de hauteur, lment jusqualors central dans la musique occidentale,
nest plus ncessairement pertinente. Cest loccasion de prendre conscience que la mise en
vibration dun instrument produit dabord un effet acoustique qui sadresse la perception,
et qui avant le XXe sicle dpasse toute organisation formelle du matriau musical.
Un second apport, dans les annes 20, viendra des premiers instruments lectroniques tels
que le Thrmine ou lOnde Martenot. Ces inventions, qui offrent la possibilit de produire un
continuum de hauteurs , ont une incidence profonde sur les compositeurs. Plus que renou-
veler leffectif orchestral, elles introduisent des timbres inous , jamais entendus jusqualors,
profilant ainsi une nouvelle dimension dans limaginaire sonore.
Enfin, sous limpulsion de certains compositeurs comme Strauss, Bartk ou Varse1 , les
instrumentistes eux-mmes affichent peu peu un got pour lexploration du vocabulaire
acoustique de leurs instruments, et le langage musical va progressivement stoffer avec les
pratiques nouvelles que constituent les modes de jeu2 . Aujourdhui, les pizzicati Bartk, jeux
darchets battuto, sul ponticello, sul tasto ou encore col legno tratto, le slap, le growl, le souffle
aolien ou encore les doigts microtoniques font partie intgrante du discours musical contem-
porain.
Tandis quest redcouvert le son rel des instruments se dvoile donc progressivement
un ventail de sonorits nouvelles, relguant au second plan lorganisation traditionnelle des
hauteurs. Les instruments produisent des sons et le rle du compositeur consiste les com-
biner, telle est limage de la nouvelle pense musicale qui sinstaure au dbut du XXe sicle.
1
En 1899, Richard Strauss demande au corniste de chanter dans son instrument dans La vie dun hros. En
1936, Edgar Varse prescrit au fltiste de frapper les cls dans Densits 21,5.
2
Cette pratique, dj frquente lre baroque, devient quasi systmatique la seconde moiti du XXe
sicle

29
30 CHAPITRE 2. LE TIMBRE, OBJET ET FONCTION

Lorchestre est peu peu vu comme une gigantesque palette sonore avec laquelle composer :
crer un nouveau son , un son dorchestre , partir de sons individuels. Le timbre, jusque
l conu comme une proprit intrinsque des instruments, va progressivement sen dtacher
pour devenir dans un premier temps llment dun nouveau langage musical, jusqu tre
pens comme le pivot central de lcriture.
Varse (et sa suite Xnakis) est sans doute le compositeur le plus emblmatique de cette
nouvelle tendance. Il sagit vritablement pour lui de crer de nouveaux timbres, de composer
le timbre en puisant dans les richesses multiples du vocabulaire instrumental. Varse a en
permanence invent de nouvelles structures sonores, et leur individualit est si marque que les
termes musicaux usuels (accord, voix, doublure. . .) ne conviennent plus pour les dcrire. [. . .]
Varse semploie crer des couches de son, et ces couches occupent lespace des hauteurs. Il y
a des bandes de sons, des strates, et lvolution de la musique est entirement gouverne par les
confluences et les disjonctions de ces strates. (Erickson, Sound Structure in Music [Eri75]).
Cette approche smantique du timbre, dont les impacts sont colossaux dans la musique
contemporaine, trouvera un cho dans la seconde moiti du XXe sicle avec la musique
concrte instrumentale , chez des compositeurs comme Lachenmann ou Sciarrino. Tirant parti
des possibilits bruitistes des instruments traditionnels, Lachenmann dveloppe et organise un
vocabulaire sonore extrment riche en une Klang Komposition . Il en ressort une musique
rapide, prcise et rigoureuse, o les timbres fourmillent au service de la composition du son.

Paralllement la dmarche smantique, synthtique, ascendante de Varse se dveloppe


partir des annes 50 une approche analytique, grammairienne, descendante, hrite des
techniques rcentes de comprhension et de reprsentation du phnomne sonore. La mise au
point, au cours de la seconde guerre mondiale, du sonographe, a dune part fourni un accs
la ralit du son travers une reprsentation temps/frquence/amplitude, dautre part
permis de considrer le son comme un mlange de composantes lmentaires : la synthse du
timbre dans la composition musicale soppose sa dcomposition par les nouveaux instruments
de mesure.
Conscient de ce double mouvement, le compositeur Franois-Bernard Mche a tent den
unifier les tendances en prfigurant ce qui allait devenir la musique spectrale . A linitia-
tive de Grard Grisey et Tristan Murail, les compositeurs de cette cole considrent le timbre
comme une structure prexistante luvre et dont on peut dduire une certaine organisation,
en particulier de hauteurs. Dmarche analytique certes, mais aussi synthtique, puisque lcri-
ture spectrale se caractrise par une orchestration trs prcise, souvent microtonale3 , devant
atteindre un degr suffisant de fusion instrumentale4 pour permettre lmergence dun timbre
orchestral unifi et cohrent.
Ainsi le timbre, longtemps occult par la pense musicale du XIXe sicle5 , revient-il au
devant de la scne. Or, nous allons le voir, cela ne va pas sans poser de grandes difficults,
3
Depuis linstauration du tempramment gal, loctave est divis en douze demi-tons gaux. Lcriture
microtonale divise le demi-ton en sous-intervalles : quarts de tons, huitimes de ton, etc.
4
Lorsque plusieurs instrumentistes jouent simultanment, on parle de fusion instrumentale si les diffrents
timbres ne forment plus quun unique agrgat sonore.
5
Il est significatif de remarquer que les instruments timbre trs caractristique employs dans la musique
du Moyen Age ou au dbut de lre baroque nont pas survcu la standardisation de lorchestre classique. De
mme, les instruments populaires y sont rgulirement absents avant le XXe sicle. Question de temprament,
dirons certains. Il nempche, lvolution de la facture instrumentale est all dans le sens dune standardisation
donc dun appauvrissement du timbre, sans laquelle la composition travers le prisme classique des
hauteurs net pas t possible. En consquence, le timbre est rest laffaire du seul facteur dinstrument.
2.2. PARADOXES ET POLYSMIES 31

dont certaines font toujours dbat aujourdhui.

2.2 Paradoxes et polysmies


Qui tente de formuler une dfinition juste du timbre se heurte immanquablement un
certain nombre de difficults, tant lusage systmatique du mot a fini, en multipliant les si-
gnifications, par le vider de sa substance. Pour preuve la dfinition ngative du timbre quon
rencontre habituellement : ce qui nest ni hauteur, ni dure, ni intensit . LAmerican Stan-
dard Association le dfinit en 1960 comme ce par quoi on peut distinguer deux sons de mme
hauteur et mme intensit . Le timbre serait donc une proprit intrinsque linstrument,
interviendrait dans des tches de diffrenciation (voire de catgorisation ou de reconnaissance),
mais ne serait pas exprimable positivement pour autant.
Quoique regrettable, ce point de vue nest pas blmable. Noublions pas qu lorigine, le
timbre dsignait la corde en boyau mise en double au-dessous de la caisse dun tambour pour
mieux le faire rsonner, linstar du treillis mtallique aujourdhui fix sous les caisses claires.
Ds le dpart, le timbre est donc quelque chose de fix, dindissociable de linstrument, et qui lui
donne une couleur particulire. Avant le XXe sicle, il ny a pas, rappelle Hugues Dufourt,
dautre science acoustique que celle des hauteurs ; aussi nest-il gure tonnant qu lpoque,
le timbre [ne soit] pas [encore] une fonction du langage [musical], il nest quune matrialit
oblige du processus producteur de la vibration sonore. [. . .] En labsence dun rle fonctionnel
musical explicite [. . .] il est tout naturel que le concept de timbre tende renvoyer [. . .] la
cause productrice du son : linstrument. (Claude Cadoz, Timbre et causalit, in [Bar85]). Il
semble que ce soit ce lien primitif6 linstrument qui soit lorigine de la dfinition ngative du
timbre, tmoin muet du lien entre le son et sa cause qui se drobe de lintrieur aux catgories
abstraites et organisables de hauteur, de dure, dintensit.
A linverse, on trouve dans lHarmonielehre de Schoenberg [Sch11] les propos suivants :
Je ne peux accepter sans rserve la distinction entre couleur sonore et hauteur, telle quon
lexprime habituellement. Je pense que la hauteur devient perceptible grce la couleur sonore
dont une des dimensions est la hauteur. La couleur sonore est donc la catgorie principale,
la hauteur, une subdivision. La hauteur nest pas autre chose que la couleur sonore mesure
selon une direction7 . Lopposition entre ce point de vue et la dfinition ngative du timbre
qui prcde illustre la difficult pour la pense musicale au dbut du XXe sicle de qualifier le
timbre avec le vocabulaire dont elle dispose. Pour certains, le timbre est le secret ineffable
de linstrument alors que pour dautres, cest une totalit brute dont procde tout objet sonore.
Tantt reste hors-langage, une fois le sonore puis par le vocabulaire musical, tantt objet
supra-langagier, total, qui transcende les catgories de la pense musicale traditionnelle, le
timbre est simultanment en exclusion interne et externe par rapport au langage : il ne se
donne aux mots que par passage la limite.
Cette double exclusion se reflte dans le caractre polysmique du timbre. Voyons Schaef-
fer [Sch66] : [Le timbre] peut tre dfini comme lensemble des caractres du son qui le
6
Par primitif nous dsignons ici un tat antrieur au langage, o le timbre fonctionne comme le signe
univoque de la cause qui le produit. A distinguer du retour au rel du son dont fait tat la section 2.1,
lequel na lieu que dans un second temps et qui constitue la premire tape dun arrachage symbolique
visant incorporer le timbre dans un langage (voir section 2.3).
7
Cette position prfigure celle de Stockausen pour qui le timbre est toujours pens comme une combinaison
de hauteurs. Elle se rapproche en cela de la conception analytique du timbre chre la musique spectrale (voir
supra).
32 CHAPITRE 2. LE TIMBRE, OBJET ET FONCTION

rfrent un instrument donn. [Cependant, on peut trs bien parler du] timbre dun son
sans le rapporter clairement un instrument dtermin, mais plutt en le considrant comme
une caractristique propre de ce son. Voil donc une difficult supplmentaire : chaque ins-
trument possde son timbre, mais aussi chaque son quon en tire. Erickson [Eri75] explique
cette contradiction en rappelant quavant le XXe sicle lcriture tire parti en mme temps
quelle la conforte de la notion de consistance subjective du timbre. Une ligne mlodique
est en gnral confie un instrument ou un groupe dinstruments donns, invariants pour
lintgralit de la mlodie. Les diffrences de timbre rsultant des diffrences de hauteur et
dintensit sont alors identifies comme nuances dun timbre global qui fonctionne Erickson
use dune analogie avec la modulation de frquence comme une porteuse de la ligne
mlodique8 .
Bregman va encore plus loin : De mme quil existe le timbre dune note isole, on
peut parler de timbre orchestral pour un groupe dinstruments. (Albert Bregman, Timbre,
orchestration, dissonance et organisation auditive, in [Bar85]) Il semble falloir sy rsoudre, le
timbre renvoie plusieurs significations. Il dsigne soit lensemble des sonorits produites par
un instrument donn (fonction de consistance , ou porteuse ), soit la couleur sonore dun
son instrumental isol (fonction dissociante ), soit encore le son rsultant dune mixture
instrumentale (fonction unifiante ). Mais nous allons voir que cette polysmie peut tre
dpasse en considrant, linstar des compositeurs contemporains depuis Varse, le timbre
comme un langage, et en tentant de comprendre le rle quil remplit dans lcriture musicale.

2.3 Le timbre comme langage


Sil est courant de rencontrer le terme de langage musical , quentend-on exactement par
l ? Sans entrer dans un dbat de linguiste ou de smiologue de la musique, nous nous conten-
terons de constater un certain nombre de points communs entre musique et langage. Tous
deux se droulent dans le temps, communiquent par le canal auditif et sont constitus denti-
ts lmentaires transcriptibles dont la notation renvoie des phnomnes sonores identifis
et reproductibles. Ainsi hauteurs, dures, intensits, articulations, accents sont des lments
du langage musical. En est-il de mme du timbre ? Oui, crit Erickson [Eri75] : De mme
que les units lmentaires du discours sont les phonmes, de mme les timbres constituent
les units lmentaires du discours musical.
Il est une condition ncessaire au langage : cest la circulation, la mobilit de ces lments,
et cette fluidit requiert une certaine neutralit des phonmes. Un son ne peut fonctionner
comme phonme que dcharg de toute signification a priori. En dautres termes, la fonction
de consistance du timbre doit tre brise, le timbre ne pouvant faire langage tant quil ren-
voie de manire univoque linstrument qui le produit. La standardisation [des instruments]
a appauvri, dans un certain sens, la famille des timbres, mais elle leur a permis de commu-
niquer entre eux. [. . .] Cette transformation va se reflter dans le timbre, qui ne sera plus
considr comme un principe de lidentification mais comme un principe de transition, sinon
de confusion. [. . .] On convient de dire que lorchestre moderne est n avec le XIXe sicle ; il
est n, en effet, de cet emploi mobile de linstrument. [. . .] Le rle [des instruments] va voluer
de lidentifiable au mconnaissable cause de la brivet des mlanges. [. . .] Linstrument est
recherch pour ses possibilits de fusion, de neutralit, de perte dune identit excessive qui,
8
La rupture de ce principe est tardive. Elle nadvient quau dbut du XXe sicle avec la nouvelle cole de
Vienne et la Klangfarbenmelodie .
2.4. FONCTIONS DU TIMBRE : CONTRASTE ET CONTINUIT 33

videmment, empcherait les phnomnes de fusion. A partir de Schoenberg, en particulier,


linstrument sera de plus en plus considr comme partie dune texture [. . .] saisir chaque
fois dans un contexte diffrent. (Pierre Boulez, Le timbre et lcriture, le timbre et le langage,
in [Bar85])
On retrouve l les deux fonctions du timbre mentionnes au paragraphe 2.2 : dissociation et
unification. Cest par ce double mouvement permanent que le langage produit des signifiants
et les agrge en de nouvelles significations. De mme le forage du temprament aura-
t-il permis, en sparant le ton de linstrument qui le jouait, lclosion du langage tonal, de
mme le retour au rel sonore de linstrument ntait-il que le premier pas vers un langage
possible pour le timbre. Quant sentendre sur le choix, sans mme parler dune notation,
dun vocabulaire, cest l un autre dbat qui sera discut en 7.1.1.

2.4 Fonctions du timbre : contraste et continuit


Depuis Berlioz, le timbre entre dans le langage musical, sorganisant en un ordre complexe
qui srige au dessus du systme instrumental. Le dfinir comme un ensemble de sonorits
disposition du compositeur ou comme le produit dun mlange est une chose, tenter de cerner sa
fonction dans le processus de composition en est une autre. Jean-Claude Risset [Ris86] ouvre la
voie : La notion de timbre implique la fusion, elle correspond la qualit sonore dun ensemble
de composantes intgres en une entit auditive et assignes une mme source sonore relle
ou virtuelle. Le concept de timbre serait donc corrlatif de celui de fusion instrumentale,
phnomne sonore peru comme un tout, unique et cohrent. Cet agrgat sonore nest pas
ncessairement statique, il peut voluer dans le temps. Le timbre comme langage transpose le
concept de consistance subjective de linstrument, vers la mixture. La notion de cohrence
du comportement ne se limite pas ncessairement la source du son ; elle peut, en effet,
sappliquer des groupes de sons, comme les accords ou les complexes de timbres, o plusieurs
sources forment une image musicale unique. (Stephen McAdmas et Kaija Saariaho, Qualits
et fonction du timbre musical, in [Bar85]). Cest une des fonctions remplies, en orchestration,
par les doublures.
Est-ce l tout ? Le timbre comme langage na-t-il dautre fonction dans lcriture que dor-
ganiser la fusion instrumentale, que dagencer les phonmes pour produire de nouveaux objets
sonores ? Ce serait oublier la fonction autognrative du langage, lequel ne se contente pas
dagencer les signifiants, mais en produit galement de nouveaux. Varse, parlant de ses pro-
cds de composition, utilise les termes de masses sonores , interactions , projections ,
pntrations , opacits , rarfactions , oxygnations . . . tout un monde de mou-
vements, dagitations dont la fusion instrumentale nest quun tat parmi dautres. Aussitt
le timbre hybride form, pourquoi ne pas le fragmenter en sous-ensembles, le faire sentre-
choquer avec une autre masse, ou encore lincorporer dans une mixture plus vaste ? Voyons
Erickson [Eri75] : Varse ne travaille pas seulement avec des timbres fusionns, mais avec lin-
tervalle complet de la sparation la fusion, et le mouvement entre ces tats est fondamental
dans son art. De mme que le langage se constitue sur le couplage des fonctions dissociante et
unifiante, de mme Erickson en vient identifier les deux fonctions du timbre dans le proces-
sus compositionnel : contraste et continuit. Tous les exemples que jai comments peuvent
tre analyss en termes de contraste et continuit de timbre. Ces deux fonctions de timbre
ne peuvent jamais tre tout fait dissocies, bien quil y ait des situations musicales dans
lesquelles le timbre agit davantage comme porteuse (cf. 2.2) et dautres pour lesquel lintrt
34 CHAPITRE 2. LE TIMBRE, OBJET ET FONCTION

rside dans les agrgats de timbres. Continuit et contraste, vision duale, temporelle de lop-
position boulzienne entre articulation et fusion [. . .,] les deux ples extrmes de lemploi du
timbre dans le monde instrumental. (Pierre Boulez, Le timbre et lcriture, le timbre et le
langage, in [Bar85])

2.5 Espaces de timbres


Que le timbre soit abord de manire analytique ou synthtique, et quelles que soient les
fonctions quil endosse dans la composition musicale, il nen demeure pas moins du ressort de
la perception : car loreille fabrique le timbre tout autant quelle le peroit. De faon vidente
notre systme auditif est capable dune analyse multivarie extrmement subtile des [lments
sonores], mais la perception sen tient au pattern global qui en rsulte. (Schouten [Sch68])
La perception auditive est un phnomne minemment complexe, multi-chelle, remplissant
une double fonction, la fois dissociante (ce qui nous permet disoler un source prcise dans
lespace sonore) et unifiante9 : la chose la plus droutante dans notre exprience sonore
subjective est que nous entendons des sons multidimensionnels comme des objets perceptuels
unifis. (Erickson, Sound Structure in Music [Eri75])
Les recherches rcentes en perception se sont ainsi peu peu dtournes de la notion
floue de timbre pour se concentrer sur un ensemble de paramtres prcis et mesurables, en
lien avec des attributs perceptifs. A la question unique du timbre, se substitue alors une
srie de questions opratoires : comprendre comment loreille organise le sonore, comprendre
dans quelles conditions le sonore est porteur de forme. (Claude Cadoz, Timbre et causalit,
in [Bar85]) McAdams partage ce point de vue en affirmant que le timbre ne peut tre un
matriau propice pour lcriture que si lon parvient identifier et manipuler, parmi ses
diverses composantes, des lments porteurs de forme, identifiables comme tels dans le champ
perceptif. [. . .] Nous parlons des aspects du timbre, car la multidimensionnalit de celui-ci
nous semble prsent bien tablie, et nous estimons que ces multiples dimensions ne sont pas
toutes aptes porter la structure des formes.
Lidentification de ces dimensions privilgies de lcoute, leur mise en relation avec des
attributs perceptifs, tels sont les objectifs des psychoacousticiens dans la construction des
espaces de timbres.

Un espace de timbres est une reprsentation en deux ou trois dimensions dun corpus de
sons, chaque dimension tant relie une composante particulire du timbre. En gnral, sa
construction a lieu en quatre tapes :
1. La premire tape est la cration du corpus. Dans le cas de sons instrumentaux, il arrive
frquemment quil soient reproduits par une mthode de synthse afin de saffranchir
des conditions denregistrement et den liminer les parasites.
2. Les sons sont ensuite prsents par paires un ensemble de sujets qui doivent leur
attribuer une mesure de similarit ou de dissemblance.
3. On utilise alors une mthode de Multi-Dimensionnal Scaling (MDS) permettant de d-
terminer les coordonnes de sons dans un espace euclidien deux ou trois dimensions, de
telle manire que les distances entre les points correspondent aux dissimilarits moyennes
attribues par les sujets.
9
Chose amusante, on retrouve l les deux fonctions du timbre dans la musique du XXe sicle.
2.6. TIMBRE ET DESCRIPTION DU SIGNAL AUDIO 35

4. Ultime tape, on tente alors de corrler les dimensions de lespace de timbres un


ensemble dattributs percepitfs.
Plomp (1970) fut le premier reprsenter des spectres synthtiss dans un espace euclidien
tridimensionnel, sans toutefois interprter la nature psychophysique de chaque dimension. Par
la suite, les travaux de Wedin & Goude (1972) sur des sons dinstruments enregistrs, puis
Miller & Carterette (1975) sur des sons de synthse ont conduit des modles eux aussi
tridimensionnels, dont les composantes sont essentiellement spectrales. A linverse, les tudes
de Grey (1977), Wessel (1979) et Krumhansl (1989) ont rvl limportance de paramtres
temporels et spectro-temporels dans la perception du timbre. Leur travaux ont permis de
construire un espace trois dimensions comprenant le centrode spectral (que Wessel reliera
la brillance), le flux spectral (variations du spectre dans le temps) et le temps dattaque.
Krimphoff et al. (1994) ont de leur ct propos comme dimensions le temps dattaque, le
centre de gravit spectral (centrode), et lirrgularit spectrale (diffrences damplitude des
partiels conscutifs). McAdams et al. [MWD+ 95] ont plus tard confirm ces rsultats sur un
plus grand nombre de sujets, dexpriences musicales varies. Pour cette tude, McAdams
et al. ont travaill sur des sons de synthse et font observer que le nombre de dimensions
perues est trs infrieur au nombre de degrs de libert disponibles dans la fabrication des
stimuli. Cette remarque illustre dune part la fonction unifiante du timbre, dautre part
le fait que toutes les dimensions ne sont pas quivalentes dans la perception, et que seules les
composantes prdominantes se retrouvent dans lespace de timbres.

2.6 Timbre et description du signal audio


Depuis environ une dizaine dannes, les recherches menes sur la description et lindexation
automatique du signal audio ont connu en essor majeur, donnant naissance la famille doutils
que sont les descripteurs. Un descripteur (ou descripteur audio) peut tre dfini comme une
fonction permettant de calculer, directement partir du signal, certaines caractristiques
acoustiques ou perceptives du son. Cest donc avant tout une mthode de calcul, mme si
lusage commun fait quon parle frquemment de descripteur pour dsigner la valeur qui en
rsulte.
Les descripteurs du signal sont dun grand intrt dans un contexte de composition assite
par ordinateur, car ils dlivrent une information condense, de haut niveau dabstraction par
rapport la reprsentation du signal comme suite dchantillons. Pourvus dune signification
perceptive, ils constituent nen pas douter une piste srieuse pour la formalisation du timbre
et larticulation signal/symbolique que nous voquions la fin du chapitre 1.
Ce nest pas le lieu ici dtablir une liste exhaustive ou une classification de lensemble des
descripteurs audio. Nous nous contenterons de les distinguer les selon les diffrents points de
vue numrs par Geoffroy Peeters [Pee04] :
Les descripteurs peuvent tre une valeur calcule directement sur une partie du signal
(temps dattaque) ou un paramtre estim dun modle de signaux (ratio entre les partiels
et impairs, inharmonicit).
Ils peuvent se rapporter au signal dans son intgralit ou nen dcrire quune partie.
Plus prcisment, on distinguera les descripteurs valables quils en soit calculs sur
la totalit ou non pour lensemble du signal (descripteurs globaux, comme le temps
dattaque, le temps de dcroissance, les modulations damplitude) de ceux ne concernant
quune seule fentre temporelle (descripteurs instantans, comme lintensit perceptive).
36 CHAPITRE 2. LE TIMBRE, OBJET ET FONCTION

Les processus dextraction des descripteurs diffrent selon les cas. Certains descripteurs
sont calculs directement sur la forme donde du signal (autocorrlation, zero-crossing
rate), dautres ncessitent une tranformation pralable (lextraction des pics spectraux
passe par exemple par une FFT). Ils peuvent aussi tre obtenus par estimation (dans
le cas dun modle de signaux) ou dpendre dun modle perceptif (filtrage de loreille
interne, modlisation des bandes critiques. . .)

La description du son occupe certes une place importante dans nos travaux, mais non
centrale. Nous nous contenterons donc dintroduire, au chapire 8, les descripteurs utiliss par
notre systme et dici-l retiendrons deux :
1. quils peuvent tre calculs directement partir de la reprsentation du signal audio,
donc extraits automatiquement aussi bien dun son cible que dune banque dchantillons
instrumentaux ;
2. que certains dentre eux peuvent tre corrls des attributs perceptifs : le centrode
spectral peut tre reli la brillance, le taux de passage par zro (zero-crossing rate)
au niveau de bruit dans le signal, le logarithme du temps dattaque laspect percussif
du son. Encore une fois, nous renvoyons le lecteur dsirant davantage de prcisions aux
travaux de Geoffroy Peeters [PMH00].

Conclusion
En rsum, nous dirons que le timbre est une donne musicale dont la conception sest peu
peu transforme depuis la fin du XIXe sicle. Originellement considr comme un lment
tranger au systme symbolique et propre au jeu instrumental, le timbre a fait son entre dans
lcriture et en est devenu une variable centrale. Nous allons voir au chapitre suivant que lart de
lorchestration consiste justement en la matrise du timbre dans la composition. Nous verrons
en outre au long de ce manuscrit que la convergence entre lapproche psychoacoustique et le
traitement du signal travers un ensemble de mesures objectives (les descripteurs) permettra
la composition assite par ordinateur daborder le problme du timbre.
Chapitre 3

Orchestration : un savoir empirique en


mutation

Lorchestration comme art des mlanges


Savoir, transmission, limites
Lordinateur comme outil de stimulation de limaginaire

On pourrait dire de lorchestration quelle est lensemble des techniques dcriture dans les-
quelles le timbre agit comme paramtre principal. Walter Piston crit dans son trait [Pis55] :
Lorsquon analyse une orchestration, il sagit de dcouvrir comment lorchestre est utilis
pour traduire la pense musicale. [. . .] Cest un moyen dtudier la manire dont les instru-
ments se mlangent pour crer un quilibre de sonorits, lunit et la varit des timbres, la
clart, la brillance, lexpressivit, ainsi que dautres paramtres musicaux . Plus simplement,
on dira que lorchestration est lart de combiner des sonorits instrumentales pour crer des
agrgats sonores et en contrler lvolution temporelle.
Il est intressant de remarquer combien la position de lorchestration par rapport len-
semble du savoir musical varie selon les poques et les auteurs. Koechlin, par exemple, semble
la considrer comme une technique totalement asservie aux autres dimensions de lcriture :
Il faut planifier avec soin, par rapport luvre dans son ensemble, les lments orchestraux
suivants : accents, cadences, progressions dynamiques, sommets, chevauchements. Les chan-
gements de timbre sont fonction du contexte musical. Le rythme dentre ou de retrait des
timbres contribue, particulirement dans une mme phrase, aux effets de tension et de dtente.
Le degr de contraste timbral doit correspondre au degr de contraste formel : un changement
de section exige davantage de contraste orchestral que lapparition, dans une phrase, dun nou-
veau motif. (Alan Belkin, relatant Koechlin dans [Bel01]). Ce point de vue, en contraste avec
celui de Piston, reflte une conception encore classique du timbre, selon laquelle les mlanges
instrumentaux sont conditionns par les catgories usuelles de la pense musicale avant le XXe
sicle : Masses, nuages et autres effets de composition de texture ne sont en aucun cas une
invention rcente. Debussy, Strauss, Wagner, Berlioz et leur contemporains ont intensment
dvelopp et exploit le potentiel des textures orchestrales. Mais dans la plupart des uvres
de Varse, et dans certaines compositions de Schoenberg, Berg, Webern et Stravinsky la tex-
ture est au centre de lcriture, et ne rsulte pas dun procd contrapuntique, harmonique,
mlodique ou rythmique. Tant que la pense musicale ne sempare pas du timbre comme un
objet en soi, lorchestration reste une science secondaire. Mais chez Berlioz [Ber55], dj on
trouve les prmices de lmancipation future : Lemploi de ces divers lments sonores et leur

37
38 CHAPITRE 3. ORCHESTRATION : UN SAVOIR EMPIRIQUE EN MUTATION

application soit colorer la mlodie, lharmonie et le rythme, soit produire des impressions
sui generis (motives ou non par une intention expressive), indpendantes de tout concours
des trois autres puissances musicales, constitue lart de linstrumentation.

3.1 Orchestration et instrumentation


Cest peut-tre ici le lieu de prciser en quoi lorchestration se distingue de linstrumenta-
tion, avec laquelle elle est souvent confondue. Linstrumentation concerne ltude des instru-
ments, de leur tendue, de leurs registres et de la manire de les utiliser, de leurs potentialits
sonores, de leur jouabilit, de leurs ressources de dynamique, darticulation, de vitesse et de
longueur de souffle, de leur place et de leur fonction dans lorchestre, ventuellement de leur
timbre, et plus rarement de leur capacit traduire individuellement une ide musicale1 . Cest
un prliminaire incontournable pour ltude de lorchestration. Pour Piston [Pis55], on nin-
sistera jamais assez sur limportance de la connaissance instrumentale. Une criture approprie
aux instruments est sans aucun doute le facteur dterminant dans la russite dune orchestra-
tion. A tel point quon peut affirmer en toute bonne foi que si les parties individuelles sont
correctement crites lensemble ne peut que bien sonner.
En guise dexemple, nous reportons ici quelques conseils dinstrumentation tirs du Trait
de lOrchestration de Koechlin [Koe43] :

A propos des cordes : Comme le chur vocal, la famille des cordes offre une belle homognit
de timbres et peut excuter une grande varit de traits, de la simple ligne monophonique la plus
riche des polyphonies. Pratiquement tout ce qui convient aux voix sonnera bien aux cordes. Lcriture
pour cordes favorise les croisements, contrairement lcriture chorale.

A propos des bois : Les unissons produisent un effet de chur. Un changement de registre
provoque un changement radical de timbre. On peut presque aller jusqu considrer un instrument
par registre.

A propos des cuivres : Les cuivres sont plus homognes que les bois mais moins flexibles que les
cordes. On peut leur attribuer, aussi efficacement, des rles mlodiques, rythmiques, contrapuntiques
ou harmoniques. Ils reproduisent, mieux que les bois, le chant choral.

Lorchestration, quant elle, renvoie aux multiples manires de mlanger les timbres indi-
viduels. Nous ne nous sommes point impos la tche de donner une suite de mthodes des
divers instruments ; mais bien dtudier de quelle faon ils peuvent concourir leffet musical
dans leur association. [Ber55] Cest donc une science dun niveau de complexit suprieur
linstrumentation, et qui, dune certaine faon, la contient : Pour nous, comme domaine
dtude, lorchestration succde linstrumentation, cette tape prliminaire o ltudiant
explore le fonctionnement des instruments et ralise ce qui est raisonnablement jouable par
un excutant professionnel. La conception trop rpandue que lorchestration nest que lat-
tribution de timbres aux diverses lignes nous semble trs inadquate. (Alan Belkin, citant
Koechlin dans [Bel01]).
1
On trouve parfois dans les traits que pour une situation donne certains instruments conviennent mieux
que dautres, encore que ce jugement soit souvent trs subjectif : On apprend ce qui convient aux divers
instruments, ce qui pour eux est praticable ou non, ais ou difficile, sourd ou sonore ; on peut dire aussi, que tel
ou tel instrument est plus propre que tel autre rendre certains effets, exprimer certains sentiments. [Ber55]
3.2. LES TRAITS CLBRES 39

3.2 Les traits clbres


Les traits dorchestration sont peu nombreux. Les plus clbres sont ceux de Berlioz
[Ber55] et de Koechlin [Koe43]. Parmi les ouvrages plus rcents, on trouve ceux de Pis-
ton [Pis55], Rimski-Korsakov [RK64] ou encore Adler [Adl89]. Plusieurs raisons ce petit
nombre. Tout dabord la relative jeunesse, dans le savoir musical, de leur propos. Ensuite et
surtout, la difficult de trouver un formalisme adquat, comme il en va pour lharmonie, le
contrepoint ou lorganisation srielle. Aussi lempirisme est-il de mise dans lenseignement de
cet art ; Orchestrer, cest crer, a ne senseigne pas , affirme Rimski-Korsakov. Ce point
de vue tait dj celui de Berlioz [Ber55] : Jai dj dit, je crois, quil me semblait impos-
sible dindiquer comment on peut trouver de beaux effets dorchestre, et que cette facult,
dveloppe sans doute par lexercice et des observations raisonnes, tait comme les facults
de la mlodie, de lexpression, et mme de lharmonie, au nombre des dons prcieux que le
musicien-pote, calculateur inspir, doit avoir reus de la nature. [. . .] Considr sous son as-
pect potique, cet art senseigne aussi peu que celui de trouver de beaux chants, de belles
successions daccords et des formes rythmiques originales et puissantes.
Faute de pouvoir en exposer les rgles, que peut donc faire lauteur dun trait dorchestra-
tion, sinon produire une collection dexemples appropris tirs du rpertoire, et discuter leffet
orchestral obtenu en fonction de leffectif instrumental mobilis ? Ce nest certainement pas
par une tude systmatique du timbre quon apprend linstrumentation, mais en relevant a
et l des chantillons particulirement russis, choisis comme modles. (Pierre Boulez, Le
timbre et lcriture, le timbre et le langage, in [Bar85]).
Berlioz [Ber55] rapporte ainsi une srie de recettes , en reprant dans le rpertoire2 des
archtypes orchestraux, orchestrations similaires qui produisent des effets similaires. En
voici quelques exemples :

A propos des violoncelles : Quand les violoncelles chantent, il est quelquefois excellent de
les doubler lunisson par les altos. Le son des violoncelles acquiert alors beaucoup de rondeur et de
puret, sans cesser dtre prdominant.

A propos des harpes : Isolment ou par groupes de deux, trois ou quatre, il est singulier que
ce soit le timbre des cors, des trombones, et en gnral des instruments de cuivre, qui se marie le mieux
avec le leur. [. . .] Mais rien ne ressemble la sonorit de ces notes mystrieuses unies des accords de
fltes et de clarinettes jouant dans le mdium.

Sur lutilisation du cor anglais : Le mlange des sons graves du cor anglais avec les notes
basses des clarinettes et des cors pendant un trmolo du contrebasses donne une sonorit spciale
autant que nouvelle, propre colorer de ses reflets menaants les ides musicales o dominent la
crainte, lanxit.

On trouve galement dans les traits des principes dorchestration plus gnraux, qui nont
pas valeur de rgles auquelles se soumettre imprativement, mais que le jeune orchestrateur
est invit suivre. Ainsi chez Koechlin [Koe43] :
2
Les compositeurs les plus frquemment rencontrs dans le trait de Berlioz sont Gluck, Beethoven, Weber,
et Berlioz lui-mme.
40 CHAPITRE 3. ORCHESTRATION : UN SAVOIR EMPIRIQUE EN MUTATION

Au sujet des dynamiques : Evitez dindiquer des dynamiques diffrentes aux diffrents ins-
truments : cette faon de faire exige beaucoup dexprience puisque les excutants, dans lignorance des
indications de leurs collgues et sans consignes particulires du chef dorchestre, cherchent normalement
squilibrer entre eux.

Au sujet des plans sonores : Des plans sonores distincts exigent une individualisation
forte, grce des contrastes de registre, de timbre et/ou de rythme. Si les plans dialoguent, il faut
sassurer dune quivalence la fois de force et de volume. Les couleurs, le registre et le rythme gnrent
alors le contraste.

Sur la manire dcrire un tutti : La recherche dquilibre, entre les masses sonores, impose
des contraintes acoustiques qui limitent les possibilits dorganisation dun tutti : les cuivres et les
percussions gnrent, invitablement, le plus de puissance. Certaines combinaisons, par exemple, les
bois dans le mdium pendant que les cuivres jouent forts ne fonctionnent jamais.

Aussi riches dexemples, aussi exhaustifs que soient les traits, la question de leur prcision
et de leur porte mrite toutefois dtre pose. Quelle est leur utilit pour un compositeur dau-
jourdhui ? Quel est lapport de cette impressionnante connaissance pour la musique contem-
poraine ? On vous donne quelques recettes puises dans les uvres du rpertoire, recettes
trs disparates, sans cohrence, auxquelles se mle une certaine affectivit lie directement aux
modles proposs. (Pierre Boulez, Le timbre et lcriture, le timbre et le langage, in [Bar85]).
Et sans mme discuter lventuelle obsolescence du rpertoire dtude, le vocabulaire employ
ne reflte-t-il pas dj la vision esthtique dune poque ? Nous ne rsistons pas ici citer
encore une fois Berlioz [Ber55], dont le trait vaut certainement davantage aujourdhui pour
sa valeur littraire que musicale :

Le trombone est, mon sens, le vritable chef de cette race dinstruments vent
que jai qualifis dpiques. Il possde en effet au suprme degr la noblesse et la
grandeur ; il a tous les accents graves ou forts de la haute posie musicale, depuis
laccent religieux, imposant et calme, jusquaux clameurs forcenes de lorgie. Il
dpend du compositeur de le faire tour tour chanter un chur de prtres, mena-
cer, gmir sourdement, murmurer un glas funbre, entonner un hymne de gloire,
clater en horribles cris, ou sonner sa redoutable fanfare pour le rveil des morts
ou la mort des vivants.

3.3 Vers un trait dorchestration contemporain ?


Si lenseignement de lorchestration dans les conservatoires sappuie aujourdhui sur un r-
pertoire dtude rcent, la musique contemporaine manque toutefois dun trait tenant compte
la fois des nouvelles possibilits instrumentales et des avances rcentes dans la comprhen-
sion de la perception du timbre. Les compositeurs actuels ne se rfrent plus louvrage
de Berlioz [Ber55], considr comme dsuet. Quant ceux de Koechlin [Koe43] et de Rimski-
Korsakov [RK64], ils sont consults pour des exemples isols et sont rarement tudis dans leur
intgralit. Lart de mlanger les timbres reste donc trs empirique et le jugement qualitatif
des couleurs dorchestre trs subjectif. La seule vrit, aujourdhui, est du ct de linstru-
mentation. Ainsi le trait de Casella [Cas58] demeure-t-il toujours un ouvrage de rfrence, et
3.4. ORCHESTRER AVEC LORDINATEUR 41

de nombreuses contributions rcentes recensent un large ventail de techniques instrumentales


nouvelles, tires de lexploration des modes de jeu contemporains.3
Cependant, le compositeur Yan Maresz rappelle que parmi les compositeurs daujour-
dhui, beaucoup sont rsolument tourns vers les qualits expressives du son, vers le potentiel
des sons complexes, bruits ou de source lectronique comme matriau de base. Lorchestra-
tion dans le cadre de ces sonorits et techniques de composition devient donc une opration
cruciale. A la question de savoir dans quelle mesure on peut chafauder une thorie actuelle
de la perception du timbre instrumental et du mlange des timbres, et comment cette thorie
peut sarticuler avec la pense cratrice contemporaine, Pierre Boulez rpondait, il y a vingt
ans, de manire pessimiste : Selon les buts poursuivis, il existe deux manires de considrer
le timbre. Dune part, une faon objective, scientifique, hors du langage, sans critre esthtique
proprement parler [. . .] On dcrit [. . .] nombre de caractres acoustiques ; quant la qualit
dintgration du son et du timbre dans la composition, elle est absente de ces mesures. Mme
lorsquon se proccupe de la perception du phnomne sonore et de la qualit de cette percep-
tion, il sagit dune perception isole, dlie dun contexte quelconque. Dans cette approche, la
valeur proprement artistique du timbre me semble oublie. Dun autre ct simpose la faon
subjective, artistique, daborder le timbre comme composante du langage avec les critres es-
thtiques et formels qui sy rapportent, do la difficult inverse, voire limpossibilit de relier
le sentiment instinctif du qualitatif une estimation plus raisonne du quantitatif. (Pierre
Boulez, Le timbre et lcriture, le timbre et le langage, in [Bar85])

3.4 Orchestrer avec lordinateur


Ne peut-on dsormais dpasser ce dilemme ? Aujourdhui, lordinateur offre la possibilit
de manipuler un objet sonore dans un processus de composition, et simultanment den tu-
dier les proprits acoustiques au travers doutils danalyse. Les deux visions antagonistes du
timbre que Pierre Boulez dnonait ne peuvent-elles donc se rejoindre dans cette simultanit ?
Les fonctions danalyse acoustique et de traitement des objets musicaux ne peuvent-elles pas
interagir dans un environnement commun, subordonn la pense cratrice du compositeur ?
Sil faut actuellement renoncer un trait dorchestration contemporain, ne peut-on alors
concevoir un systme informatique assistant le compositeur dans lexploration et la manipula-
tion du timbre orchestral, dans lequel lanalyse et la fabrication du sonore seraient intimement
articuls ?
Noublions pas quavant le XXe sicle, les bons orchestrateurs sont les compositeurs ayant
acquis une solide exprience de chef dorchestre. Ce sont donc ceux qui ont pu, rgulirement,
travers leurs propres uvres ou celle du rpertoire, exprimenter les mlanges orchestraux et
la qualit de leurs effets. Aujourdhui, ltendue des possibilits sonores des instruments est si
vaste quon ne peut dcemment attendre des compositeurs contemporains y compris ceux
passs par la direction dorchestre un savoir instrumental aussi complet qu lpoque de
leurs ans.
Comme souvent en CAO, lordinateur peut tre conu comme une machine faire des
propositions . En un sens, la CAO se rapproche sous certains aspects de la recherche op-
rationnelle, soit, de manire gnrale, lensemble des techniques daide la dcision face
3
Parmi les plus pertinents et les plus actuels : New sounds for woodwinds de Bartoluzzi, Fltes aux prsent
de Pierre-Yves Artaud, Saxologie de Daniel Kientzy, Les Modes de jeu de la contrebasse de Jean-Pierre Robert,
The Techniques of Oboe Playing de Peter Veale, Le Tuba contemporain de Grard Buquet.
42 CHAPITRE 3. ORCHESTRATION : UN SAVOIR EMPIRIQUE EN MUTATION

des problmes complexes. Lide que nous dfendons dans cette thse est alors la suivante :
la puissance de calcul de lordinateur doit permettre dexplorer de manire efficace lespace
des alliages de timbre et dvaluer en un temps raisonnable les combinaisons instrumentales a
priori les plus pertinentes pour le compositeur. Un systme daide lorchestration agirait donc
avant tout comme un outil de stimulation de limaginaire , en proposant au compositeur
des solutions auxquelles son savoir et son exprience personnelle ne laurait pas ncessairement
men. Il ne sagit videmment en aucun cas de subsituer aux techniques usuelles dorchestra-
tion la formalisation dun ensemble de rgles (et dabord lesquelles ?), mais plutt dutiliser
lordinateur comme un explorateur qui, de manire interactive et guide, dcouvrirait
de nouveaux territoires dans lcriture du timbre orchestral. Une nouvelle manire dorchestrer
certes, mais qui ninvalide pas lancienne, et la pourvoie au contraire dune dimension nouvelle.
Chapitre 4

Aide lorchestration

Lorchestration encore peu aborde par la CAO


La demande des compositeurs ne date pas daujourdhui
Revue et critiques des outils actuels daide lorchestration

Comme il a t dit au chapitre 1, linformatique musicale sest rapidement scinde, aprs sa


naissance dans les anne 50, en deux courants de recherche longtemps rests impermables lun
lautre, en partie en raison de lhtrognit de leurs objets dtudes. Dune part lanalyse
et la synthse numrique des sons a largement contribu, travers le dveloppement continu
de mthodes spectrales et spectro-temporelles, la comprhension du phnomne sonore et a
permis la fabrication de sons jusqualors inous. Le logiciel AudioSculpt [BR05] et le langage
CSound [Bou00] dcoulent directement de ces travaux. Dautre part, lapproche algorithmique
sest concentre sur les structures symboliques de lcriture musicale et a donn naissance aux
environnements de Composition assiste par ordinateur (CAO), tels PatchWork [LD89] et
OpenMusic [Ago98]. Ces outils, pour lesquels la notion de calcul est centrale, permettent
de gnrer et de transformer des structures musicales travers ce quon convient aujourdhui
dappeler un processus compositionnel .
Or lorchestration se situe prcisment lintersection de ces deux axes de recherche ; si
elle prtend crer des timbres, cest encore par le biais de lcriture. Elle est une station de
correspondance entre le symbolique et le sonore. Aussi nest-elle apprhendable par linforma-
tique musicale qu la condition dune convergence de lapproche signal et de lapproche
algorithmique. Le programme Max/MSP [Puc91] fut sans doute un des premiers outils
permettre cette rencontre, mais sa conception base sur le contrle en temps rel le destine
essentiellement la performance.
Aujourdhui, la cohabitation du signal et du symbolique au sein dun mme environnement
ne pose plus de difficult majeure, mais le problme de lorchestration assiste par ordinateur
nest pas rsolu pour autant.

4.1 Convergence et maturit des savoirs


Lide dun outil dorchestration assiste par ordinateur nest pas nouvelle. Lorsquau dbut
des annes 70 les compositeurs familiers des possibilits combinatoires et algorithmiques que
leur offraient les environnements de CAO se sont tourns vers les proprits spectrales du
son, germa aussitt lide dun programme daide lorchestration. Cependant, au del de

43
44 CHAPITRE 4. AIDE LORCHESTRATION

la difficult mme que reprsente la formalisation du passage de la notation musicale la


ralisation acoustique, un tel souhait ntait ralisable quune fois diffrents champs du savoir
parvenus maturit.
En premier lieu, rappelons quil nest pas dorchestration possible sans la connaissance
pralable des instruments et de leurs capacits sonores. La reprsentation en machine des ten-
dues, des registres et des modes de jeu instrumentaux, ainsi que des ressources en dynamique
propre chaque hauteur ne pose pas beaucoup de problmes, car ce sont l essentiellement des
donnes symboliques. Mais peut-on concevoir un formalisme qui puisse capturer les proprits
acoustiques des instruments ?
On ne peut rpondre cette question sans en passer au pralable par la comprhension
du timbre instrumental. Les tudes psychoacoustiques rcentes y ont largement contribu, en
rvlant laspect multidimensionnel de la perception du timbre. Elles ont notamment abouti
lidentification de directions spcifiques de lcoute et la construction d espaces de timbres
expliquant une partie des phnomnes de similarit et de dissemblance dans la perception
des sons. Paralllement, les avances rcentes en traitement du signal ont favoris la mise
en correspondance de certains attributs perceptifs avec un ensemble de mesures calcules
directement sur la reprsentation des signaux audio. Ce nest donc que trs rcemment quun
lien a pu tre tabli entre lenregistrement dun son et la caractrisation objective, calcule,
de certains aspects de son timbre.
Ds lors, la question de la connaissance instrumentale passe par celle de laccumulation
dchantillons de sons reprsentatifs des possibilits sonores des instruments. Or lenregistre-
ment, mais aussi le stockage et la mise disposition de ces gigantesques bases de donnes
sonores nest possible que depuis une dizaine dannes.
Enfin, noublions pas ce qui constitue lessentiel du travail prsent dans cette thse : le
grand nombre dinstruments et la diversit des timbres offrent une palette quasi infinie de
couleurs orchestrales. La recherche dun mlange instrumental par lordinateur soulve donc
des problmes combinatoires colossaux que seules les mthodes rcentes issues de la recherche
oprationnelle peuvent apprhender. On comprendra alors aisment pourquoi lorchestration
assiste par ordinateur nen est aujourdhui qu ses dbuts.

4.2 Discours de compositeurs


Conscient des problmatiques actuelles des compositeurs, et fort de son rle de mdiateur
entre recherche et cration musicales, lIRCAM a encourag en 2003 la cration dun groupe
de rflexion rassemblant chercheurs et compositeurs autour du problme de lorchestration
assiste par ordinateur. De ces multiples tables rondes sest dgag un ensemble de suggestions
et de directions de recherche, que nous rapportons sommairement ici.
Pour de nombreux compositeurs, il apparat urgent de disposer dun outil dex-
ploration et de contrle des alliages de timbres imaginables qui tirerait parti de la
puissance informatique pour en tester les combinaisons instrumentales et en va-
luer la qualit. Cette ide nest pas nouvelle : elle revient de manire rcurrente
depuis les dbuts de la CAO et reprsente peut-tre le dernier bastion de la tech-
nique de composition lancienne qui nait bnfici de linformatique des fins
danalyse et de formalisation.
Lide de base serait davoir un outil danalyse sonore et dorchestration expri-
mentale qui puiserait dans une banque de donnes dinformations instrumentales
4.3. OUTILS ACTUELS DAIDE LORCHESTRATION 45

(spectres, formants, etc...) pour proposer un arrangement instrumental qui se rap-


procherait le plus possible de lanalyse de la source dorigine.
Cest prcisment un projet qui ncessiterait de bons programmes danalyse,
et de bonnes connexions entre lecture dchantillons, analyse, reprsentation et
synthse.
La prise en compte des instruments comme gnrateurs de sons complexes pou-
vant tre mlangs pour obtenir une cible acoustique ou symbolique est-elle une
problmatique explorable par le calcul ?
Pour un problme dorchestration donn, y aurait-il des solutions pertinentes que
le compositeur nentend pas spontanment et qui peuvent donc faire lobjet dune
proposition par le systme, ce dernier jouant alors le rle dun stimulateur de son
imaginaire ?
Les compositeurs de musique symbolique (crite) restent encore au stade dun
travail trs intuitif sur ces sons bruits, ou utilisent des modles assez simplifis
(le spectre harmonique). Do lide de dvelopper avec laide de scientifiques un
outil daide lorchestration, qui pourrait englober ces catgories de sons non
harmoniques. En dautres termes, il sagit dlaborer des notions grammaticales
solides, cest--dire des lois de consonance psychoacoustique (au sens large), et des
outils informatiques permettant dassembler les sons et dassister le compositeur
dans ses recherches.
La porte pdagogique dun tel outil est aussi une composante importante des
motivations la base de ce projet car la composante "analyse" du programme doit
permettre de comprendre les rgles et usages de lorchestration telles que nous
les trouvons dcrites dans lhistoire et dexpliciter de manire plus scientifique les
choix empiriques de nos ans.
Analyse de sons, banque de donnes dinformations instrumentales, reprsentations et syn-
thse, cible acoustique, sons bruits ou inharmoniques, consonance psychoacoustique, explo-
ration des alliages de timbres, stimulation de limaginaire. . . : sans entrer dans des dtails de
conception, nous voyons l se profiler un ensemble de problmatiques dont une vie entire
de recherche ne viendrait pas bout. De fait, loutil daide lorchestration dont cette thse
fait lobjet est loin de rpondre toutes ces exigences, dont certaines sont encore utopiques
aujourdhui. Nous verrons en outre que, par sa conception mme et les choix faits en termes de
caractrisation du timbre instrumental, notre outil renvoie implicitement une certaine vision
de lorchestration, et penche de fait en faveur dune esthtique musicale particulire. Nous
discuterons ces aspects en gardant lesprit quun tel outil, motiv par des enjeux aussi bien
artistiques que scientifiques, ne peut tre conu quau travers dun compromis entre libert et
contrle.

4.3 Outils actuels daide lorchestration


Les systme daide lorchestration sont encore peu nombreux, essentiellement pour les rai-
son exposes en 4.1. Nous prsentons ici les travaux existant aujourdhui notre connaissance,
en exposons les concepts sous-jacents et en exposons les limites.

Rose et Hetrick [RH05] ont propos un outil la fois pdagogique et cratif, permettant
dune part danalyser une orchestration existante, dautre part de crer des orchestrations
46 CHAPITRE 4. AIDE LORCHESTRATION

originales dont la sonorit sapparente un son cible donn en entre du systme. La connais-
sance des possibilits instrumentales est obtenue par analyse dchantillons instrumentaux, en
calculant des spectres harmoniques moyens sur la partie entretenue des sons. Le spectre du
son cible est calcul par une analyse similaire. Lalgorithme dorchestration de Rose et Hetrick
repose sur une dcomposition en valeurs singulires du spectre de la cible, celle-ci sexprimant
alors comme une somme pondre des spectres de la base de donnes.
Cette mthode prsente deux avantages significatifs. Elle garantit que la dcomposition
trouve est la plus proche du spectre de la cible au sens de la norme L2 . En outre, le cot de
calcul est drisoire. En revanche, les spectres sont calculs avec des FFT1 de 4096 points, et
la comparaison de spectre sur quelques miliers de points est, sur le plan perceptif, sujette
caution. En outre, cette approche ne permet pas de prendre en compte les contraintes lies
leffectif instrumental : il se peut en effet que loutil de Rose et Hetrick propose en combinaison
ncessitant, mettons, trois violoncelles, alors que lorchestre nen compte quun seul.

SPORCH (SPectral ORCHestration) est un systme dvelopp en Lisp par David Pseni-
cka [Pse03] dans lequel la recherche seffectue sur les instruments eux-mmes, non sur les sons.
SPORCH utilise un algorithme itratif de matching pursuit pour trouver une combinaison
dinstruments sapprochant au mieux dune cible sonore, donne comme prcdemment sous
forme dun son enregistr. Chaque instrument de la base est associ un ensemble de hau-
teurs et de dynamiques, auxquelles sajoute une collection de partiels les plus importants dun
point de vue perceptif. Lalgorithme de SPORCH extrait les partiels principaux de la cible
et cherche dans la base les sons les plus pertinents. Le critre de slection est une distance
euclidienne entre les partiels suffisamment proches en frquence. Un partiel prsent dans un
son candidat mais absent dans la cible augmente donc la valeur de distance.
Lalgorithme de SPORCH est itratif. Aprs avoir trouv le candidat qui minimise la dis-
tance au son reproduire, son spectre est soustrait celui de la cible et lalgorithme reprend
la recherche avec pour cible lensemble de partiels rsultant de la soustraction. Evidemment,
linstrument slectionn ltape prcdente est exclu du domaine de recherche. Cette m-
thode permet de trouver rapidement des solutions excutables par lorchestre (les contraintes
lies leffectif instrumental sont toujours vrifies), mais rien ne garantit loptimalit de la
solution obtenue. En outre, cette technique a tendance privilgier les configurations de faible
cardinalit.

Un troisime systme est d Thomas Hummel [Hum05]. Un algorithme itratif est ga-
lement utilis, mais la mesure de distance entre les sons candidats et la cible se base sur
lenveloppe spectrale plutt que sur les partiels. Par consquent, les hauteurs perues dans
la mixture propose peuvent tre trs diffrentes du contenu harmonique de la cible. Hum-
mel conseille dailleurs dutiliser son systme pour les sons dpourvus de hauteur, comme les
voyelles chuchotes.

Avant daller plus loin, quelques remarques simposent. Ces trois systmes prsentent de
nombreux points communs. Voyons lesquels, et discutons les implications des choix faits par
leurs auteurs :
1
Lalgorithme de FFT (Fast Fourrier Transform, en franais Transforme de Fourrier rapide) est une m-
thode particulirement efficace pour le calcul de la Transforme de Fourrier court terme (TFCT, ou STFT
Short Time Fourrier Transform en anglais), lorsque la taille de la transforme est une puissance de 2.
4.3. OUTILS ACTUELS DAIDE LORCHESTRATION 47

Il est chaque fois question dapprocher une cible sonore , et celle-ci est toujours don-
ne au systme comme un son enregistr. Cest l se restreindre un cas trs particulier
de lorchestration, car la plupart du temps, le compositeur ne dispose pas au pralable
de ce son. Lorchestration, en gnral, a pour but de produire, non de re-produire, un
timbre. Savoir comment obtenir tel effet prcis ne suffit pas la cration. Cela suppose
que leffet en question soit dj conu. Or, le processus de cration est aussi celui de
la gense des ides. Un outil de cration doit permettre cette gense. (Claude Cadoz,
Timbre et causalit, in [Bar85]) La dmarche smantique chre Varse est donc exclue
de lapproche adopte par les auteurs.
Pour chacun de ces systmes, la connaissance instrumentale se rsume un ensemble
de sons instrumentaux. Sans mme parler de leur accessibilit, la gnricit de ces bases
de donnes mrite dtre questionne. Quelle est linformation apporte par un Si bmol
mdium de tombone tnor jou ordinario en dynamique mezzo-forte ? Est-elle indpen-
dante des conditions denregistrement de ce son ? Lacoustique du lieu denregistrement,
linstrumentiste, la qualit et le type de prise de son constituent, tout comme les indi-
cations mentionnes sur la partition, des paramtres majeurs du timbre. Ne court-on
pas alors un risque de surapprentissage ? Quelle est la part variationnelle lie aux
conditions denregistrement dans ce que le systme apprend de lchantillon ? Les
orchestrations obtenues par ces outils produiront-elles les mmes effets de timbre dans
des conditions de jeu diffrentes ?
Tous les auteurs utilisent un critre spectral unique pour lvaluation des orchestrations
proposes. Certes, il fut longtemps considr que linformation spectrale tait prdo-
minante dans la caractrisation du timbre instrumental, mais on sait aujourdhui que
les phnomnes temporels et spectro-temporels ont une importance considrable. Par
ailleurs, bien que linformation spectrale soit dans ces sytmes reprsente par des don-
nes multidimensionnelles, lvaluation des propositions se rsume toujours un critre
unique, sans doute pertinent pour une certaine classe de problmes, mais certainement
pas pour tous.
Les trois systmes formulent lhypothse implicite de ladditivit des timbres instrumen-
taux. Or la simple considration de leffet de phase suffit la mettre en dfaut. Les
compositeurs connaissent bien ce phnomne. Cest lui qui explique en grande partie
pourquoi un ensemble de quatorze violons lunisson ne sonne pas quatorze fois plus
fort quun violon solo.2 Il est donc permis de douter des capacits prdictives dun modle
additif, aussi avantageux soit-il dun point de vue mathmatique.
Les effets de salle (notamment la rverbration) ne sont pris en compte dans aucun de
ces systmes. Or, la rverbration naturelle des lieux de concert a un impact norme sur
les phnomnes de fusion acoustique. Les compositeurs le savent bien, et comptent les
effets de salle parmi leurs allis pour la russite de leurs orchestrations.3
Enfin les trois auteurs, recourant des algorithmes itratifs ou de dcomposition,
2
Koechlin [Koe43] fait ce sujet la distinction entre le volume ( entendre au sens spatial) du son,
cest--dire son paisseur, son talement dans lespace, et la force , cest--dire sa puissance. Ainsi, peu
importe le niveau dynamique, un cor sonnera toujours plus ample, plus pais, quun violon. La rgle gnrale
concernant les doublures lunisson est quelle ajoutent plus de volume que de force.
3
Berlioz [Ber55] est mme all jusqu dire que sans rverbration il ny avait pas de musique : Voil
pourquoi la musique en plein air nexiste pas. Le plus terrible orchestre plac au milieu dun vaste jardin
ouvert de toutes parts, comme celui des Tuileries, ne produira aucun effet.
48 CHAPITRE 4. AIDE LORCHESTRATION

contournent systmatiquement le problme combinatoire inhrent lorchestration. Ima-


ginons un petit ensemble de six instruments, chacun dentre eux tant reprsent dans
une base de donnes par seulement4 une centaine dchantillons sonores. Lensemble des
combinaisons possibles atteint dj mille milliards. Du point de vue combinatoire, lor-
chestre symphonique donne une vague ide de linfini. Or il est clair que les mthodes
itratives employes sapparentent une varit dalgorithmes gloutons, dont lefficience
dans les problmes combinatoires nest prouve que pour un nombre trs rduit de cas.
Afin de mnager le temps de calcul, les auteurs ont donc recours une forme dheuris-
tique qui ne garantit en rien loptimalit du rsultat obtenu.

Nous rassemblons au chapitre 7 les ides matresses de notre outil daide lorchestraion,
et dcrivons plus profondment ce dernier la partie III de ce document. Nous verrons que les
limites des systmes existants ne peuvent tre simultanment dpasses. Aussi retomberons
nous parfois, en connaissance de cause, dans les cueils que nous venons de dnoncer. Cela
dit, la conception et le dveloppement de notre outil ont toujours t gouverns par un souci
de gnricit et dextensibilit future. Il faut donc voir dans notre travail une volution vers
un environnement de cration puissant et complet, rpondant aux exigences actuelles des
compositeurs.

4
Pour donner un ordre de grandeur, la base de donnes de lIRCAM Studio Online [BBHL99] compte en
moyenne un millier de sons par instrument. Quant la clbre Vienna Symphonic Library [VSL], elle dnombre
pas moins de 250000 chantillons.
Chapitre 5

Optimisation combinatoire
multicritre

Problmes N P
Introduction loptimisation multicritre
Panorama des algorithmes gntiques
Fonctions scalarisantes de Tchebycheff
Population size Adaptive Density Estimation

Loutil daide lorchestration que nous introduisons au chapitre 7 cherche dcouvrir


des mlanges de timbres instrumentaux, plus prcisment des combinaisons de sons dans de
grandes bases dchantillons sonores, les plus proches possible dun timbre cible. Or, nous le
verrons, le caractre multidimensionnel de la perception du timbre dune part (voir section 2.5),
et la difficult de mesurer limportance relative de chacune de ces dimensions dautre part
(voir paragraphe 7.2.4), imposent une approche multicritre. Ce chapitre est donc consacr
la thorie des mthodes multicritres et aux algorithmes gntiques (AGs), couramment
employs dans des tches doptimisation combinatoire (notre algorithme dorchestration est
dailleurs lui-mme un AG). Nous dtaillons en particulier le principe dagrgation des critres
par fonctions scalarisantes de Tchebycheff ainsi quune procdure efficace pour le maintien
de la diversit des solutions, mthodes dont sinspire notre propre algorithme.

5.1 Recherche oprationnelle, complexit


La recherche oprationnelle dsigne lensemble des mthodes daide la dcision dans le
cadre de problmes complexes. Elle est couramment employe lorsque le dcideur est confront
un problme combinatoire, comme cest le cas de lorchestration assiste par ordinateur. De
nombreux problmes abords par la recherche oprationnelle, tels que lordonnancement de
taches, la gestion de projets, la logistique (tournes de vhicule, conditionnement), la planifica-
tion, la gestion demplois du temps, les politiques dinvestissement, les problmes concurrentiels
(stratgies militaire ou dentreprise), les choix darchitecture (informatique ou organisation-
nelle), sont rputs pour leur complexit et classs dans la catgorie des problmes N P.
En thorie de la complexit, les problmes N P peuvent tre rsolus sur une machine de
Turing non dterminste par un algorithme polynomial. En dautres termes, le temps de calcul
est une fonction polynomiale de la taille du problme. A loppos dune machine de Turing

49
50 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE

dterministe, la machine non-dterministe peut effectuer plusieurs actions diffrentes pour un


mme tat. En pratique, on ne sait pas construire une telle machine (car elle se dcompose
en autant de machines dterministes que dactions possibles pour un tat donn), pas plus
quon ne sait simuler le comportement dune machine non-dterministe laide dune machine
dterministe.
Les problmes N P admettent un algorithme polynomial capable de tester la validit ou la
qualit des solutions, mais non de les trouver. On ne connat pas, pour ces problme, dautre
mthode de rsolution que lnumration systmatique de lensemble des solutions, et leur
valuation laide dun algorithme polynomial. En dautres termes, le temps de calcul sur une
machine dterministe est exponentiel la taille du problme.
Dans la suite de cette section nous numrons brivement les approches les plus usites
pour les problmes doptimisation combinatoire multicritre. Ces derniers sont caractriss par
des variables de contrle (ou de dcision) discrtes, ne pouvant prendre quun nombre fini de
valeurs. Nous verrons au pargraphe 7.4 que lorchestration assiste par ordinateur appartient
cette catgorie. Pour une tude gnrale et appronfondie des mthodes multicritres, nous
renvoyons le lecteur aux ouvrages de Miettinen [Mie99], Collette & Siarry [YP02], ou encore
Ehrgott [Ehr05].

5.2 Thorie des approches multicritres


Les mthodes multicritres sont prconises lorquil sagit datteindre conjointement des
objectifs souvent inconciliables. Dans le cas de lorchestration, il sagira de minimiser simul-
tanment un ensemble de distances un timbre cible selon plusieurs critres perceptifs. Un
problme de minimisation multicritre est simplement dfini par la donne dun espace de
recherche (appel parfois galement espace des dcisions) E et un ensemble de fonctions
f = (f1 , . . . , fN ) minimiser sur E :

min f (x) = (f1 (x), . . . , fN (x))
(5.1)
s.t. x E

Dfinition 5.1. Soit E un espace de dcisions et {fn }n les fonctions dun problme multicri-
tre sur E, alors lespace :

C = {(f1 (x), . . . , fN (x)) | x E} (5.2)

est communment appel espace des critres.

Il arrive que E ne soit pas dfini explicitement (par des bornes dintervalles par exemple)
mais implicitement. Cest le cas notamment dune optimisation sous contraintes, dans lequel
les solutions de lquation 5.1 doivent galement satisfaire un ensemble de conditions. Nous
verrons au paragraphe 7.5 que bien souvent lespace de recherche dans un problme dor-
chestration est dfini la fois explicitement (par la donne des instruments de lorchestre) et
implicitement (par un ensemble de contraintes).
En gnral, la solution idale xideal du problme 5.1, qui minimise simultanment tous les
critres, nexiste pas :

@xideal E, n {1, . . . , N }, fn (xideal ) = min fn


E
5.2. THORIE DES APPROCHES MULTICRITRES 51

critre B
Solutions domines
1
Solutions efficientes
Front de Pareto

critre A

Fig. 5.1 Solutions efficientes et solutions domines dun problme de minimisation deux
critres

Ds lors, le problme 5.1 ne se rsout pas en une solution idale unique, mais en un ensemble
de solutions optimales dites solutions efficientes ou encore solutions de Pareto, ou solutions
non domines, ou solutions de compromis. Une solution efficiente ne peut tre amliore sur
un des critres sans tre simultanment dgrade sur un autre critre. Autrement dit, on ne
peut amliorer conjointement lensemble des critres dune solution efficiente.
Dfinition 5.2. Dominance de Pareto. Soient x et y deux points dun espace de recherche
E sur lequel on a pos un problme de minimisation multicritre. On dira que x domine y au
sens de Pareto (on notera x  y) si et seulement si :

n {1, . . . , N }, fn (x) fn (y) (5.3)

On dira que x domine strictement y au sens de Pareto (on notera x y) si et seulement si :



n {1, . . . , N }, fn (x) fn (y)
(5.4)
n0 {1, . . . , N }, fn0 (x) < fn0 (y)
Dfinition 5.3. Lensemble des lments non domins de E est appel front de Pareto. La
rsolution dun problme multicritre consiste en la dcouverte du front de Pareto.
La figure 5.1 illustre la notion de dominance au sens de Pareto dans le cas bi-critres.
Dun point de vue formel, aucune des solutions de Pareto ne peut tre prfre aux autres.
La relation de dominance  ninduit quun ordre partiel sur lespace des critres, comme le
montre figure 5.2. Pour un lment x donn, lespace des critres se divise en trois rgions
selon que leurs lments dominent x (E x) , sont domins par x (x E) ou ne peuvent
tre compars x (x  E E  x).
Remarque 5.1. Supposons maintenant que la figure 5.1 reprsente un problme doptimisa-
tion bi-critres. Mme si les solutions du front de Pareto ne peuvent en thorie tre ordonnes,
52 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE

Fig. 5.2 Relations de dominance dans un espace deux critres pour un problme de
minimisation

il y a fort parier que certaines solutions non domines soient plus pertinentes que dautres
pour le dcideur. Si ce dernier met une prfrence pour la solution 1 par exemple, nous pou-
vons alors en dduire que le critre A est prdominant pour ce problme. Le dcideur est en
effet prt accepter une erreur consquente sur le critre B pour satisfaire le critre A en pre-
mier. A loppos, si la solution 3 est prfre, cest le critre B qui prime. Enfin, la solution 2
indique que les deux critres sont mobiliss gale importance dans le choix dune solution.

5.3 Classification des mthodes


Les mthodes doptimisation combinatoire multicritre sont nombreuses. Les auteurs dis-
tinguent habituellement deux grandes catgories dapproches :
1. les mthodes compltes, qui garantissent loptimalit des solutions, mais ne peuvent pas
toujours tre excutes en un temps raisonnable ;
2. les mtaheuristiques, qui permettent de dcouvrir rapidement des solutions approches.
Dans la littrature, de nombreux problmes combinatoires sont abords laide dou-
tils doptimisation classiques telles que la programmation linaire en nombres entiers ou la
programmation dynamique. Dautres mthodes utilisent une reprsentation arborescente de
lespace de recherche, comme lalgorithme A* ou les algorithmes de sparation et valuation
(branch and bound ). Ces derniers imposent la possibilit destimer, pour chaque sous-arbre de
recherche, des bornes infrieures des objectifs (dans le cas dun problme de minimisation).
Le sous-arbre courant nest pas explor si les bornes associes sont domines par les configu-
rations efficientes courantes. En gnral, le calcul de bornes efficaces dpend fortement des
proprits des fonctions objectifs (linarit, monotonie, additivit. . .).
Si la plupart des auteurs saccordent dire que les mthodes compltes sont trs efficaces
pour une certaine classe de problmes, Talbi [Tal99] fait observer que pour des problmes
plus de deux critres ou de grande taille, il nexiste aucune procdure exacte efficace, tant
donn les difficults simultanes de la complexit N P et le cadre multicritre des problmes.
5.4. CONVEXIT DU FRONT DE PARETO 53

Il sera donc illusoire de prtendre aborder le problme de lorchestration avec des mthodes
compltes, dautant plus que les fonctions optimiser ne sont ni linaires, ni additives, ni
monotones (voir annexe A).
Les mtaheuristiques se proposent de contourner ces limitations en se restreignant des
solutions satisfaisantes bien que trs souvent non-optimales. Le terme d heuristique d-
signe une mthode permettant de calculer en temps polynomial une solution ralisable dun
problme doptimisation N P. Lefficacit dune heuristique ne peut tre dmontre, mais seule-
ment vrifie par lexprience. En gnral, une heuristique sappuie sur la structure propre du
problme rsoudre et propose une mthode de recherche ad-hoc. A contrario, les mtaheu-
ristiques regroupent un ensemble de mthodes gnrales, dun haut niveau dabstraction,
pouvant sappliquer diffrents problmes.
Labondante littrature sur les problmes doptimisation combinatoire multicritre a cou-
tume de sparer les mtaheuristiques en mthodes dites de voisinage et en mthodes
population . Les premires ont la particularit de nutiliser, tout moment de lexcution,
quune seule configuration, itrativement modifie dans le but de converger vers le front de
Pareto. Lorsque lvolution nest plus possible, la recherche peut ventuellement repartir dune
nouvelle configuration pour converger vers une autre zone de la frontire efficiente. Les m-
thodes de voisinage les plus utilises aujourdhui sont la recherche tabou, le recuit simul et
la mthode GRASP (Greedy RAndomized Search Procedure).
A loppos, les mthodes population utilisent un ensemble de configurations dont les
coordonnes dans lespace des dcisions sont mises jour chaque itration de lalgorithme.
Lintgralit de la population converge alors vers le front de Pareto, sans quaucune rgion
de la frontire ne soit, en thorie, privilgie. Les algorithmes gntiques (AGs) constituent la
classe la plus ancienne et la plus utilise des mthodes doptimisation population. Ils sont
lorigine de mthodes plus rcentes comme les systmes immunitaires artificiels et les algo-
rithmes valuation de distribution. Une autre famille de mthodes, inspires des phnomnes
dorganisation complexe chez les animaux vivant en groupe, se base sur une collaboration entre
les individus qui permet la population de sauto-organiser et de sadapter au pro-
blme courant. Les plus clbres sont les colonies de fourmis et loptimisation par essaims
particulaires.
Plus rcmment, des auteurs ont propos des mthodes hybrides, couplant en gnral un
algorithme gntique une mthode recherche locale. La figure 5.3 propose une classification
des mthodes doptimisation combinatoire multicritre. Le lecteur dsirant davantage de d-
tails pourra consulter les tats de lart dresss par Ulungu & Teghem [UT94], Talbi [Tal99],
ou encore Ehrgott & Gandibleux [EG00].

5.4 Convexit du front de Pareto


Etant donn un problme de minimisation multicritre :

min fk ,
k

certaines solutions efficientes peuvent tre trouves en rsolvant le problme uni-critre sui-
vant : X
min k fk , (5.5)
k
54

Mthodes
Mtaheuristiques
compltes

Programmation
Mthodes Programmation Mthode de Mthode Mthodes
linaire en
arborescentes dynamique voisinage population hybrides
nombres entiers

Algorithme A* Branch & Bound Algorithmes Collaboration des


volutionnaires individus

Algorithmes Stratgies Colonies de Essaims


Recuit simul Recherche tabou GRASP
gntiques d'volution fourmis particulaires

Systmes Algorithmes Algorithmes


immunitaires estimation de volution
artificiels distribution diffrentielle

Fig. 5.3 Classification des mthodes doptimisation combinatoire multicritre


CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE
5.4. CONVEXIT DU FRONT DE PARETO 55

Frontire de Pareto

Solutions
supportes

Solution
non-supporte

Fig. 5.4 Solutions supportes et non-supportes dans un problme de minimisation

pour diffrents jeux de poids (1 , . . . , k ) . Les configurations efficientes solutions du


problme 5.5 sont dites supportes. Elles se situent dans les zones convexes du front de Pareto
(voir figure 5.4). Les solutions non-supportes, dans les zones concaves du front, ne peuvent
pas tre dcouvertes par la transformation vers luni-critre propose en 5.5.

La premire ide qui vient lesprit lorsquon a affaire un problme multi-critre est
videmment de se ramener un problme uni-critre, afin de bnficier des mthodes classiques
doptimisation. Lagrgation linaire propose en 5.5 est lapproche la plus intuitive. Une
alternative est la mthode -contrainte, qui consiste transformer N 1 des N objectifs en
contraintes et optimiser sur lobjectif restant. Une troisime approche, la programmation par
buts (goal programming), propose de minimiser la distance un vecteur objectif de rfrence
selon une norme Lp pondre. Talbi [Tal99] note que seule cette dernire permet de dcouvrir
des solutions non-supportes, condition toutefois que le dcideur soit capable de dfinir un
but atteindre et un ensemble de poids relatifs associs chacun des critres. En pratique, cela
ncessite une trs bonne connaissance du problme et des fonctions objectifs qui le modlisent,
ce qui est trs rarement le cas.
Certains auteurs ont tent daborder les problmes multicritres en traitant sparment
chaque objectif. La slection des critres peut tre mene de faon parallle (algorithme de
Schaffer), lexicographique (algorihme de Fourman) ou encore alatoire (algorithme de Kur-
sawe). Cependant, Talbi [Tal99] et Fonseca & Fleming [FF95] ont montr que ces algorithmes
ne permettaient pas de trouver des solutions non-supportes.
Les mthodes numres ci-dessus sont souvent dnommes approches non-Pareto, car la
dominance Pareto ny est jamais prise en compte ni exploite. Elles ne peuvent dcouvrir
que des solutions supportes et sont donc inutilisables en cas de non-convexit du front de Pa-
reto. A contrario, les approches Pareto, initialement introduites par Goldberg [Gol89], utilisent
56 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE

directement la notion de dominance de Pareto dans lvaluation et la mise jour des configu-
rations. Elles permettent notamment de trouver des solutions non-supportes. Les mthodes
rcentes doptimisation combinatoire multicritre appartiennent toutes cette catgorie. Les
algorithmes gntiques en constituent la famille la plus rpandue, nous les dtaillons donc
la section suivante.

5.5 Introduction aux algorithmes gntiques


Les algorithmes gntiques, introduits en 1975 par Holland [Hol75], sinspirent des mca-
nismes de slection naturelle dans lvolution des espces. Au sein dune population, les indi-
vidus les moins adapts lenvironnement disparaissent. Les autres survivent et transmettent
leurs caractristiques aux gnrations suivantes. La population devient ainsi, au cours des
gnrations, de plus en plus adapte son environnement.
Un des intrts majeurs des algorithmes gntiques est de ne faire, contrairement aux
mthodes mathmatiques plus classiques, aucune hypothse quant la nature des fonctions
optimiser. Ils peuvent donc en thorie traiter tous types de problmes, et sadapter des
fonctions non drivables ou non continues, ce qui rend trs vaste leur champ dapplication.

5.5.1 Principes gnraux


Les individus formant la population dun AG sont reprsents par des chanes de caractres
sur un alphabet A, et de longeur fixe L. Les lments dune chane de caractres sont appels
gnes , et la chane elle-mme constitue le gnome (ou le chromosome ) dun individu.
Loptimisation par algorithmes gntiques suppose donc lexistence dune fonction de lec-
ture du gnome, associant tout lment de AL une configuration de lespace de recherche.
Traditionnellement, les auteurs prconisent un encodage binaire des individus (A = {0; 1}).
Dans une tude thorique, Whitley [Whi93] a montr que les capacits exploratoires des AGs
rsolvant des problmes continus taient maximales avec des alphabets binaires. De nom-
breuses mthodes rcentes ont toutefois recours des alphabets de plus grande cardinalit,
voire infinis (alphabets rels).

La conception dun algorithme gntique repose sur quatre piliers fondamentaux :


1. une fonction de lecture permettant de reprsenter tout lment de lespace de recherche
par au moins un chromosome ;
2. une fonction dvaluation valeurs relles, mesurant le niveau dadaptabilit dun indi-
vidu lenvironnement, appele couramment fonction de fitness 1 ;
3. un ensemble doprateurs gntiques, cest--dire des oprations internes, darit va-
riable, sur lespace des chromosomes, permettant dengendrer de nouveaux individus ;
4. des stratgies de slection et de remplacement, qui gouvernent lvolution de la popula-
tion.
1
Dans le cas de problmes uni-critre, la fitness se confond en gnral avec la fonction optimiser. En
multicritre, les choix de fitness diffrent selon les auteurs. Les approches les plus courantes sont dune part
lagrgation des critres [IM96] [Jas02], dautre part lensemble des mthodes tirant parti de la dominance de
Pareto : ranking des individus [SD94], ou comptage des individus domins ou dominants [ZT99] [ELT07].
5.5. INTRODUCTION AUX ALGORITHMES GNTIQUES 57

A c B A a Y h 1 A c B A a Y f 7

e c v z a Y f 7 e c v z a Y h 1

Crossover monopoint (conservation des schmas)

A c B A a Y h 1 e c v A a Y h 7

e c v z a Y f 7 A c B z a Y f 1

Crossover uniforme (conservation des schmas)

A c B A a Y h 1 A c B A a Y f 1

Mutation monopoint

Fig. 5.5 Oprateurs gntiques usuels

5.5.2 Oprateurs gntiques


En gnral, les oprateurs gntiques sont de deux types. On distingue les oprateurs
binaires (souvent appels oprateurs de croisement, ou crossovers), qui une paire de chro-
mosomes associent gnralement un ou deux rejetons , et les oprateurs unaires (mutation),
nagissant que sur un seul chromosome. Les oprateurs binaires imitent les mcanismes de la
reproduction sexue, dans laquelle les gnes de deux parents sont recombins pour crer
de nouveaux chromosomes, tandis que la mutation simule, comme son nom lindique, des
accidents survenant dans le gnome au cours de lvolution. Alors que les croisements fa-
vorisent la transmission des caractristiques dune gnration la suivante, les mutations en
introduisent de nouvelles, parfois salutaires.
Les croisements les plus utiliss dans les AGs sont le crossover monopoint et le crossover
uniforme. Dans le crossover monopoint, deux chromosomes sont sectionns en un point
alatoire et les branches rsultantes sont changes. Dans le crossover uniforme, les gnes sont
changs alatoirement entre les deux chromosomes. Quant la mutation, elle consiste en
gnral altrer un seul gne du chromosome. La figure 5.5 illustre ces trois oprations.

Remarque 5.2. Les oprations de crossover (aussi bien monopoint quuniforme) conservent
les schmas gntiques (voir Holland [Hol75] et Whitley [Whi93]) : si les mmes gnes sont
prsents chez les deux chromosomes parents (en bleu sur la figure 5.5), ils sont alors transmis
aux deux chromosomes issus du crossover.

5.5.3 Exploration et intensification


Comme toutes les mtaheuristiques pour loptimisation, les algorithmes gntiques doivent
respecter lquilibre dlicat entre intensification (i.e. la dcouverte, dans le voisinage dune
58 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE

Population
initiale

Population
intermdiaire

Slection

Oprations
gntiques

Mise jour de la
population

Population
intermdiaire

Critre
d'arrt

Population
finale

Fig. 5.6 Schma gnrique dun algorithme gntique


5.5. INTRODUCTION AUX ALGORITHMES GNTIQUES 59

bonne configuration, dune solution encore meilleure) et diversification de la recherche


(i.e. la dcouverte de bonnes solutions dans des zones diffrentes de lespace de recherche,
ou de lespace des critres). Dans une approche multicritre, intensification et diversification
correspondent respectivement la convergence vers le front de Pareto et la couverture de
la frontire optimale. Une mthode privilgiant lintensification risque de ne mettre en vi-
dence quune seule rgion doptimalit cest la drive gntique des AGs (voir section 5.5) ;
linverse, privilgier la diversification se fait souvent au dtriment de la convergence vers
loptimialit.
Dans les algorithmes gntiques, lutilisation simultane du crossover et de la mutation
(voir figure 5.5) permet gnralement de garantir la fois lintensification et la diversification
de la recherche, sans que toutefois lun ou lautre des oprateurs ne corresponde une tche
prcise :
Lorsque les deux chromosomes parents impliqus dans le crossover partagent des sch-
mas gntiques communs, ce dernier intervient comme oprateur dintensification de la
recherche autour du schma commun. En revanche, un croisement entre deux chromo-
somes trs diffrents profite la diversification de la population.
La mutation ne modifiant gnralement que quelques gnes (la plupart du temps un seul)
du chromosome, elle agit a priori comme un oprateur dintensification. Cependant, elle
entrane souvent un saut qualitatif majeur caractris par un dplacement significatif
dans lespace des critres.
Dune manire gnrale, crossover et mutation sont donc deux oprateurs dintensification et
de diversification de la recherche, leurs effets dpendant la fois de la proximit gntique,
en termes de schmas, des chromosomes parents, la fois des discontinuits des fonctions
conduisant de lespace des chromosomes lespace des critres.

5.5.4 Evolution et slection naturelle


Les mcanismes de slection naturelle responsables de llimination progressive des indi-
vidus les moins adapts lenvironnement interviennent, au sein des algorithmes gntiques,
deux niveaux.
La stratgie de slection permet disoler un sous-ensemble de la population courante, qui
seul donnera naissance aux nouveaux individus. Le mcanisme qui consiste favoriser les
meilleurs individus dans la slection est appel litisme. Selon les champs dapplication et la
conception des algorithmes, la slection peut tre :
alatoire (absence dlitisme) ;
totalement litiste (seuls les meilleurs individus sont retenus) ;
proportionnelle la fitness (un individu a dautant plus de chance dtre slectionn quil
est adapt lenvironnement cette approche est connue sous les noms de roulette wheel
selection et stochatic remainder [Gol89]) :
base sur un tournoi : sur plusieurs individus tirs alatoirement dans la population, on
retient ceux de meilleure fitness.

Les individus franchissant avec succs ltape de slection vont alors engendrer, par ap-
plication des oprateurs gntiques, de nouvelles solutions. Lide maitresse des AGs est que
les rgions optimales de lespace de recherche sont caractrises par des schmas gntiques
60 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE

qui se transmettent au cours des gnrations. La mise jour de la population augmente


des nouvelles solutions constitue alors le deuxime temps de la slection naturelle. Si la
population est de taille fixe, il sagit de dcider lesquelles des nouvelles solutions remplacent
les anciennes. Si la population est de taille variable, il faut convenir dun mcanisme de dispa-
rition progressive des individus les moins adapts. L encore, les approches diffrent suivant
les auteurs.
La principale difficult, lors de la mise jour de la population courante, consiste encoura-
ger la convergence vers le front de Pareto tout en maintenant la diversit de la population dans
lespace des critres. Goldberg [Gol89] fait en effet remarquer que les AGs ont une tendance
naturelle driver vers une zone particulire de la frontire de Pareto au fur et mesure
des gnrations, se dtournant irrmdiablement des autres solutions optimales. Pour contre-
carrer ce phnomne connu sous le nom de drive gntique (genetic drift), les auteurs
ont imagin diffrentes approches pour mesurer la densit locale au sein de la population et
favoriser lexploration des zones les moins peuples.

La figure 5.6 illustre le droulement type dun algorithme gntique. La plupart du temps,
le critre darrt est dtermin par un nombre maximum de gnrations ou dvaluation de
fitness.

5.6 Algorithmes de rfrence


Dans cette section nous prsentons les algorithmes gntiques les plus clbres, identifions
leurs atouts et leurs travers. Cette discussion servira de rfrence pour la conception dun AG
adapt au problme de lorchestration.

5.6.1 MOGA, NPGA, NSGA


Les premiers algorithmes gntiques exploiter directement la dominance de Pareto dans
lvaluation des individus sont lalgorithme MOGA (Mutliple Objective Genetic Algorithm)
de Fonseca et Fleming [FF93], NPGA (Niched Pareto Genetic Algorithm) de Horn, Nafpliotis
& Goldberg [HNG94] et NSGA (Nondominated Sorting Genetic Algorithm) de Srinivas &
Deb [SD94].
Dans lalgorithme NPGA, la slection des individus pour la reproduction consiste tirer
deux individus au hasard dans la population courante, ainsi quun ensemble dindividus de
taille tdom qui va servir dterminer le meilleur des deux candidats selon la relation de
dominance de Pareto. Si NPGA est une mthode de rfrence dans lindustrie, certains auteurs
[ZT98b] [SD94] font observer que le choix du paramtre tdom est aussi dlicat que fondamental
pour la performance de lalgorithme. Lalgorithme MOGA contourne ce problme avec un
calcul de fitness bas sur le nombre de points dominants (au sens de Pareto) la solution
valuer. Quant au NSGA, les solutions sont values par extractions itratives de fronts de
Pareto successifs, auxquels sont attribus des rangs croissants (les meilleurs individus ont le
rang le plus faible). Deb et al. [DPAM00] regrettent toutefois que cette mthode de classement
des solutions (connue sous le non de non-dominated sorting) ait une complexit en temps en
O(KN 3 ), o K est le nombre de critres et N la taille de la population.
Les auteurs ont test ces mthodes avec diffrents principes de slection des individus
pour la reproduction (voir section 5.5 et figure 5.6). Il semble que le tournoi binaire (binary
tournament) outrepasse largement les performances des autres mthodes de slection (roulette
5.6. ALGORITHMES DE RFRENCE 61

wheel selection, stochastic remainder ), en raison notamment de son insensibilit aux intervalles
de valeurs prises par les critres. En outre, les auteurs mettent en garde contre un risque de
comportement chaotique des AGs lorsque le tournoi binaire est combin avec une mthode de
partage (sharing), qui consite pnaliser la fitness dans les zones de forte densit.

Bien que les algorithmes sus-cits aient t, ou continuent dtre, implments dans de
nombreux systmes daide la dcision, les recherches rcentes en optimisation multicritre
ont conduit les critiquer sur un certain nombre de points. Deb et al. [DPAM00] identifient
par exemple trois dfauts majeurs de lalgorithme NSGA :
1. une complexit en temps souvent rdhibitoire pour des problmes grand nombre de
critres ;
2. une convergence vers la frontire Pareto relativement lente, due la disparition progres-
sive de bonnes solutions au fur et mesure des gnrations (absence dlitisme) ;
3. des paramtres difficiles calibrer et devant tre adapts chaque nouvelle instance
dun problme.
Jaszkiewicz [Jas01] remarque en outre que la notion de dominance assure la convergence de
la population vers lensemble de Pareto mais pas la dispersion sur lintgralit de la frontire
(cest effet de spciation , ou drive gntique ).

Pour remdier ces inconvnients, certains auteurs ont propos de renforcer llitisme dans
les AGs en conservant une mmoire des solutions optimales, servant de rfrence pour
lvaluation des individus. Les algorithmes SPEA, PAES, et NSGA-II sont conus selon ce
principe. Dautres auteurs [Tal99] [FF95] [BAKC99] font observer quen gnral les AGs et les
mthodes de recherche locale (cf. section 5.3 et figure 5.3) donnent des solutions diffrentes et
proposent des algorithmes hybrides combinant les deux mthodes (MOGLS, M-PAES, SPEA-
II).

5.6.2 SPEA (I-II), PAES, M-PAES, NSGA-II, MOGLS (I-II-III)


Lalgorithme SPEA (Strength Pareto Evolutionary Algorithm) a t propos par Zitzler
& Thiele [ZT98b] [ZT98a] [ZT99]. Les auteurs suggrent de maintenir une population externe
dlite, rassemblant les solutions non-domines courantes. Cet ensemble dlite intervient dans
toutes les oprations gntiques et sert galement de bassin de slection pour la reproduction.
Une mthode de clustering permet de limiter la taille de lensemble dlite et de sassurer que
les solutions de ce dernier se rpartissent de faon uniforme sur lapproximation courante du
front. La complexit de SPEA est en O(KN 3 ) pour limplmentation suggre dans [ZT98a],
mais Deb et al. [DPAM00] ont montr quune structure de donnes adapte permettait de
rduire cette complexit O(KN 2 ).
Dans leur algorithme PAES (Pareto-Archived Evolution Strategy), Knowles and Corne
[KC99] utilisent un AG avec parent unique et enfant unique. Seul lun des deux est retenu
pour la gnration suivante aprs comparaison une archive des solutions optimales gnres
jusqualors. Lvaluation est base sur la dominance Pareto et sur une mesure de voisinage
dans lespace des paramtres, garantissant une couverture uniforme de lensemble de Pareto. La
diversit est maintenue en divisant lespace de recherche en dn sous-espaces dynamiquement
actualiss, o d est la profondeur de la partition et n le nombre de variables de dcision.
La complexit de PAES est en O(aKN ), o a est la taille de larchive. Plus rcemment,
62 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE

les auteurs ont propos M-PAES [KC00] (Memetic Pareto-Archived Evolution Strategy), une
version hybride de lalgorithme PAES dans laquelle chaque progniture est amliore par une
mthode de recherche locale avant le tournoi contre son gniteur. Au cours de cette phase
doptimisation, lacceptation dun nouveau voisinage est soumis aux mmes rgles que celle
du tournoi final entre parent et enfant.
Deb et al. [DPAM00] ont propos une amlioration de NSGA (cf. supra) corrigeant les
dfauts principaux de lalgorithme initial. La complexit de NSGA-II est ramene O(KN 2 )
et la diversit est maintenue grce une fonction destimation de la densit dchantillonnage
du front de Pareto. Par ailleurs, NSGA-II propose une gestion trs pertinente des ventuelles
contraintes, en introduisant une mesure de consistance (fonction de cot) de celles-ci dans la
dominance Pareto.
En 1996, Ishibuchi & Murata [IM96] ont introduit une premire version de lalgorithme
MOGLS (Mutli Objective Genetic Local Search). A chaque gnration les nouvelles solutions
sont amliores grce une mthode de recherche locale, optimisant une somme pondre
des critres, dont le jeu de poids est tir alatoirement. Jaszkiewicz [Jas01] fait observer que
lalgorithme MOGLS, bien que bas sur une agrgation linaire des critres le rapprochant
des mthodes de goal programming, neffectue pas une transformation vers luni-objectif pour
autant, du fait de sa structure dAG permettant une recherche simultane de solutions mul-
tiples dans des directions multiples. MOGLS tire parti des rsultats de Chen et Liu [CL94] et
Steuer [Ste86], prouvant que lintgralit de lensemble Pareto peut tre obtenu en rsolvant
un problme de goal programming pour lensemble de jeux de poids possibles.
Une seconde version de lalgorithme MOGLS a t propose par Jaszkiewicz [Jas01] [Jas02].
Le mcanisme de roulette wheel selection est remplac par un tirage alatoire parmi les
meilleurs candidats, et la somme pondre par une distance de Tchebycheff pondre (cf.
dfinition 8.5.1). Jaszkiewicz [Jas02] fait observer que les fonctions de Tchebycheff sont plus
adaptes que les fonctions linaires pour des problmes o la forme du front de Pareto est com-
plexe ; elles permettent notamment de trouver des solutions non-supportes (voir section 5.4).
Lauteur fournit en outre une mthode efficace pour calculer le nombre de solutions initiales.
Ishibushi et al. [IY02] ont suggr une autre amlioration de lalgorithme MOGLS en ex-
ploitant lide que la performance de lAG peut tre accrue en utilisant dans la recherche
locale une direction doptimisation adapte chaque solution et indpendante du jeu de poids
employs dans le mcanisme de slection des parents. La mthode permet ainsi de sparer
totalement volution gntique et exploration du voisinage des solutions, et peut donc sadap-
ter trs facilement tout type de recherche locale. Lalgorithme SPEA-II [ZLT02] exploite
galement une hybridation de ce type.
Par ailleurs, Ishibuchi et al. [IY02] font remarquer que dans de nombreux algorithmes
hybrides la majeure partie du temps de calcul est dvoue la recherche locale, et fournissent
quelques pistes pour quilibrer la balance entre les deux metaheuristiques.

5.6.3 APAES, MAREA, MEMOTS, PFGA


Ce chapitre ne saurait prtendre recenser lensemble des techniques doptimisation multi-
critre, tant les variantes dans les approches et cas dapplication sont nombreux. Nous ren-
voyons le lecteur avide de connaissances aux ouvrages de rfrence mentionns en section 5.1.
Toutefois, deux innovations rcentes nous semblent devoir encore tre mentionnes, car elles
introduisent deux nouveaux paradigmes dans la recherche multicritre laide de mtaheuris-
tiques.
5.7. FONCTIONS SCALARISANTES DE TCHEBYCHEFF 63

Grosan et al. font remarquer que les alphabets binaires ne sont pas adapts tous les
problmes, et quil existe de nombreux cas o il est plus judicieux dutiliser une autre encodage
des solutions. Malheureusement, le choix dun alphabet ncessite une trs bonne connaissance
de lalgorithme employ et du problme rsoudre, laquelle ne peut sacqurir qua posteriori,
et par un dcideur matrisant les concepts scientifiques des algorithmes gntiques.
Les auteurs ont donc propos de laisser lalgorithme de choix de lalphabet, en codant la
taille de ce dernier directement dans le gnome. Les oprateurs gntiques permettent alors
soit de modifier le gnome au sein du mme alphabet (mutation), soit de traduire linformation
porte par les gnes dans un autre alphabet (transmutation). De faon vidente, le crossover
ne peut sappliquer, car les chromosomes apairs ne partagent pas ncessairement le mme
alphabet.
Ce principe dadaptabilit de lalphabet a t exploit dans les aglorithmes APAES (Adap-
tive Pareto-Archive Evolution Strategy) [OGAK05] et MAREA [Gro06]. Dans chacune de ces
deux mthodes, lorsquun individu ne peut plus tre amlior par mutation gntique, une
transmutation est applique pour changer dalphabet.

Une autre volution rcente dans les mtaheuristiques pour loptimisation multicritre
concerne le maintien de la diversit dans la population. La prservation de la diversit est
essentielle dans une mthode population, car elle empche que lensemble des individus soit
attir par un rgion unique de lespace. En recherche uni-critre, elle permet dviter le pige
des minima locaux ; en multicritre, elle garantit une rpartition uniforme des solutions le long
du front de Pareto.
Traditionnellement, le maintien de la diversit passe par une estimation de la densit locale
dans lespace des critres, afin soit de pnaliser les zones les plus denses lors de la slection pour
la reproduction, soit den retirer des individus lors de la mise jour de la population. Elle est
base sur la notion de voisinage dans lespace des critres, dfinie laide de paramtres
comme le rayon de voisinage ou la distance aux plus proches voisins. Hlas, les valeurs de
ces paramtres sont trs difficiles dfinir ou interprter, car elles dpendent fortement du
problme considr.
Lust & Teghem [LT06] ont donc propos lalgorithme MEMOTS (Memetic Multi-Objective
Tabu Search), dans lequel la densit est calcule laide dune hypergrille divisant lespace des
critres en hypervolumes. La densit locale y est alors dfinie comme le nombre de solutions
dans chaque hypervolume. Les auteurs fournissent galement une mthode simple pour dfinir
la taille de lhypergrille en fonction de la taille de la population.
Une autre approhe est propose par Elaoud et al. [ELT07] avec lalgorithme PFGA (Pa-
reto Fitness Genetic Algorithm). L encore, une hypergrille est utilise, mais celle-ci sadapte
automatiquement la taille de la population et aux chelles de valeurs prises par les critres.
La mesure de la densit locale par la mthode PADE (Population size Adaptive Density Esti-
mation) ne ncessite aucun paramtre dont la valeur doit tre dfinie par le dcideur et peut
donc en thorie sadapter tout type de problme. Cette mthode est dtaille la section
5.8

5.7 Fonctions scalarisantes de Tchebycheff


Une des tapes les plus dlicates dans un algorithme gntique multicritre est sans doute
lvaluation de la qualit des individus, ou calcul de fitness. Les algorithmes NSGA [SD94] et
NSGA-II [DPAM00] utilisent directement le rang (au sens de pareto) des individus, alors que
64 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE

dautres se basent sur le dnombrement des configurations dominant et/ou domines par la
configuration value. SPEA [ZT98a] [ZT98b] [ZT99], SPEA-II [ZLT02], MEMOTS [LT06] et
PFGA [ELT07] fonctionnent sur ce principe. Toutes ces mthodes corrigent parfois la valeur de
fitness laide dune estimation de densit locale, afin de dfavoriser les zones les plus peuples
de lespace des critres au profit des moins denses. Une troisime approche, exploite dans les
diffrentes versions de lalgorithme MOGLS [IM96] [Jas01] [Jas02], procde une agrgation
des critres par normes de Tchebycheff pondres alatoirement (voir dfinition 8.2).
Lagrgation par normes de Tchebycheff pondres (dites aussi fonctions scalarisantes de
Tchebycheff ) sappuie sur une proprit nonce par Chen & Liu [CL94] et Steuer [Ste86],
selon laquelle un problme multicritre est quivalent un ensemble de problmes mono-
critre scalariss .

Dfinition 5.4. Soit la partie de [0; 1]N telle que :


X
= (1 , . . . , N ) , i = 1 (5.6)
i

Soit = (1 , . . . , N ) . La norme dfinie sur un espace de critres C, de dimension N ,


par :
x C, kxk = max i xi (5.7)
i

est appele norme de Tchebycheff pondre par le jeu de poids = (1 , . . . , N ).

Proprit 5.1. Avec les notations introduites la dfinition 5.4, une solution x appartient
au front de Pareto si et seulement si :

, x = argminkyk ,
yC

La dmonstration de la proprit 5.1 utilise la notion de norme induite qui sera introduite
au paragraphe 8.5.1.

La figure 5.7 illustre cette dualit entre un problme multicritre et un ensemble de pro-
blmes mono-critre. Les trois configurations efficientes x1 , x2 et x3 sont respectivement so-
lutions de problmes de minimisation des normes N1 , N2 et N3 . Pour chacune dentre elles,
les jeux de poids associs dfinissent des directions doptimisation diffrentes. Notons que
les normes de Tchebycheff pondres, par les boules hyper-rectangulaires quelles induisent,
permettent de sadapter aux portions concaves du front : les solutions non-supportes (voir
section 5.4) peuvent tre dcouvertes par minimisation dune norme de Tchebycheff, ce que
lagrgation linaire des critres ne permet pas.

Dans les algorithmes MOGLS, un nouveau jeu de poids est tir alatoirement chaque it-
ration. La population est donc chaque fois value avec une fonction scalarisante diffrente. La
minimisation de la norme pondre courante assure la convergence vers une zone particulire
du front de Pareto, tandis que le renouvellement des poids favorise la diversit des solutions
le long de la frontire efficiente. Jaszkiewicz expose dans [Jas01] et [Jas02] une mthode effi-
cace pour gnrer uniformment des poids alatoires normaliss. Elle garantit une couverture
5.7. FONCTIONS SCALARISANTES DE TCHEBYCHEFF 65

x1

x2

N1
N2

x3

N3

Fig. 5.7 Trois solutions efficientes obtenues par optimisation unicritre dans un problme
de minimisation

uniforme de lespace des prfrences :



1 = 1 K1 X



... 




k = 1 k1 K1k
P
l=1 l 1 X (5.8)

...




K = 1 K1
P
l=1 l

o X est une variable alatoire uniforme dans [0; 1].

En pratique, si = (1 , . . . , K ) est le jeu de poids courant, un point x de lespace


des critres est valu laide de la fonction de fitness suivante :

f (, x) = max k xk , (5.9)
1kK

o (x1 , . . . , xK ) sont les coordonnes rduites de x :

xk xmin
k
xk =
xmax
k x min
k

Les coordonnes rduites permettent de saffranchir des diffrentes chelles de valeurs prises
par chacun des critres. Pour chaque dimension k, xmink et xmax
k sont estimes par les plus
petite et plus grande valeurs de xk obtenues depuis le dbut de lexcution de lalgorithme.
66 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE

w1 W1

W2

D=4

D=2
w2

Fig. 5.8 Estimation de la densit locale par la mthode PADE : Population size Adaptive
Density Estimation (daprs Elaoud & Teghem [ELT07]).

5.8 Maintien de la diversit par la mthode PADE

Afin dviter la convergence prmature de la population vers une zone particulire de


lespace de recherche (genetic drift), la littrature propose des mthodes de partage (sharing
procedures). Elles valuent dans un premier temps la densit locale de la population, puis
pnalisent les valeurs de fitness dans les zones les plus denses. En gnral, le calcul de la
densit autour dune solution est base sur la distance moyenne aux N plus proches voisins
ou sur le nombre dindividus situs un distance infrieure dmax de la solution. Les auteurs
saccordent cependant sur la difficult de dterminer des valeurs adquates pour les paramtres
N ou dmax , pourtant cruciales pour les performances des algorithmes.
Face ce constat, Elaoud & Teghem [ELT07] ont propos un principe efficace de calcul de
densit, sadaptant la population et ne ncessitant aucun paramtre extrieur. La mthode
PADE (Population size Adaptive Density Estimation) part du principe quune population
de N individus est uniformment rpartie dans lespace des critres lorsque chaque individu
occupe une fraction 1/N de lespace total. Les auteurs suggrent donc de dcouper lespace
de critres en N cellules et de dfinir la densit de chaque cellule comme le nombre dindividus
quelle contient. La densit locale associe chaque individu est alors gale la densit de la
cellule qui le contient. La complexit de la mthode PADE est en O(N K).
En pratique, si X est la population courante, la mthode PADE quadrille lhyper-rectangle
de diagonale :
    
minfk (x) ; maxfk (x)
xX k xX k
5.8. MAINTIEN DE LA DIVERSIT PAR LA MTHODE PADE 67

en un ensemble de cellules dont la largeur Wk sur chaque objectif k est donne par :

maxfk (x) minfk (x)


xX xX
Wk =
K
N

Le nombre nc de cellules sur chaque dimension est donc gal E( K N ) + 1, o E dsigne la
fonction partie entire, et le nombre total de cellules nKc , lgrement suprieur N . Si K
N
nest pas un nombre entier, alors les cellules les plus proches des axes ont une largeur donne
par : 
K

K
wk = W k N E( N )

La figure 5.8 illustre le calcul de densit par la mthode PADE dans un cas bicritre.

Conclusion
Les mthodes multicritres permettent daborder des problmes doptimisation pour les-
quels limportance relative des objectifs ne peut tre connue a priori. Cependant, la complexit
N P de la plupart des problmes combinatoires multicritres les rend inabordables par les m-
thodes compltes, et le recours aux mtaheuristiques est la plupart du temps incontournable.
Les algorithmes gntiques en constituent la variante la plus courante, et leur efficacit dpend
avant tout des mthodes choisies pour valuer et diversifier les solutions.
68 CHAPITRE 5. OPTIMISATION COMBINATOIRE MULTICRITRE
Chapitre 6

Programmation par contraintes

Programmation par contraintes et informatique musicale


Mthodes compltes et mtaheuristiques
Recherche adaptative et heuristique CN -Tabou
Gestion des contraintes au sein les algorithmes gntiques

Sans anticiper sur la seconde partie de ce document, il est ais de comprendre que la
recherche dorchestrations ne se ramne pas uniquement une tache doptimisation, mais
implique galement un ensemble de conditions que les solutions proposes se doivent de v-
rifier. Dans sa version actuelle, notre outil est une aide lcriture pour orchestre ; aussi les
orchestrations quil suggre doivent-elles se plier aux contraintes imposes par leffectif ins-
trumental : une orchestration ncessitant huit trombones nest pas ralisable par un orchestre
symphonique classique, qui nen comporte que trois ou quatre. En outre, comme nous le ver-
rons au chapitre 10, il doit tre possible pour le compositeur dexiger, par exemple, que les
orchestrations dcouvertes par notre systme ne mobilisent quune partie de lorchestre, quelle
laissent la disposition du compositeur au moins un instrument de chaque type ou de chaque
famille, quelles couvrent une certaine densit harmonique (nombre de notes de hauteurs
diffrentes joues simultanment), etc. La formalisation et la gestion de contraintes au sein de
notre systme est donc invitable. Nous proposons dans ce chapitre un aperu des principes
de la programmation par contraintes et des mthodes de rsolution sy rapportant. Nous d-
taillons en outre deux approches rcentes, la recherche adaptative et lheuristique CN -tabou,
dont sinspire notre algorithme CDCSolver prsent au chapitre 10.

6.1 Principes gnraux


La programmation par contraintes (PPC) est un paradigme de programmation dclarative,
dsignant la fois un formalisme pour la dfinition de CSPs (Constraint Satisfaction Problems)
et un ensemble de mthodes pour les rsoudre. La donne dun CSP consiste en lnumration
de relations logiques (ou contraintes) portant sur les variables du problme. Le problme est
rsolu ds que lon dcouvre une configuration dite consistante, cest--dire un ensemble de
valeurs telles que toutes les relations logiques entre les variables du problme soit vrifies. Sil
nexiste aucune configuration consistante, le problme est dit surcontraint.
La formulation dun problme de satisfaction de contraintes est donn par un ensemble de
variables V1 , . . . , VN valeurs dans des domaines D1 , . . . , DN (finis ou infinis), ainsi que dun

69
70 CHAPITRE 6. PROGRAMMATION PAR CONTRAINTES

N
jeu de contraintes (ou rseau de contraintes) C1 , . . . , Cp , fonctions boolennes sur ( Di )iI ,
o I est un sous-ensemble de {1, . . . , N }. On parle de contrainte unaire (ou de filtre) si I
est un singleton, de contrainte binaire si I est un couple, de contrainte N-aire sinon. De
faon gnrale, une contrainte reprsente une information partielle sur les valeurs que peuvent
prendre les variables dun problme donn. La programmation par contraintes propose des
mthodes de rsolution bases sur la manipulation et la propagation de ces informations
partielles au cours du calcul. Lorsquon avance dans la rsolution, les incertitudes sur
les valeurs autorises pour les variables sont peu peu leves, et une configuration consistante
est alors synonyme dinformation totale.
En pratique, de nombreux domaines dapplication se prtent la programmation par
contraintes, en raison notamment du fort pouvoir expressif de ce paradigme. De la mise en
page des documents multimdia aux problmes de planification, dordonnancement, de gestion
de ressources ou demplois du temps, les contraintes ont t employes avec succs dans des
situations complexes, difficiles formaliser autrement que par un ensemble de conditions
logiques sur les variables.
Le lecteur dsirant approfondir ses connaissances sur la programmtion par contraintes
pourra consulter les ouvrages de Tsang [Tsa93] ou Mariott & Stuckey [MS98].

6.2 Contraintes et informatique musicale


La programmation par contraintes entretient depuis une vingtaine dannes des liens troits
avec linformatique musicale1 , et en particulier la composition assiste par ordinateur, en
raison de la facilit avec laquelle la musique symbolique se prte une formalisation sous
forme de rgles. Lutilisation de contraintes en CAO commence la fin des annes 80 avec
des problmes dharmonisation automatique de mlodies. Avec son systme Choral conu
pour lharmonisation de chorals quatre voix dans le style de Jean-Sbastien Bach, Kemal
Ebcioglu [Ebc88] fut le prcurseur dun champ de recherche part entire (pour tat de lart
complet du domaine, voir la revue de Pachet & Roy [PR01]).
A un niveau plus gnral, le moteur PWConstraints de Mikal Laurson [Lau93] permet de
dfinir des contraintes sur des squences dans lenvironnement de CAO PatchWork [LD89].
Plus tard, Rueda & Bonnet [RLBA98] ont dvelopp dans PatchWork la bibliothque Si-
tuation, dans laquelle les structures musicales sont reprsentes sous forme dobjets bi-dimen-
sionnels, permettant de prendre en compte contraintes harmoniques et contraintes temporelles
au sein dune mme reprsentation. Situation est aujourdhui intgr dans lenvironnement
OpenMusic [Ago98]. Enfin les travaux de Charlotte Truchet [Tru04] au sein de lquipe
Reprsentations musicales de lIrcam ont dbouch sur la cration dans OpenMusic de la
bibliothque OMClouds. Cette dernire tire parti du paradigme de programmation visuelle
dOpenMusic pour tablir une correspondance entre un graphe de contraintes et la repr-
sentation visuelle dun programme. Loriginalit dOMClouds est de proposer une collection
doprateurs et de fonctions suffisamment gnriques pour formaliser un grand nombre de
problmes musicaux.
La programmation par contraintes a galement t utilise dans le domaine temporel avec
1
LAssociation Franaise dInformatique Musicale (AFIM) a dalleurs encourag en 2007 la cration dun
groupe de travail Contraintes, Musique et Interaction, dont nous faisons partie. Ce groupe est galement soutenu
par lAssociation franaise de programmation par contraintes. http://www.lina.sciences.univ-nantes.fr/
ContraintesMusique/
6.3. MTHODES COMPLTES DE RSOLUTION 71

lenvironnement de CAO Boxes dAntony Beuriv [Beu00]. Boxes est bas sur une repr-
sentation hirarchique de type conteneurs/contenus assortis de paramtres temporels (dbut,
dure, fin). Le compositeur peut ainsi facilement organiser dans le temps des objets sonores
par la simple donne de contraintes dantriorit, de postrit, ou de synchronisation.
Antoine Allombert et Myriam Desainte-Catherine [AADC08] ont poursuivi et gnralis
ce travail avec le concept de partitions interactives, permettant aux compositeurs de crer
des pices musicales dans lesquelles des liberts sont laisses aux interprtes quant aux d-
clenchements de certains vnements musicaux. Les partitions interactives ont recours un
formalisme bas sur les relations temporelles de Allen2 grce auquel les compositeurs peuvent
dfinir un ensemble de contraintes temporelles sur les vnements.
Dans un tout autre registre, citons encore le programme MusicSpace dOlivier Dele-
rue [Del04], dans lequel les connaissances sur la spatialisation sonore sont modlises par un
ensemble de relations entre les positions des sources et de lauditeur. MusicSpace allie
une reprsentation graphique des scnes sonores un moteur de contraintes permettant den
respecter la cohrence spatiale.

6.3 Mthodes compltes de rsolution


A linstar de loptimisation multicritre (voir chapitre 5), les mthodes de rsolution en
programmation par contraintes se distinguent en deux catgories :
les mthodes compltes, qui garantissent la dcouverte dune configuration consistante si
le problme nest pas surcontraint, mais au prix dun temps de calcul souvent trs long ;
les mtaheuristiques, qui permettent de trouver rapidement une solution dont la consis-
tance peut tre seulement partielle (i.e. toutes les contraintes ne sont pas satisfaites).
Elle feront lobjet du paragraphe suivant.

6.3.1 Recherche systmatique


Les mthodes de recherche systmatique utilisent une reprsentation arborescente de les-
pace de recherche. Chaque nud correspond linstanciation dune variable et chaque feuille
reprsente une configuration. Lide la plus simple pour rsoudre un problme de satisfac-
tion de contraintes consiste parcourir larbre de recherche en profondeur jusqu lobtention
dune configuration consistante : cest la mthode dite generate-and-test. Une telle procdure
est videmment totalement inefficace en pratique, en raison du caractre N P de la plupart
des problmes.
Lalternative la plus courante est le backtracking, exploitant la notion d instanciation
partielle . Dans la plupart de problmes, chaque contrainte est darit faible : elle nimplique
quun nombre rduit de variables3 . Il nest donc pas ncessaire de connatre les valeurs de
toutes les variables pour savoir si la contrainte est viole ou non. En pratique, un algorithme
de backtracking instancie itrativement les variables (donc descend en profondeur dans larbre
de recherche) jusqu ce quune contrainte soit viole : le sous arbre courant nest alors pas
2
Antriorit, postriorit, succession immdiate, recouvrement, synchronicit des dbuts, synchronicit des
fins, inclusion temporelle, galit temporelle.
3
Si ce nest pas le cas, il est souvent possible dexprimer une contrainte globale (portant sur toutes les
variables) par un ensemble de contraintes locales. Par exemple, une contrainte alldiff (toutes les variables
doivent avoir des valeurs diffrentes) sur un problme trois variables A, B, C est quivalent A 6= B A 6=
C B 6= C.
72 CHAPITRE 6. PROGRAMMATION PAR CONTRAINTES

explor et on modifie la valeur de la variable dernirement instancie. Si ce nest pas possible,


on remonte alors un niveau suprieur de larbre pour changer lune des variables prcdentes.
Lalgorithme termine lorsquune des feuilles est atteinte ou que larbre entier a t explor.
Comme le generate-and-test, le backtracking est inefficace en pratique (sa complexit est
exponentielle dans le pire cas), en raison dune gestion tardive des conflits.

6.3.2 Mthodes de filtrage (ou de consistance)


Les mthodes de filtrage ont pour but de rduire les domaines des variables en dtectant
les valeurs inconsistantes, i.e. ne pouvant prendre part une solution. Une valeur v dune
variable V est dit consistante si et seulement si pour toute contrainte C impliquant V , on
peut trouver une instanciation des autres variables impliques par C compatible avec V = v.
Un problme est dit localement consistant si on peut trouver au moins une valeur consistante
pour chaque variable.
La consistance la plus simple est la consistance de nud, qui ne filtre que les variables
associes des contraintes unaires (nimpliquant quune seule variable). Elle est trs rapide,
mais le plus souvent inefficace : la rduction des domaines par consistance de nud est trs
faible.
On parle de consistance darc ou darc-consistance pour les contraintes binaires.
Celles-ci nimpliquent jamais que deux variables la fois, et couvrent une grande proportion
des problmes de satisfaction de contraintes : de nombreuses contraintes peuvent en effet se
dcomposer en un ensemble de contraintes binaires. La consistance darc se gnralise aux
contraintes N -aires avec la notion de consistance de chemin. En pratique, les mthodes de
consistance se limitent en gnral la consistance darc : le temps de calcul dune consistance
de chemin est dans la plupart des cas rdhibitoire pour des contraintes dont larit dpasse
trois variables. Aussi larc-consistance est-elle bien souvent le meilleur compromis entre le
temps ncessaire au filtrage et lefficacit de celui-ci.
Dans le cas de problmes variables continues ou pouvant prendre un trs grand nombre
de valeurs, la consistance de bornes est prfre la consistance de domaines : elle consiste
raisonner sur les valeurs minimum et maximum que les variables peuvent prendre. Dans le cas
de contraintes binaires dingalit, la consistance de bornes est quivalente larc-consistance.
Les algorithmes de rsolution par filtrage commencent gnralement par rduire les do-
maines de chaque variable. Si lun des domaines est vide, le problme est surcontraint et na
pas de solution. Sinon, les variables dont les domaines filtrs sont des singletons sont instan-
cies ces valeurs. Malheureusement, il reste dans la plupart des cas au moins une variable
V non instancie ; on choisit alors une valeur v possible (dans le domaine filtr) pour V et on
recalcule la consistance avec la nouvelle contrainte V = v. Si le nouveau problme nest pas
consistant, v est retire du domaine de V .
La rsolution dun problme de contrainte par calcul de consistance se base donc sur un
algorithme de point fixe, dont le nombre ditrations ne peut tre connu lavance. Dans le
cas de problme de grande taille ou en prsence de contraintes darit leves, ce processus
paut tre trs long. En gnral, on implmente un algorithme de backtracking avec maintien
de larc-consistance pour les variables encore non instancies. De plus, afin dallger le calcul
de consistance, on se limite frquemment une une seule itration de lalgorithme de poins
fixe (chaque couple de variables nest vrifi quune seule fois). Ces techniques sont dites
look-ahead.
6.4. MTAHEURISTIQUES 73

6.3.3 Mthodes de propagation


Les mthodes de propagation ralisent un compromis entre rduction des domaines et
calcul de consistance, travers la notion de consistance partielle : lors de linstanciation dune
variable V , on vrifie dabord que la nouvelle valeur ne gnre pas de conflits avec les variables
instancies jusqualors (cest le principe du backtracking), puis on propage linformation
apporte par la nouvelle instanciation en filtrant les domaines de toutes variables en relation
avec V dans le rseau de contraintes. Cette mthode est connue sous le nom de forward-
checking. Elle est parfois plus efficace que de maintenir la consistance darc sur les variables
non instancies car elle ne filtre quune seule variable la fois, l o les mthodes de look-
ahead filtrent des paires de variables. En termes de parcours arborescent, le forward-checking
visite davantage de nuds que le look-ahead mais le cot de calcul chaque nud y est moins
important. En vrit, les performances diffrent selon le problme considr.

6.3.4 Contraintes molles


En tant que relation logique sur les variables du problme, chaque contrainte napporte
quune infomration binaire sur une configuration : soit la contrainte est vrifie, soit elle ne
lest pas. Les contraintes molles (ou soft constraints) permettent davantage de souplesse dans
la gestion des configurations inconsistantes. A linstar de la logique floue, les contraintes molles
sont exprimes au travers de fonctions non plus boolennes, mais valeurs relles. On parle
alors de fonctions de cot , traduisant quel point les contraintes sont violes. Dans une
modlisation en contraintes molles, le rseau de contraintes nest pas considr comme un
ensemble de conditions respecter, mais comme une structure sur la base de laquelle on peut
donner une mesure de qualit des configurations.
Au cours de la rsolution, on va chercher minimiser les fonctions de cot associes aux
contraintes. Si le problme est surcontraint, on essaiera dobtenir la solution la plus consistante,
i.e. qui viole le moins les contraintes. Les contraintes molles permettent ainsi de prfrer
certaines solutions (celles dont lcart la consistance est le plus faible) dautres.
Dun certain point de vue, cette approche permet donc daborder les contraintes sous
langle de loptimisation. On y a frquemment recours pour les problmes de grandes tailles,
quon rsout le plus souvent laide de mtaheuristiques.

6.4 Mtaheuristiques
Les mtaheuristiques diffrent des mthodes compltes en ce sens quelles nexplorent pas
larbre de recherche de faon systmatique (elles ne peuvent donc assurer de toujours dcouvrir
des solutions globalement consistantes avec le rseau de contraintes), mais procdent un
affinage itratif dune ou plusieurs solutions courantes, en gnral totalement instancies.
les mtaheuristiques couvrent une large classe de mthodes que nous dtailleront pas in-
tgralement ici. Nous nous contentons de prsenter celles en rapport direct avec la program-
mation par contraintes.

6.4.1 Mthodes de recherche locale


Les mthodes de recherche locale sappuient toutes sur lamlioration itrative dune unique
configuration, en gnral totalement instancie et initialise de manire alatoire. Elles mu-
74 CHAPITRE 6. PROGRAMMATION PAR CONTRAINTES

nissent lespace de recherche dune fonction de cot globale, drive (par exemple par somma-
tion) des fonctions associes chaque contrainte, et que lon cherche minimiser. La fonction
de cot peut donc tre vue comme un critre qui guide la configuration courante vers des
solutions consistantes avec lensemble des contraintes.
Le dplacement dans lespace de recherche se fait par exploration du voisinage de la
configuration courante. A chaque itration, on remplace la configuration courante par celle de
son voisinage qui minimise la fonction de cot. En pratique, le voisinage est souvent dfini
comme lensemble des configurations dont seule une variable diffre de la configuration cou-
rante. Toutefois, lexploration du voisinage peut rapidement devenir un processus fastidieux
dans le cas de problmes de grande taille, et on a alors gnralement recours une heuristique
de voisinage pour se limiter un nombre restreint de configurations.
Ce principe de rsolution suppose une gestion efficace des minima locaux qui peuvent trs
facilement engendrer des cycles dans le parcours de lespace de recherche : si y est la
meilleure solution dans le voisinage de x, et x la meilleure solution dans le voisinage de y,
alors la recherche va boucler sur le cycle x y x y . . . La mthode la plus utilise
en PPC pour viter ce phnomne est la recherche tabou.
La recherche tabou, propose par Glover [GL97], consiste stocker dans une mmoire
court terme appele liste tabou lensemble des configurations visites. Le choix de la
prochaine affectation se fait alors parmi les configurations nappartenant pas la liste tabou.
Le cot en mmoire pouvant devenir prohibitif, on emploie en gnral une liste de taille limite
N . La recherche ne pourra alors chapper un minimum local que si le nombre dtapes
pour obtenir une nouvelle amlioration est infrieur N . Nous prsentons en infra deux
mtaheuristiques pour les problmes de satisfaction de contraintes utilisant la recherche tabou,
la recherche adaptative et lheuristique CN -tabu.

6.4.2 Mthodes population


Les mthodes population diffrent de la recherche locale par le maintien et lactualisation
dun ensemble de configurations plutt quune seule. Lvolution de la population nest pas
gouverne par lexploration de voisinages mais par des heuristiques de mouvement. En outre,
ces mthodes ne proposent pas de stratgies explicites pour sortir des minima locaux, mais y
parviennent implicitement par le recours une population.
Les algorithmes gntiques (AGs voir sections 5.5 et 5.6) constituent une large famille
de mthodes pour les problmes de satisfaction de contraintes, condition le plus souvent
dadapter les oprateurs gntiques au problme rsoudre, sous peine dinefficacit (voir Hao
& al. [HGH98]). Eiben & van der Hauw [EvdH96] ont toutefois propos un principe gnrique
pour traiter les CSPs laide dAGs. La mthode SAW (Stepwise Adaptation of Weights)
permet dexprimer la fonction de cot comme une somme pondre des pnalits associes
chaque contrainte. A chaque itration de lalgorithme, les poids relatifs sont rvalus en
fonction des taux de satisfaction dans la population courante : aux contraintes les moins
satisfaites sont attribus des poids plus levs. SAW agit donc comme une fonction de cot
adaptative qui permet de traiter en priorit les contraintes les plus difficiles. Cette mthode
t exprimente avec succs sur de nombreux CSPs de rfrence.
Une autre mtaheuristique couramment utilise pour les CSPs est loptimisation par co-
lonies de fourmis (Ant Colony Optimization ACO), inspire du comportement rel des
fourmis pour rechercher un chemin optimal entre la fourmillire et une source de nourriture.
Les mthodes ACO sappuient un principe de collaboration stigmergique au sein de la
6.5. RECHERCHE ADAPTATIVE 75

population : la communication entre les agents se fait par lintermdiaire de lenvironnement.


On sait en effet dune part que les fourmis dposent sur leur passage des phromones qui
svaporent dans le temps, dautre part que leurs choix de trajectoires sont dtermins par la
quantit de phromones quelles rencontrent. Au cours du temps, les trajets peu intressants
sont donc dlaisss, tandis qu merge un unique trajet optimal. En termes doptimation
combinatoire, les mthodes ACO ont donc dans un premier temps t utilises pour des pro-
blmes de plus court chemin, avant dtre tendues dautres classes de problmes. Quant
la programmation par contraintes, Christine Solnon [Sol02] a rcemment propos le moteur
gnrique Ant-Solver qui permet de traiter les CSPs laide de mthodes ACO. Lide sous-
jacente est de ramener la recherche de configurations consistantes la dcouverte dun plus
court chemin dans un graphe dont les sommets sont des couples variable/valeur. Lors dune
itration de lalgorithme, chaque fourmi visite une instantiation complte du problme et
dpose sur les arrtes reliant les nuds de la configuration visite une quantit de phromones
proportionnelle au taux de satisfaction global des contraintes. Lorsque lexcution se termine,
le chemin marqu par le plus grand taux de phromones permet de relier les valeurs de la
meilleure configuration.

Il convient en dernier lieu de mentionner lusage frquent dans les recherches rcentes de
techniques hybrides qui combinent plusieurs mtaheuristiques ou tirent parti de la com-
plmentarit entre mthodes compltes et incompltes. Lheuristique CN -tabou de Vasquez &
Dupont [VHD03] en est un exemple. Elle sera prsente au paragraphe 6.6.

6.5 Recherche adaptative


La recherche adaptative est une heuristique de recherche locale propose par Philippe
Codognet [CD01] [CDT02]. Elle part du principe que dans une configuration inconsistante,
toutes les variables nont pas la mme responsabilit dans la violation des contraintes, et
que certaines dentre elles sont modifier en priorit afin de rtablir au plus vite la consistance.
Dans la plupart des CSPs, les contraintes possdent la proprit essentielle de ne porter
que sur des variables fixes : si une contrainte est viole, on est en gnral trs souvent
en mesure didentifier les variables responsables de linconsistance. Soit par exemple un
problme quatre variables A, B, C, D, chacune valeurs dans {0, 1, 2}, assorti des contraintes
C1 : A 6= B et C2 : B < C. Si C1 est viole, il faut videmment modifier les variables A ou
B ; de mme, si C2 est viole, agir sur A ou D sera inutile. Allons plus loin : la configuration
(2, 2, 1, 0) viole les deux contraintes ; il faut donc au minimum modifier A, B ou C. Or B
intervient dans C1 et C2 ; cest donc peut-tre la variable changer en priorit. En effet,
choisir B = 0 permet de vrifier toutes les contraintes en un seul changement de valeur, alors
quagir sur une autre variable implique toujours au minimum deux mouvements.
La recherche adaptative tire parti dun constat simple : dans une configuration incon-
sistante, on peut dans la plupart des cas identifier la variable dont la modification permet
daccrotre le plus rapidement le niveau de consistance. En pratique, on commence par trans-
former les fonctions de cot associes aux contraintes pour obtenir une fonction de cot pour
chaque variable. A chaque itration de lalgorithme, si la configuration courante viole au moins
une contrainte, cest la variable la plus couteuse qui est modife. Charlotte Truchet [Tru04]
prconise une mthode de projection des contraintes sur les variables permettant dviter
76 CHAPITRE 6. PROGRAMMATION PAR CONTRAINTES

lapparition de minima locaux artificiels4 : le cot associ une variable est simplement le
nombre de contraintes violes dans lequel elle intervient. Ce type de fonction est appel min-
conflict. Dans lexemple prcdent, les cots associs au variables A, B, C, D seraient alors
respectivement 1, 2, 1, 0 ; cest donc bien sur B quil faut agir en premier.
Si nous rajoutons maintenant la contrainte C3 : A + B + C + D 3 au problme prcdent,
alors les deux configurations x = (1, 0, 1, 2) et y = (2, 1, 2, 0) vrifient toutes deux C1 et C2 ,
mais pas C3 . Quelles sont les variables responsables ? A priori les quatre, car la contrainte C3
les implique toutes. Comment alors choisir la variable modifier ? Il est clair quune fonction
min-conflict est ici inefficace. Etant donn le type de contrainte, il ne serait pas idiot dagir sur
les plus grandes valeurs, soit C pour x et A ou B pour y. Il apparat que dans ce cas, le choix de
la variable changer dpend de la configuration, donc ncessite un calcul qui peut vite devenir
trs coteux sur des problmes de grande taille avec beaucoup de contraintes. En rsum, la
recherche adaptative nest envisageable que pour les contraintes darit faible (impliquant
un petit nombre de variables) par rapport la taille du problme. Ce nest toutefois gure
prjudiciable, car dans la plupart des CSPs, les contraintes sont unaires ou binaires, et quand
ce nest pas le cas, on peut souvent les dcomposer en un ensemble de contraintes binaires.

Lalgorithme de recherche adaptative [CD01] [CDT02] utilise une mmoire court terme
de type tabou (voir paragraphe 6.4.1. A chaque itration, le voisinage explorer est obtenu
en remplaant, dans la configuration courante, la variable Vmax non marque tabou et de
cot maximal, par toutes les valeurs de son domaine. La meilleure configuration remplace alors
la configuration courante si elle en amliore le cot global. Sinon, Vmax est marque tabou
pour un nombre fix ditrations.
Outre ses performances obtenues sur un grand nombre de problmes musicaux, la recherche
adaptative a prouv son efficacit sur des CSPs classiques (problme des n-reines, carrs ma-
giques. . .) en affichant des temps de calcul significativement infrieurs ceux obtenus par
des solveurs implmentant dautres mtaheuristiques. En outre, elle a permis de rsoudre des
instances jusqu 50 fois plus grandes que les limites actuelles des mthodes compltes.

6.6 Lheuristique CN -tabou


Lheuristique CN -tabou [VHD03] (Consistent Neighborhood Tabu Search) est une mthode
hybride combinant recherche tabou et arc-consistance. Lide matresse est de maintenir syst-
matiquement la consistance au cours de la recherche, quitte travailler sur des instantiations
partielles (i.e. dont certaines variables ne sont pas instancies). L o les mtaheuristques
traditionnelles cherchent satisfaire les contraintes en manipulant des configurations totale-
ment instancies, la mthode CN -tabou opre sur des configurations partielles et localement
consistantes (aucune contrainte nest viole), et cherche instancier toutes les variables. Les
contraintes sont exclusivement binaires.
En pratique, la recherche est conduite par une succession dinstanciations et de dsins-
tanciations. A chaque itration, un voisinage est construit en affectant une variable non
instancie et non marque tabou toutes les valeurs de son domaine. Dans chacune des
4
La plupart du temps, une mesure dinconsistance pour une configuration est obtenue par sommation des
fonctions de cot associes chaque contrainte. Si les fonctions sont htrognes, des minima locaux indsi-
rables risquent dapparatre, pouvant perturber la rsolution. On sen prmunit habituellement en choisissant
pour mesure dinconsistance le nombre de contraintes violes, ou le nombre de variables intervenant dans les
contraintes non satisfaites.
6.7. CONTRAINTES ET ALGORITHMES GNTIQUES 77

configurations ainsi produites, les ventuelles violations sont alors rsolues en dsinstan-
ciant toutes les variables en conflit avec la nouvelle affectation. Les contraintes tant binaires,
un simple filtrage par arc-consistance suffit pour propager linformation apporte par nou-
velle affectation. Dans le voisinage localement consistant ainsi obtenu, la configuration
comptant le plus grand nombre de variables instancies devient alors la configuration cou-
rante, et la variable modifie est marque tabou . Le statut tabou est rvoqu aprs
un nombre ditrations gal au nombre de fois o la variable a t modifie depuis le dbut
de lexcution. La liste tabou est ici gre dynamiquement : plus une variable a t modifie
dans le pass, et plus il sera difficile de la changer dans le futur.
Lheuristique CN -tabou a t employe avec succs pour rsoudre des problmes rels
dassignation de frquence et de positionnement dantennes, trs grand nombre de variables
et de contraintes.

6.7 Contraintes et algorithmes gntiques


Si les algorithmes gntiques ont prouv leur efficacit face de nombreux problmes
doptimisation (y compris multicritre) ou de satisfaction de contraintes, en revanche leur
intrt dans le cas de problmes mixtes doptimisation sous contraintes est moins tabli. La
raison principale est que les oprateurs gntiques sont aveugles aux contraintes : les
rejetons obtenus par crossover (voir section 5.5.2) partir de parents vrifiant les contraintes
du problme noffrent a priori aucune garantie de consistance. La mme remarque sapplique
aux mutations.
Comme nous le verrons aux chapitres 7 et 10, loptimisation combinatoire multicritre
sous contraintes est un cadre commode pour la formalisation du problme de lorchestration
assiste par ordinateur. Cela nous impose donc, si nous faisons le choix dun AG pour lopti-
misation (voir chapitre 9), de dcider dune mthode explicite pour la gestion des contraintes
supplmentaires. Eiben [Eib01] recense pour cela deux types dapproches : la gestion directe
et la gestion indirecte.

6.7.1 Gestion directe


La gestion directe des contraintes au sein dun AG impose qu tout moment, la population
ne contient que des configurations consistantes avec lensemble des contraintes. Ce maintien
de la consistance peut seffectuer de plusieurs manires :

Elimination systmatique Lide la plus simple consiste retirer de la population tous


les individus qui violent au moins une contrainte. Dans la plupart des applications toutefois,
la probabilit dobtenir une configuration consistante par hasard ou par le biais doprateurs
gntiques est quasiment nulle. Ds lors, llimination systmatique interdit toute possibilit
dvolution, car cette dernire nengendre naturellement que des individus inconsistants.

Rparation Alternativement, les mthodes dites de rparation (repair procedures) per-


mettent de rtablir la consistance chaque fois quapparait dans la population une configuration
violant au moins une contrainte. Dans les problmes de sac dos (voir section 9.1), on utilise
en gnral une heuristique de type glouton (greedy repair procedure) : les items les plus
encombrants sont itrativement retirs de la configuration jusqu ce que les contraintes de
78 CHAPITRE 6. PROGRAMMATION PAR CONTRAINTES

capacit soient de nouveau satisfaites (voir Ishibuchi & Kaige [IK03]). Dans le cas gnral,
le choix dune mthode de rparation ncessite une trs bonne connaissance du problme, et
dbouche sur une procdure parfois coteuse en temps de calcul : la plus grande partie de
lexcution est consacre au maintien de la consistance plutt qu lvolution de la popula-
tion. Dans le cas du sac dos, les contraintes sont en faible nombre, les algorithmes gloutons
de rparation sont de complexit acceptable, en gnral en O(N log(N )). Mais la rparation
nest pas toujours prconiser pour des problmes fortement contraints et dont la structure
ne permet pas dimaginer de mthodes de faible complexit.

Oprateurs ad-hoc Une troisime solution, frquente dans la rsolution de CSPs au moyen
dAGs, consiste imaginer des oprateurs gntiques qui garantissent (ou dfaut maximisent)
la consistance des configurations quils engendrent (voir par exemple Dorne & Hao [DJ98]).
Cest dans cette direction que sest oriente notre premire version dun algorithme gntique
pour laide lorchestration [CTA+ 07], dans lequel loprateur de mutation agissait tantt
comme dplacement horizontal (la hauteur de note est conserve), tantt comme dplacement
vertical (linstrument est conserv). Bien que donnant de bons rsultats sur des problmes fai-
blement contraints, ces oprateurs se sont vite rvls inefficaces face un rseau de contraintes
plus dense.

Dcodage Enfin, le dcodage permet de rsoudre le problme dans un espace de re-


cherche E 0 diffrent de E et libre de toute contrainte. On a alors recours une procdure de
dcodage (decoding procedure) pour transformer les configurations de E 0 en configurations
consistantes de E. Ce principe a notamment t expriment par Michalewicz [Mic96].

Eiben [Eib01] fait observer que si la gestion directe des contraintes peut savrer extr-
mement efficace si elle est bien implmente, elle est en revanche fortement dpendante du
problme. Elle est donc recommander pour des applications trs cibles, dans lesquelles la
structure des problmes rencontrs ne change pas ou peu.

6.7.2 Gestion indirecte


A loppos, la gestion indirecte permet souvent daborder une plus grande varit de pro-
blmes. Une de ses diffrences majeures avec la gestion directe est dautoriser la prsence
de configurations inconsistantes dans la population. Ces dernires tant en effet souvent par-
tiellement consistantes (seules certaines contraintes sont satisfaites), elles reclent une part
dinformation importante pour le guidage de la population la fois vers les zones dopti-
malit et de consistance.

Transformation en objectifs La mthode la plus simple consiste transformer chaque


contrainte en un critre supplmentaire optimiser, travers par exemple une fonction de cot.
Seul problme, un grand nombre de contraintes implique une augmentation importante du
nombre de critres, donc une complexit plus grande et une plus grande probabilit defficience
pour une configuration alatoire5 : le risque est alors dobtenir un ensemble de solutions de trs
grande taille, au sein duquel il sera difficile de reprer les configurations vraiment pertinentes.
5
Dans le cas gnral, il est vident que plus on augmente le nombre de critres, plus une configuration
alatoire de chance dtre efficiente : il y aura toujours un critre sur lequel elle sera meilleure que les autres.
Dans notre cas, une configuration est efficiente sitt quelle satisfait au moins une contrainte.
6.7. CONTRAINTES ET ALGORITHMES GNTIQUES 79

On peut toutefois limiter laugmentation du nombre de critres en agrgeant lensemble des


fonctions de cot associes aux contraintes en une valeur unique, mais la perte dinformation
qui en rsulte peut rendre le problme difficile rsoudre.

Pnalisation de la fitness La pnalisation de fitness est lapproche la plus courante. Une


mesure de consistance6 est ajoute lvaluation de fitness pour pnaliser les configurations
non consistantes. La population est alors value laide dune fitness augmente :

g(x) = f (x) + z(x)

o f est la fitness doptimisation et z(x) = 0 si est seulement si x satisfait lensemble des


contraintes. Seul problme, le paramtre est extrmement dlicat fixer, et cependant
dterminant dans lefficacit de lalgorithme : si la valeur de est petite, lvolution nest pas
encourage vers les configurations consistantes ; si est trop grand, lalgorithme ne voit
plus que les contraintes et se dtourne de loptimisation. En outre, Deb [Deb00] fait observer
que la pnalisation introduit une distorsion dans le paysage de fitness, susceptible dengendrer
de nouveaux optima locaux.

Incorporation dans la relation de dominance Deb [Deb00] a propos une mthode


gnrique pour la gestion des contraintes dans les AGs, incorporant la notion dinconsistance
au sein mme de la relation de dominance. Lauteur recommande lutilisation dun tournoi
binaire dans le mcanisme de slection (voir sections 5.5 et 5.6), au cours duquel deux individus
sont compars de la manire suivante :
Une configuration consistante est toujours prfre une configuration violant au moins
une contrainte.
Entre deux configurations consistantes, celle de meilleure fitness est prfre.
Entre deux configurations inconsistantes, celle qui viole le moins les contraintes est
prfre.
Dans chacun de ces trois scnarii, les solutions ne sont jamais compares simultanment sur
leur fitness ou sur leur consistance. A linverse de la mthode prcdente, il ny a donc pas
de paramtre supplmentaire fixer. En outre, aucune hypothse nest formule quant la
nature du problme. Nous pouvons ds lors tendre la dfinition de la dominance de Pareto
tout problme doptimisation sous contraintes :

Dfinition 6.1. Etant donn un problme de minimisation multicritre sous contraintes,


soient x et y deux points de lespace de recherche E et z : E R une mesure dinconsis-
tance des configurations (z(x) = 0 si est seulement si x satisfait lensemble des contraintes).
On dira alors que x domine y au sens de Deb si et seulement si :

z(x) < z(y) (z(x) = z(y) x y)

6
Le plus souvent, elle est dfinie comme le nombre de contraintes violes, ou le nombre de variables impli-
ques dans lensemble des violations.
80 CHAPITRE 6. PROGRAMMATION PAR CONTRAINTES

Conclusion
La programmation par contraintes permet de dfinir un problme par un ensemble de
conditions que doivent satisfaire ses variables. Selon la complexit des situations, les mtaheu-
ristiques peuvent savrer nettement plus efficaces que les mthodes compltes. La recherche
locale notamment la recherche adaptative a prouv son efficacit dans bien des cas et
permet souvent de rsoudre en un temps acceptable des instances de trs grande taille. En
revanche, la gestion des contraintes dans un problme doptimisation pose problme bien des
gards, en raison notamment de lhtrognit des formalisations. En outre, la rsolution de
problmes doptimisation par algorithmes gntiques se prte mal aux problmes contraints,
car les oprateurs gntiques engendrent trs facilement des configurations inconsistantes. Une
solution lgante consiste alors introduire la consistance dans la relation de dominance entre
les configurations.
Rsum de la premire partie

Aujourdhui, la richesse et lextension permanente du vocabulaire instrumental ne per-


mettent plus aux compositeurs contemporains de matriser lensemble des possibilits tim-
brales offertes par lorchestre. Lart de lorchestration, dont lempirisme gouverne la pratique
comme la transmission, souffre cruellement de labsence dun trait contemporain qui tienne
compte de lhritage du XXe sicle. Nous pensons que lordinateur, par sa puissance de calcul
et sa capacit explorer rapidement un grand nombre de combinaisons instrumentales, peut
apporter un clairage nouveau sur cette pratique, et assister les compositeurs dans lexplora-
tion et le contrle du timbre orchestral.
La conception dun systme daide lorchestration se situe la convergence de plusieurs
domaines de recherche et impose que soient matrises un ventail de techniques adaptes
la complexit de cette discipline.
Du ct du timbre, les rsultats de la psychoacoustique en perception auditive et leur
mise en relation avec les techniques de description du signal audio permettent de modliser le
potentiel sonore des instruments partir dchantillons enregistrs.
Du ct de loptimisation, les mthodes multicritres offrent la possibilit de rechercher
des solutions selon plusieurs objectifs, sans faire dhypothses de priorit ou de hirarchie sur
les critres. Cest donc un cadre formel opportun pour aborder le problme du timbre, dont
la multidimensionnalit est une des causes de la complexit.
Le caractre N P des problmes doptimisation combinatoire interdisant le recours des
mthodes compltes, la recherche oprationnelle sest depuis une vingtaine dannes tourne
vers les mtaheuristiques. Ces dernires fournissent un ensemble de techniques gnriques
pour aborder des problmes complexes, et permettent de trouver en un temps raisonnable des
solutions approches.
Enfin, la programmation par contraintes est un paradigme idal pour les problmes dont
les solutions sont dfinies par un ensemble de relations logiques entre leurs variables, comme
il en va de nombreuses situations musicales. L encore, les mtaheuristiques sont dun grand
secours dans le cas de problmes difficiles.

81
82
Deuxime partie

Algorithme de recherche
dorchestrations

83
Chapitre 7

Formulation du problme

Timbre cibl et connaissance instrumentale


Concepts fondateurs pour un outil daide lorchestration
Formalisation comme recherche multicritre sous contraintes
Entre criture et optimisation : les descripteurs du signal

Nous abordons dans cette thse le problme de lorchestration assite par ordinateur dun
point de vue algorithmique. Nous nous ramenons un problme combinatoire dans lequel il
sagit de trouver une combinaison de sons instrumentaux qui, jous simultanment, produisent
le timbre dsir par le compositeur. Des questions prliminaires surgissent aussitt : Comment
caractriser ce timbre cibl ? Comment reprsenter la connaissance instrumentale dans un
outil informatique ? Comment valuer la qualit dun mlange (i.e. sa distance la cible) ?
Sur quels critres se baser ? Ce chapitre aborde ces questions. Nous y exposons nos propres
conceptions et les choix mthodologiques qui en dcoulent.

7.1 Donnes du systme


Un outil dorchestration doit permettre dassister le compositeur dans le contrle du timbre
orchestral. A partir de la formalisation dune ide de timbre le systme doit pouvoir propo-
ser un mlange instrumental qui corresponde lintention (ou lintuition) du compositeur.
Cela suppose deux conditions pralables :
1. Un vocabulaire prcis doit tre dfini pour permettre au compositeur de formaliser de
manire objective son intention musicale.
2. Le systme doit connatre les possibilits sonores des intruments.

7.1.1 Le concept de cible


Dun point de vue scientifique, lintention du compositeur doit tre pense comme une
cible , un objectif atteindre par une mthode approprie. Si lobjectif ne peut tre atteint,
il faut alors trouver la solution la plus proche. La notion de distance est donc primordiale,
et notre travail doit consister dans un premier temps dfinir cette distance, dans un second
temps imaginer une mthode approprie pour la minimiser. On pourrait bien sr dcider de
se passer de la cible, et prendre le parti dexplorer lespace des timbres de manire itrative.
Lorchestre serait alors un simple rservoir de sons dans lequel on puiserait pour construire

85
86 CHAPITRE 7. FORMULATION DU PROBLME

un timbre, travers un processus interactif dessais/erreurs. Bien sr, cette dmarche est tout
fait lgitime dun point de vue esthtique, mais elle na rien de scientifique.
Il nous faut donc dfinir une cible. Dans notre cas, elle serait un ensemble de caractris-
tiques dcrivant les particularits du timbre souhait. Or, caractriser le timbre ncessite une
collection de termes tablis et univoques chacun dentre eux se rfrant une caractris-
tique prcise du son partage par les compositeurs, les chercheurs et les instrumentistes.
Hlas, la construction dun tel vocabulaire est illusoire, car la manire dont la perception
auditive est verbalise implique toujours une grande part de subjectivit. Certains champs
lexicaux conviennent certes davantage que dautres. Erickson [Eri75] fait ainsi observer que
des termes du vocabulaire visuel ou tactile sont souvent appropris pour dcrire les sons ou
les combinaisons de sons : tranchant, rugueux, sourd, doux, mordant, clair, clatant, cassant,
pais, fin, sec, vaporeux, ar, minutieux, flasque, fluide, translucide, flamboyant, granuleux,
cru, brumeux, lourd, glacial, brch, limpide, luxuriant, lger, ondul, pour en citer quelques
uns. Mais quest-ce, en dfinitive, quun son fluide ? Quest-ce quun son glacial ? Interro-
geons des compositeurs, ils donneront (sils le peuvent) des exemples diffrents, en rapport
avec leur exprience musicale personnelle. Alors que tout le monde sentend sur ce quest un
accord majeur, ou un accelerando.
A la rigueur, ces termes peuvent tre utiliss dans la comparaison des timbres ; on dira par
exemple que tel son est plus clair que tel autre. On pourra alors tenter de relier le concept
de clart un paramtre acoustique mesur ou calcul sur le signal. Cette dmarche est celle
des psychoacousticiens qui cherchent comprendre les mcanismes de diffrentiation et de
catgorisation dans la perception auditive (cf. 2.5). Elle nest daucun secours lorsquil sagit
de dfinir positivement les qualits perceptives dun son.
On comprend alors pourquoi nos prdcesseurs ont toujours contourn le problme de
la caractrisation du timbre souhait par le compositeur en restreignant la cible un son
enregistr. Aprs tout, la meilleure faon de dcrire un son est encore de le donner entendre1 .

Nous ne prtendrons pas ici rsoudre le problme de la verbalisation du timbre, dautant


moins que les problmatiques psychoacoustiques ne sont que priphriques notre sujet de
recherche. Nous adoptons donc dans un premier temps lapproche de nos ans, et supposons
que le compositeur dispose du son enregistr quil dsire reproduire avec lorchestre. Aprs
tout, proposer un arrangement instrumental qui se rapproche le plus possible de la source
dorigine faisait partie de requtes des compositeurs exposes au paragraphe 4.2. En outre,
les questions sous-jacentes cette ide sont dj de taille : Comment analyser le son cible ?
Comment valuer la similarit entre la cible et une proposition dorchestration ? Comment
trouver lorchestration optimale ?
Toutefois, la question dun timbre que le compositeur aurait seulement en tte ne
saurait tre prmaturment carte. Il nous faut ici introduire un distingo entre ce que nous
nommerons dsormais lorchestration imitative, savoir la reproduction lorchestre dun
timbre dfini par un son enregistr et lorchestration gnrative, savoir. . . tout le reste. Plus
prcisment, il sagirait de trouver un moyen de contrler en entre notre outil dorchestra-
tion avec une autre matire quun fichier son. Lide est donc la suivante : puisquil semble
illusoire, pour linstant, de se passer de ce son, ne peut-on trouver un moyen de le gnrer
partir de donnes symboliques, via un processus de synthse par exemple ? La figure 7.1
illustre ce principe. Lide matresse est que le compositeur en passe toujours par le sonore
1
Ce nest pas ncessairement le cas de tous les lments du langage musical. Il est sans doute plus facile de
dcrire un canon en expliquant le principe des entres successives des voix que den faire couter un exemple.
7.1. DONNES DU SYSTME 87

Orchestration imitative

Fichier son

Orchestration gnrative
Outil
d'orchestration
Interface de
synthse

Son de synthse
Compositeur

Donnes symboliques
Signal audio

Fig. 7.1 Donnes dentre en fonction du type dorchestration (imitative ou gnrative)

pour communiquer avec lordinateur. Lorsque le timbre vis nest pas un son enregistr, le
compositeur dispose dune interface de synthse sonore pour le construire itrativement,
travers un processus dessais/erreurs. Bien sr, il y a fort parier que le son ainsi cr soit
trs pauvre dun point de vue perceptif, mais son rle est uniquement de capturer len-
semble des caractristiques sonores souhaites par le compositeur. Il nest quun modle, un
portrait-robot dont lorchestration finale propose par le systme possdera les traits tout
en y ajoutant la richesse du timbre instrumental. Comme lillustre la figure 7.1, des donnes
symboliques peuvent aussi tre passes au systme dans le cas dune orchestration gnrative.
Nous donnerons davantage de dtails ce sujet au chapitre 12.
Cette piste t explore de manire prospective en parallle de nos travaux,
en collaboration avec Jean Bresson (Chercheur lIRCAM, charg du dveloppement
dOpenMusic [Ago98]). Nous verrons au chapitre 14 un exemple dorchestration utilisant
un son de synthse comme intermdiaire entre un accord crit et un timbre. Nous exposerons
galement au chapitre 12 un ensemble dinterfaces et de mthodes permettant de contrler le
timbre de ce son de synthse partir de donnes symboliques.

7.1.2 Connaissance instrumentale


De mme quil semble difficile de se passer du son dans la caractrisation dun timbre
orchestrer, de mme la modlisation des possibilits instrumentales en termes de timbre nest
envisageable que par lanalyse denregistrements de sons instrumentaux. Ces dernires annes,
le dveloppement massif doutils de production musicale et lengouement des utilisateurs pour
les systmes bass sur des techniques dchantillonnage (les samplers ) ont grandement
favoris la mise disposition de banques de sons instrumentaux. Outre les produits com-
merciaux (Vienna Symphonic Library, Native Instruments, Plugsound, Virtual Orchestra. . .)
88 CHAPITRE 7. FORMULATION DU PROBLME

on trouve aujourdhui de nombreuses banques dchantillons cres des fins de recherche,


telles que RWC Music Database [GHNO03] [Got04], University of Iowa Musical Instrument
Samples, McGill University Master Samples (Opolko & Wapnick, 1987) ou encore SOL (Studio
Online [BBHL99], enregistre lIRCAM.
Si ces bases de donnes sont loin dtre exhaustives, elle sont souvent complmentaires. Par
exemple VSL (Vienna Symphonic Library [VSL]) contient tout les instruments de lorchestre
symphonique classique, en solo ou par ensembles2 , mais uniquement pour des modes de jeu
classiques. A loppos, SOL inclut des instruments utiliss en musique contemporaine (comme
laccordon, la guitare ou les saxophones), comprend les modes de jeu contemporains mais ne
contient que des instruments solo.
On serait donc facilement tent dagrger plusieurs bases de donnes pour obtenir une
palette sonore la plus large possible. Or, les conditions denregistrement et de post-production
diffrant selon les banques dchantillons, cette base hybride serait inexploitable pour des
raisons dhtrognit.

Le problme des dynamiques


Le plus gros problme inhrent aux bases de sons instrumentaux et principal responsable
de leur incompatibilit est sans doute celui des dynamiques. La dynamique est une donne
symbolique inscrite sur la partition qui contrle lintensit du son. Dans les banques de sons,
linformation de dynamique est en gnral incluse dans le nom du fichier. Un mezzo-forte de
violon et un mezzo-forte de clarinette provenant de deux bases de donnes diffrentes doivent
donc tre perus avec environ la mme intensit. En pratique, cest loin dtre le cas. Pour
preuve, les chantillons de VSL sont normaliss, laissant lchantillonneur le soin dajuster
lintensit en fonction du contexte. Ceux de SOL ne le sont pas. Lutilisation croise des deux
bases est donc impossible.
A des fins de robustesse, il arrive parfois quon mlange des bases de donnes pour, par
exemple, valuer des algorithmes de reconnaissance dinstruments. Les incohrences de dy-
namique ne posent alors aucun problme, car les sons nont pas tre compars entre eux,
mais un ensemble de modles qui permettent une certaine souplesse dans le traitement de
la dynamique. Les psychoacousticiens mlangent aussi des bases de sons pour mettre en place
des tests peceptifs. En gnral, ces tests ncessitent un petit nombre de sons et on prend soin
au pralable de les galiser en sonie3 , ce quon ne pourrait faire dans notre cas quau sein dun
mme groupe de dynamiques, et au prix dun travail colossal.
Nous allons donc devoir nous restreindre lutilisation dune unique banque de sons. Notre
choix se portera sur SOL [BBHL99], pour les raisons suivantes :
1. La base SOL a t enregistre lIRCAM et nous en disposons gratuitement.
2. Elle embrasse un vocabulaire sonore riche et reprsentatif des pratiques instrumentales
actuelles ; de nombreux modes de jeu contemporains y sont disponibles.
3. Tous les chantillons de SOL on t enregistrs dans des conditions identiques, avec une
prise de son indpendante de linstrument. Ils sont calibrs de manire restituer la
perception dun auditeur une position fixe par rapport aux instrumentistes. On peut
donc considrer que la base est cohrente par rapport aux dynamiques.
2
Les sons densemble sont des unissons dinstruments du mme type : violons par 12, violoncelles par 8,
cors par 4. . .
3
Deux sons de mme sonie sont perus avec la mme intensit. Lgalisation ne peut se faire que par lcoute,
car la sonie dpend non seulement de la puissance acoustique, mais galement du timbre.
7.2. PARADIGMES 89

N.B. Si la cohrence des dynamiques est essentielle pour la capacit du systme valuer
la pertinence dun mlange, elle nempche pas pour autant certaines surprises dans les rsul-
tats obtenus. Les musiciens interprtent la dynamique en fonction de plusieurs paramtres :
hauteur, contexte musical, situation dans lorchestre, dynamique de lorchestre. . . Une mme
dynamique est joue differemment en solo, en ensemble ou en grand orchestre. Un forte est
jou diffremment sil est prcd dun pianissimo ou dun triple forte. Bref, les musiciens
passent leur temps quilibrer les dynamiques lorsquils jouent en ensemble, afin de rendre au
mieux les effets dorchestre voulus par le compositeur. On ne sera donc pas surpris, parfois,
dentendre des simulations dorchestration dont les dynamiques paraissent dsquilibres, ou
qui traduisent de faon peu raliste la partition. Ce sera au compositeur, par son exprience,
dajuster les dynamiques pour que la simulation dun timbre soit fidle la partition que
loutil dorchestration propose.

Approche par modles dinstruments

Mme avec une base cohrente en dynamiques telle que SOL, les problmes de gnricit et
de robustesse de la connaissance instrumentale voqus en 4.3 restent en suspens. Notre sys-
tme dorchestration ne connat des potentialits du basson que ce que le bassonniste enregistr
en a donn entendre dans un studio de lIRCAM. Les orchestrations proposes seront-elles
valables pour un autre bassoniste dans une salle de concert ?
Nous navons malheureusement pas dautre choix, dans un premier temps, que de sen
remettre cette hypothse. Cela dit, les travaux de Damien Tardieu doctorant-chercheur
dans lquipe Analyse-Synthse de lIRCAM, avec qui nous collaborons sur le sujet de lorches-
tration permettent de dpasser cette limitation en remplaant la base de donnes de sons
instrumentaux par un ensemble de modles dinstruments. Il sagit de modles probabilistes
agrgeant la connaissance issues de plusieurs bases de donnes sonores laide de mlanges
de gaussiennes (GMM4 ). En utilisant plusieurs chantillons dun mme son, par exemple un
La5 mezzo-forte de hautbois, on construit un modle gnrique du La5 mezzo-forte pour le
hautbois, plus robuste aux changements de conditions de jeu quun unique chantillon. Evi-
demment, un travail pralable sur la gestion des problmes de dynamique a t ncessaire.
Damien Tardieu a en outre mis en place une hirarchie de modles permettant de gnraliser
aisment la connaissance instrumentale et de construire des modles pour des sons absents
des bases de donnes. Par exemple, le modle de lalto vibr se dcompose facilement en deux
sous-modles : lalto non vibr et le vibrato de cordes. Si les bases de donnes utilises pour
lapprentissage ne contiennent aucun son dalto vibr, on peut quand mme en construire un
modle base de lalto non vibr et du vibrato de cordes appris sur le violon. Le lecteur
dsirant davantage de prcisions sur les modles dinstruments pourra consulter [TR07].

7.2 Paradigmes
La conduite de nos travaux et le dveloppement de notre outil daide lorchestration ont
t conditionns par un ensemble de paradigmes que semblaient imposer non seulement ltat
de maturit actuelle des savoirs connexes notre problme (voir 4.1), mais galement un en-
semble de scnarii dutilisation de notre outil, imagins lors du dialogue avec les compositeurs.
4
Gaussian Mixture Models.
90 CHAPITRE 7. FORMULATION DU PROBLME

7.2.1 Privilgier le son


Etant donn la difficult de dfinir un vocabulaire pour qualifier le timbre (voir sec-
tion 7.1.1), nous pensons quil faut privilgier le son comme moyen de communication entre
le compositeur loutil dorchestration, et ce toutes les tapes du processus. Cest par linter-
mdiaire du sonore que le compositeur doit tre capable aussi bien de dfinir le timbre quil
dsire que dorienter la recherche dans une direction particulire.

7.2.2 Approche descriptive


Nous avons vu au chapitre 2 que les recherches rcentes en perception auditive, en psycho-
acoustique et en description du signal audio ont permis dtablir une correspondance entre la
caractrisation du timbre et lextraction automatique de descripteurs du signal. Cette approche
qui consiste dcomposer le son en plusieurs dimensions significatives est dun grand intrt
pour lorchestration assiste par ordinateur. La question est ici de savoir si nous pouvons
dfinir un espace muni dune distance pertinente entre une cible sonore et des propositions
dorchestration.
Si descripteurs et attributs perceptifs peuvent tre relis, cest quil existe une correspon-
dance entre espaces de timbres et espaces de descripteurs. De mme quil est donc possible de
partir de jugements de dissimilarit pour rechercher les dimensions principales de la perception
du timbre, ne peut-on pas, en plaant des sons dans un espace de descripteurs, en dduire la
distance perceptive qui les spare ? Nous faisons cette hypothse. Elle nous permet entre autre
de dfinir un peu plus prcisment la notion de cible sonore introduite au paragraphe 7.1.1 :
si la cible reste pour lutilisateur un son enregistr (orchestration imitative) ou gnr par un
processus de synthse (orchestration gnrative), pour le systme elle nest en revanche rien de
plus quun ensemble de descripteurs calculs sur ce son. La cible est un point dans lespace des
descripteurs, et les propositions dorchestration en sont dautant plus proches perceptivement
que les distances entre leurs valeurs respectives de descripteurs sont moindres.
Gardons toutefois lesprit que les espaces de timbres sont construits sur des jugements
perceptifs de dissimilarit de sons instrumentaux. Les dimensions qui y sont identifies sont
donc celles qui interviennent dans des mcanismes de diffrenciation ou de catgorisation,
nous permettant didentifier un piano, ou de distinguer une trompette dun hautbois. En
outre, tous les sons utiliss dans lexprience de McAdams et al. [MWD+ 95] taient galiss
en sonie, hauteur et dure perceptive, afin dviter toute interfrence de ces paramtres dans
les jugements de similirat. Bien que le corpus utilis contienne des timbres hybrides, il nest
donc pas certain que les dimensions identifies par cette tude soient toujours valables pour
lorchestration, les compositeurs manipulant des mlanges instrumentaux complexes, composs
de hauteurs et dintensits diffrentes. . .
La caractrisation du timbre dans le cadre de lorchestration assiste par ordinateur pr-
sente, par rapport des tches de sgrgation ou de classification instrumentale, au moins
trois difficults supplmentaires :
1. Les sons que nous dcrivons sont aussi bien des sons instrumentaux individuels que des
sons complexes, que ce soient les cibles sonores ou les mixtures instrumentales qui les
approchent. Les descripteurs du timbre sont-ils toujours valables pour ces sons ?
2. Comment, partir des positions individuelles de chaque composante dun mlange dans
un espace de timbres, dduire les coordonnes de la mixture dans le mme espace ?
7.2. PARADIGMES 91

3. Quelle distance utiliser, au sein de cet espace, pour la comparaison des timbres ? La
distance euclidienne est-elle la plus approprie ? Les dimensions de lespace de timbres
ont-elles toutes la mme importance dans le calcul de la distance ? Si non, comment
dterminer les poids relatifs chaque dimension ? Ces poids sont-ils invariants dune
comparaison lautre ?

En ce qui concerne le premier point, nous ferons lhypothse que nos descripteurs valent
aussi bien pour les sons instrumentaux individuels que les cibles ou les mixtures. Cette hy-
pothse sera confirme par notre exprience avec loutil dorchestration, lors du parcours, le
long dun descripteur, des solutions trouves (voir chapitre 13). Le choix des descripteurs va
dpendre conjointement des restrictions que nous nous imposons dans un premier temps de
notre recherche (voir section 8.1.1), des hypothses et paradigmes relatifs la conception de
notre outil, et en majeure partie des proprits additives de ces descripteurs. Concernant
ce dernier point, la question fondamentale est de savoir si, tant donne une combinaison de
sons de la base de donnes, on peut en estimer les descripteurs partir des descripteurs indi-
viduels de chaque son. Elle renvoie la deuxime des difficults voques ci-dessus. Quant
la troisime, se pose dabord le problme de dfinir une distance entre une mixture et la cible
pour chaque descripteur, ensuite seulement de savoir sil est possible de rapporter ce vecteur de
distance une valeur unique. Nous verrons en infra quune telle agrgation nest pas possible
a priori, sans connaissances supplmentaires sur les prfrences dcoute du compositeur.

Plutt que de travailler directement sur les chantillons reprsentant la connaissance ins-
trumentale, nous privilgions donc une vision descriptive du timbre instrumental. Outre les
gains considrables en temps de calcul qui en rsultent5 , cette approche nous permet la fois
de conserver un certain recul par rapport aux chantillons6 et de dfinir des distances
selon des directions indpendantes du timbre. Il devient alors possible de s approcher de la
cible en privilgiant une dimension ou une combinaison de dimensions : nous savons en effet
que toutes ne sont pas quivalentes dans la perception du timbre et que les critres perceptifs
utiliss dans les jugements de similarits perceptives dpendent la fois de lauditeur et des
sons compars (voir paragraphe 2.5). Nous exposerons au paragraphe 8.1.2 les dimensions du
timbre que nous choisirons de retenir pour notre propre problme.

7.2.3 Accessibilit de la description

Nous considrons que la description du son doit tre aussi simple que possible et accessible
au compositeur non-scientifique. En dautres termes, les dimensions du timbre doivent toujours
tre relies des paramtres perceptifs, afin de faciliter une manipulation intuitive de loutil
dorchestration.

5
Nous proposerons au chaptre 9 une mthode efficace pour la dcouverte en un temps raisonnable dorches-
trations pertinentes pour un problme donn. Au cours dune excution, cet algorithme value plusieurs milliers
de configurations intermdiaires. Or aujourdhui le temps dextraction des descripteurs est du mme ordre que
la dure du signal. Sans compter le temps ncessaire laddition des signaux pour gnrer les mixtures, une
simple excution de lalgorithme dorchestration ncessiterait donc plusieurs heures.
6
Une mme valeur de descripteur pouvant tre partage par plusieurs sons diffrents, le description se situe
toujours un niveau dabstraction plus lev que le signal. Il suffit pour sen convaincre de considrer le
descripteur de frquence fondamentale perue (pour les sons monophoniques).
92 CHAPITRE 7. FORMULATION DU PROBLME

7.2.4 Approche multicritre


Nous noublions pas que le timbre est un phnomne multidimensionnel, et que la percep-
tion organise ces dimensions en fonction du contexte sonore. Nous pensons quil est impossible
de dcider priori dune hirarchie de ces dimensions ou de leur importance relative. Cadoz et
McAdams rappellent quil faut comprendre comment loreille organise le sonore, dterminer
quels sont, parmi les diverses composantes du son, les lments porteurs de forme (voir 2.5).
Lidentification des dimensions privilgies de lcoute est certes une tape fondamentale, mais
les proportions relatives dans lesquelles ces dimensions participent aux jugements de similarit
ne sont pas dcidables a priori. Cest par exemple lharmonicit du son qui permettra de dif-
fencier un trmolo de caisse claire dun trmolo de violon, de mme que le temps dattaque sera
dterminant pour discriminer un son de piano et un son de hautbois de hauteurs identiques.
Dans ces cas triviaux, la dimension privilgie de lcoute est facile prvoir, mais lorsquun
compositeur cherche produire un timbre avec lorchestre, peut-il dire a priori quelle direction
(ou combinaison de directions) guide son coute ? Nous ne le pensons pas. Il nous faudra donc
opter pour une approche multicritre, dans laquelle les diffrentes dimensions du timbre sont
optimises conjointement, sans que lune dentre elles ne soit jamais privilgie.

7.2.5 Agnostisme
La connaissance de notre systme se limite la description de la base de sons instrumen-
taux. Nous choisissons de ne pas formaliser les ventuelles rgles dorchestration que lon
pourrait trouver dans les traits, et laissons le systme dcouvrir par lui-mme les bonnes
solutions. Notre outil dorchestration na de donc connaissances quen instrumentation. Cela
doit lui suffire puisquil peut, en thorie, imaginer nimporte quelle mixture instrumentale.

7.2.6 Interaction et prfrences de lutilisateur


Enfin, nous ne perdons pas de vue que notre systme est avant tout un outil de cration
musicale, et quil ne peut tre utilis comme tel qu travers un haut niveau dinteraction avec
le compositeur. Au cours de ce dialogue , le compositeur doit pouvoir mettre des choix qui
vont conditionner le comportement du systme, et le guider vers des solutions intressantes.
Considrons la figure 7.2 comme le front de Pareto dun problme dorchestration dans le-
quel ninterviennent que deux critres perceptifs. Lorsque lalgorithme de recherche se termine,
les configurations efficientes sont retournes au compositeur. Si ce dernier met une prfrence
pour la solution 1 par exemple, alors le critre A est prdominant pour ce problme : il re-
prsente une dimension privilgie de lcoute. A loppos, si la solution 3 est prfre, cest
le critre B qui prime. Quant au choix de la solution 2, il indique que les deux critres sont
mobiliss plus ou moins gale importance.
Cette remarque est pour nous fondamentale. Elle nous montre de quelle manire on peut
identifier les prfrences dcoute du compositeur, et rvler a posteriori une hirarchie de
critres sousjacente une situation dcoute donne. Dans un scnario dutilisation interactive
o le compositeur est rgulirement amen faire des choix, ce mcanisme dinfrence des
prfrences implicites peut nous aider privilgier certaines directions de lespace de recherche.
Le compositeur peut ainsi esprer rapidement dcouvrir, travers un processus dexploration
interactif et supervis, une proposition dorchestration qui rponde ses exigences. Nous
pensons ainsi quune approche multicritre couple un systme interactif permet donc de
7.3. DFINITIONS 93

critre B
1 critre A prdominant

3
critre B prdominant

critre A

Fig. 7.2 Zones de prdominance dans un espace deux critres

construire un systme expert guidant le compositeur vers des solutions pertinentes, et ce sans
avoir en passer par une caractrisation verbale du timbre.

Nous proposerons au chapitre 8 une validation de cette approche sur une description r-
duite du timbre instrumental, et prsenterons au chapitre 9 un algorithme efficace pour la
dcouverte de solutions efficientes.

7.3 Dfinitions
Nous rappelons ou introduisons dans cette section les dfinitions des concepts cls de notre
approche, articule autour des notions de cible sonore et de descripteur .

Dfinition 7.1. Un descripteur d est une valeur numrique scalaire ou vectorielle dcrivant
un aspect du timbre perceptivement identifiable.

Dfinition 7.2. Une mthode dextraction associe un descripteur d est une mthode de
calcul permettant dobtenir la valeur d(S) de ce descripteur partir du signal audio S.

Dfinition 7.3. Une cible T est un ensemble de descripteurs audio {d1 (T ), . . . , dN (T )} ca-
ractrisant un timbre recherch, obtenus par lanalyse dun son soit enregistr (orchestration
imitative), soit de synthse (orchestration gnrative).

Dfinition 7.4. Une configuration est un sous-ensemble de sons de la banque dchantillons


reprsentant la connaissance instrumentale, constituant une proposition dorchestration.

Nous dfinissons alors les concepts de fonction dagrgation et fonction de comparaison per-
mettant de passer en deux tapes dune configuration un ensemble de distances la cible
selon chaque descripteur. La figure 7.3 illustre cette transformation.
94 CHAPITRE 7. FORMULATION DU PROBLME

Dfinition 7.5. Etant donn une configuration, une fonction dagrgation fd est une fonc-
tion n-aire associe un descripteur d permettant destimer la valeur de d pour la configuration
en fonction des valeurs individuelles prises par d pour chacune de ces composantes.

Dfinition 7.6. Etant donn une cible orchestrer T , une configuration, un descripteur d
et une valeur de d retourne par la fonction dagrgation fd associe d pour cette configura-
tion, la fonction de comparaison DdT associe d permet de calculer la distance entre la
configuration et la cible T selon ce descripteur d.

Les fonctions dextraction, dagrgation et de comparaisons relatives chacun des descrip-


teurs introduits en 8.1.2 seront explicites en annexe A et formalises au paragraphe 7.4. une
valuation de la qualit de ces fonctions est propose au chapitre 8.

7.4 Formalismes
Nous dsignons respectivement par lensemble des sons possibles (quils soient enre-
gistrs, produits par un orchestre, ou le rsultat dune synthse), (si )1iNs la partie de
constituant la connaissance instrumentale de notre outil dorchestration et lopration in-
terne sur qui un ensemble de sons de associe leur mlange7 .

Formulation 7.1. Le problme de lorchestration consiste alors, pour une cible T ,


trouver le sous-ensemble I {1, . . . , Ns } tel que8 :
M
si T (7.1)
iI

o est loprateur dquivalence sur , tel que 1 2 si et seulement si 1 et 2 ne peuvent


tre perceptivement diffrencis.

En gnral un tel sous-ensemble nexiste pas. Il sagit alors de trouver celui qui reprsente la
configuration la plus proche de T . Nous avons introduit pour cela le concept de descripteur.
Formellement, un descripteur est une fonction d de dans Rp , o p est la dimension du
descripteur.

Formulation 7.2. Soit {d1 , . . . , dN } un ensemble de descripteurs sur et T le timbre


recherch. La cible (au sens dun ensemble de descripteurs) est alors dfinie par :

T {d1 (T ), . . . , dN (T )} (7.2)

Remarque 7.1. Ce formalisme doit nous rappeler que le systme dorchestration ne peut
connatre de la cible orchestrer uniquement la description quil en a. Il ne cherchera
donc des configurations quen fonction de ce quil entend de la cible, travers le prisme de
la description. Il ne faut donc pas sattendre trouver dans les orchestrations proposes des
particularits de la cible que le systme ne peut pas reprer. A titre dexemple, la rugosit due
la modulation damplitude dans un son flatterzunge ne pourra pas tre considre lheure
actuelle.
7
En traitement du signal cette opration pourrait sapparenter une somme de signaux.
8
Nous rappelons que T est fourni au systme sous forme de son enregistr dans le cas dune orchestration
imitative et reprsent par un avatar de synthse dans le cas dune orchestration gnrative.
7.4. FORMALISMES 95

Les fonctions dagrgation, quant elles, peuvent tre formalises de la faon suivante :
Formulation 7.3. Soit d un descripteur et I = {i1 , . . . , iI } un sous-ensemble de {1, . . . , N }.
La fonction dagrgation fd associe d vrifie alors :
!
M
d si = fd (d (si1 ) , . . . , d (siI )) +  (7.3)
iI

o  est une erreur destimation dont on montrera la section 8.3 quelle est raisonnable.
De faon similaire, une fonction de comparaison est une application de dans R vrifiant
lensemble des proprits suivantes :
Proprit 7.1. Soit d un descripteur et T la cible dun problme dorchestration. Soit DTd la
fonction de comparaison associe d pour la cible T . On a alors :
1. x , DTd (x) 0
2. x , DTd (x) = 0 d(x) = d(T )
3. Pour tout couple (x, y) de , DTd (x) DTd (y) si et seulement si x est perceptivement
plus proche de T que x relativement au descripteur d.
Remarque 7.2. Les fonctions de comparaison utilises dans notre outil et explicites en an-
nexe A vrifient par construction les points (1) et (2) de la proprit 7.1. En ce qui concerne le
troisime point, nous sommes contraints den faire une hypothse. Bien quelle semble raison-
nable, elle nest pas systmatiquement vrifie, en grande partie cause de lerreur destimation
introduite dans la formulation 7.3. Nous montrerons au chapitre suivant que cette erreur est
rsonnable en pratiqu et ne remets pas en cause la proprit (3).
Remarque 7.3. Les travaux de Damien Tardieu [TR07] sur les modles dinstruments permet-
tront bientt de se passer la fois des fonctions dagrgation et des fonctions de comparaison.
Lvaluation dune combinaison x sera alors une simple mesure de probabilit conditionnelle.
La valeur de critre associe un descripteur d et une cible T sera dfinie comme la probabili
dobserver la valeur d(T ) sachant la combinaison x :

DTd (x) = P (d(T ) | x)

Nous pouvons maintenant exposer, dans sa formalisation la plus gnrale, le problme de


lorchestration assiste par ordinateur vu comme une optimisation multi-objectif. Le caractre
ventuellement contraint du problme (discut en 7.5) ne remet pas en cause cette dfinition.
Formulation 7.4. Soient lensemble des sons possibles muni de lopration interne ,
(si )1iNs la partie de constituant la connaissance instrumentale du systme et E le sous-
ensemble de (, ), engendr par (si )i , cest--dire lensemble des configurations
 possibles. 
Soient T une cible orchestrer, (d1 , . . . , dN ) un jeu de descripteurs sur et DT , . . . , DTdN
d1

les fonctions de comparaison associes (d1 , . . . , dN ) pour T . La dcouverte dorchestrations


de T se ramne alors au problme de minimisation multicritre suivant :
(  
min DTd (x) = DTd1 (x), . . . , DTdN (x)
(7.4)
s.t. x E
96 CHAPITRE 7. FORMULATION DU PROBLME

Nous avons commenc lvoquer la section 4.3, le problme ainsi pos est N P-
difficile : sa complexit en temps est exponentielle. Nous verrons quil ne peut tre abord par
des mthodes compltes9 et quil nous faudra avoir recours des heuristiques. Nous introdui-
rons au chapitre 9 un algorithme volutionnaire permettant dobtenir en un temps raisonnable
une bonne approximation du front de Pareto.

7.5 Contraintes
Nous avons identifi le problme de lorchestration une recherche multicritre de combi-
naisons de sons, dont la pertinence est juge sur un ensemble de descripteurs. Si le formalisme
introduit la section prcdente autorise lvaluation de nimporte quelle configuration, il ne
permet pas en revanche de modliser dventuelles contraintes sur lorchestration recherche,
ni donc de pnaliser les configurations qui ne satisferaient pas ces contraintes.
Il ne faut toutefois par perdre de vue que les combinaisons identifies par le systme
comme tant les plus pertinentes relativement un ensemble de critres doivent avant tout
tre excutables par lorchestre. Quel serait par exemple lintrt dune solution ncessitant
huit violoncelles pour un petit orchestre comme LEnsemble Intercontemporain nen comptant
au maximum que deux ? En dautres termes, leffectif instrumental de lorchestre impose des
contraintes de cardinalit sur les instruments que les solutions trouves par le systme se
doivent de respecter.
En outre, de mme que le compositeur peut, par son interaction avec loutil, orienter la
recherche dans une direction privilgie (cf. 7.2), de mme la spcification de contraintes peut
faciliter la dcouverte de solutions pertinentes en liminant systmatiquement certaines rgions
de lespace de recherche. Dans notre systme, les contraintes portent sur la caractrisation
symbolique des sons, cest--dire sur leurs attributs : hauteur, dynamique, instrument, mode
de jeu, sourdine. . . Les contraintes sont donc mesures directement dans lespace de dcisions.
Le compositeur peut par exemple exiger des configurations proposes par le systme quelles
mobilisent obligatoirement certains instruments, que leurs composantes aient une dynamique
commune ou encore quelles ne sollicitent quune partie de lorchestre.

Dfinition 7.7. Une contrainte est une relation logique que doivent satisfaire les attributs
dune configuration, cest--dire lensemble de ses caractristiques symboliques, en lien direct
avec lcriture musicale. Un ensemble de contraintes est appel rseau de contraintes. une
configuration est dite consistante si et seulement si elle satisfait toutes les contraintes du
rseau.

Dfinition 7.8. Une contrainte est caractrise par une fonction de cot, valeurs relles
positives, qui une configuration donne associe le niveau de violation de la contrainte. La
contrainte est satisfaite si et seulement si sa fonction de cot est nulle.

Les fonctions de cot sont en lien direct avec ce que le monde de la programmation par
contraintes (PPC) dsigne par contraintes molles (soft constraints). En rgle gnrale,
une contrainte na que deux tats possibles : soit elle est satisfaite, soit elle et viole. Les
contraintes molles offrent davantage de souplesse en permettant de quantifier le degr de
9
Les mthodes compltes, en procdant implicitement une exploration totale de lespace de recherche,
garantissent loptimalit des solutions trouves. En revanche, elles ncessitent souvent des temps de calcul
rdhibitoires pour les problmes de grande taille.
7.6. DUN ESPACE LAUTRE 97

Descripteurs audio (optimisation)

Espace de Espace de Espace de


dcisions descripteurs critres
Cible
DB (ensemble de
(desc.) descripteurs)

Descripteurs
Fonctions Fonctions de Critres
de la
d'agrgation comparaison audio
configuration

Configuration

Fonctions de Critres
cot symboliques

Contraintes
Attributs symboliques (contraintes)

Fig. 7.3 Les trois mondes de lorchestration assiste par ordinateur

violation. Considrons par exemple un orchestre ne comprenant quun seul hautbois et quune
seule flte. Une proposition dorchestration A deux hautbois et une proposition B trois
fltes sont toutes deux inconsistantes du point de vue de leffectif orchestral. Pourtant, la
fonction de cot sera infrieure pour A que pour B.

Le problme de lorchestration devient donc un problme doptimisation sous contraintes.


La figure 7.3 illustre de quelle manire les problmes peuvent tre spars. Loptimisation
concerne les descripteurs dune configuration, soit lensemble des paramtres du signal en
rapport avec la caractrisation du timbre, tandis que les contraintes sadressent aux attributs
symboliques, cest--dire les variables de lcriture musicale.
Nous introduirons au chapitre 9 une modlisation du problme de lorchestration permet-
tant de saffranchir des contraintes lies leffectif orchestral. Nous dfinirons au chapitre 10
un langage lmentaire de contraintes sur les attributs, et prsenterons un algorithme efficace
de rparation des solutions inconsistantes.

7.6 Dun espace lautre


Lorchestration assiste par ordinateur a donc t identifie comme un processus doptimi-
sation multicritre. Dans ce type dapproche, la pertinence dun point de lespace de recherche
(ou espace de dcisions ) est mesure laide dune fonction multi-value valeurs dans
RK , o K est le nombre de critres considrs. Cette fonction dvaluation transforme donc
lespace de recherche en un espace mtrique. En dautres termes, cest un moyen de munir
lespace de recherche dune topologie sans laquelle il ny a pas doptimisation possible.
Les mthodes mutli-critres, couramment utilises dans les outils daide la dcision,
permettent lutilisateur de choisir une solution de compromis entre un ensemble de critres
98 CHAPITRE 7. FORMULATION DU PROBLME

la plupart du temps inconciliables. En gnral, la signification des critres est accessible au


dcideur. Par exemple, un chef de projet industriel devant planifier la fabrication dun nouveau
produit considrera conjointement le temps de fabrication, le cot des matires premires,
la qualit du produit, les besoins des utilisateurs, lhorizon de rentabilit. . ., et prendra sa
dcision en fonction des valeurs de critres sans se prcoccuper des paramtres de contrle du
processus industriel (cest--dire des coordonnes dans lespace de dcisions) qui conduisent
ces valeurs. En dautres termes, le dcideur sintresse davantage aux objectifs atteindre
sans vritablement se soucier de la manire dont on les atteint. Sil utilise un outil daide
la dcision pour dterminer par exemple cinq solutions diffrentes, il attend du logiciel cinq
solutions de compromis disperses dans lespace des critres, rendant compte de la diversit
des valeurs de critres possibles, et le choix final ne dpendra que des valeurs de ces critres.
En orchestration, le problme est diffrent. Lapproche multicritre a t retenue non seule-
ment pour explorer lventail des possibilits sonores mais surtout afin de tenir compte du
caractre multidimensionnel de la perception du timbre, phnomne complexe pour lequel
limportance relative des composantes ne peut tre connue lavance. Et cest justement dans
le but de dcouvrir ce qui importe au compositeur dans la cible orchestrer que ce dernier est
amen choisir une solution particulire dans lespace de critres. Or, ce choix ne saurait tre
motiv par les valeurs de critres elles-mmes, qui ne sont quune mesure arbitraire de simila-
rit selon telle ou telle dimension du timbre, mais par les qualits perceptives de la solution et
par lcriture (au sens musical) de cette solution, cest--dire par sa position dans lespace des
dcisions. La capacit de lorchestre raliser un certain timbre importe certes au compo-
siteur, mais sans doute autant que les moyens ncessaires pour y parvenir, savoir, lensemble
des paramtres de lcriture musicale : hauteurs, dynamiques, modes de jeu, etc. Aussi le pri-
mat des critres semble-t-il moins vident ici. Allons plus loin : une fois les prfrences du
compositeur identifies par le choix dune solution dans lespace des critres, ce dernier sera
intress par connatre lensemble des points de lespace des dcisions qui mnent ces
valeurs de critres, cest--dire lensemble des possibilits dcriture du timbre recherch.
La particularit du problme de lorchestration tient peut-tre au type despace dans lequel
se situe lutilisateur. Dans un problme classique de dcision multicritre, le dcideur vit
dans lespace des critres, il connat la signification de chaque critre et sait en interprter les
valeurs. Le compositeur, lui, vit dans lespace des dcisions, lespace de la partition et de la
symbolique de lcriture. Les valeurs de critres ne lui parlent pas et il na dailleurs pas
les connatre. Or, un processus doptimisation est toujours opr dans un espace de critres,
o se manifestent les effets des dplacements dans lespace des dcisions. Do lintrt de
lapproche descriptive : elle introduit un espace intermdiaire, lespace des descripteurs, qui
sert de correspondance entre lcriture et loptimisation.
Avant daller plus loin, et de chercher comment un problme doptimisation sous contraintes
peut-tre rsolu dans un espace de critres, il nous faut tout dabord tudier les proprits
de chacun de ces espaces, et voir si les relations de similitude et de dissemblance entre leurs
lments sont transmissibles dun espace lautre.

7.6.1 Espaces des dcisions


Cest le monde du compositeur. Les coordonnes de ses lments correspondent des
instruments, des hauteurs, des dynamiques, des modes de jeu, etc. On peut munir cet espace
dune distance qui permet de comparer deux lments en fonction de leurs caractristiques
communes. Pour reprendre le formalisme introduit au paragraphe 7.4, si est lensemble
7.6. DUN ESPACE LAUTRE 99

des sons possibles muni de lopration interne , (si )1iNs la partie de constituant la
connaissance instrumentale et E le sous-ensemble de (, ), engendr par (si )i , alors E est
lespace de dcisions. Tout lment de E scrit comme la somme dun sous-ensemble de
(si )i : (N )
Ms

E= xi si | xi {0; 1} (7.5)
i=1
On serait donc tent de munir E une distance de type Hamming , dfinie comme le
nombre de coordonnes diffrentes entre deux vecteurs :
Ns
X

x y = |xi yi | (7.6)
E
i=1

Il nest toutefois pas certain que ce choix soit trs pertinent, car la distance sera la mme
entre une clarinette en si bmol et une clarinette en mi bmol jouant la mme note la mme
dynamique dune part, et entre un violon col legno-tratto et un cor brassy dautre part.
En revanche, on peut trs bien utiliser une distance de Hamming sur les attributs, et
comparer deux configurations selon leurs instruments, leurs hauteurs, leurs familles dins-
truments. . . Ce principe sera utilis au chapitre 8 pour comparer des solutions du point de
vue du compositeur et au chapitre 13 pour explorer lensemble des solutions selon un critre
symbolique.

7.6.2 Espace des descripteurs


Dans cet espace les coordonnes des sons dpendent directement des valeurs de descripteurs
associs chaque dimension du timbre. On peut y comparer toute paire de solutions, mais il est
impossible dy dfinir une distance mono-value, car les poids relatifs chaque dimension du
timbre changent selon le contexte (voir paragraphe 7.2), donc dune comparaison lautre. Par
dfaut, on utilisera donc si ncessaire une distance euclidienne sur des descripteurs normaliss,
en prenant toutes les prcautions ncessaires pour linterprtation.

7.6.3 Espace des critres


Cest le monde de loptimisation. Les coordonnes de ses lments sont des distances re-
latives une cible sonore selon diverses dimensions de la perception du timbre. Il permet de
notamment de deviner les prfrences de lutilisateur (cf. 7.2). Seule restriction (de taille),
les distances dans cet espace ne sinterprtent que par rapport la cible, situe lorigine
du repre. Deux points sont voisins dans lespace des critres si leurs distances relatives la
cible sur chacune des dimensions sont proches ; cela nimplique par pour autant une proximit
perceptive entre les deux solutions. Par analogie avec la cartographie, cet espace sapparente
la projection du globe tablie au XVIe sicle par Postel. Dans cette projection, seuls sont
respects les distances et les angles calculs partir du ple, et la distance entre les continents
parat beaucoup plus petite quen ralit. Elle na dintrt que pour la navigation en zone
polaire, de mme que lespace des critres na dautre dessein que de positionner les solutions
de lespace de recherche par rapport la cible. Seules les relations de dominance au sens de
Pareto introduites la section 7.2 nont de sens dans lespace des critres. Nous verrons tou-
tefois au chapitre 9 comment le choix dune solution peut induire un ordre total sur lespace
des critres et permettre la comparaison de toute paires de solutions.
100 CHAPITRE 7. FORMULATION DU PROBLME

Le schma de la figure 7.3 indique comment passer dun espace lautre. Etant donn un
point de lespace de dcision (cest--dire une mixture de sons instrumentaux), les fonctions
dagrgation permettent destimer, partir des descripteurs individuels de chaque son, les
descripteurs de la mixture selon chaque dimension du timbre. Dans un second temps, les
fonctions de comparaison permettent de calculer les distances relatives la cible pour chaque
descripteur.
Ces fonctions ne sont pas monotones. Il suffit de considrer la valeur absolue des fonctions
de comparaisons des moments spectraux pour sen persuader (voir annexe A). Ainsi, rduire la
distance entre deux configurations dans lespace des critres nimplique pas que cette distance
diminue dans lespace des dcisions et vice-versa.
A la non-monotonie des ces fonctions transformant lespace des dcisions en espace des
critres sajoute leur non-injectivit. Les deux espaces extrmes de la figure 7.3 ont donc des
topologies trs diffrentes. Nous ne devons pas perdre du vue que lapproche multicritre se
justifie avant tout par laspect multidimensionnel de la perception du timbre et que lespace
des critres nest l que pour distinguer les solutions efficientes des solutions domines, et pour
estimer limportance relative des dimensions de lcoute, ainsi quexpos au paragraphe 7.2.
Le compositeur, de son ct, juge la qualit des rsultats obtenus dans lespace des dcisions.
Nous aurons donc nous poser la question fondamentale suivante : Les solutions optimales
du problme doptimisation sous contraintes, savoir les configurations la fois efficientes
et consistantes, correspondent-elles des orchestrations intressantes pour le compositeur ?
En dautres termes, le problme de lorchestration formul en 7.4 est-il bien pos ? Ce sera le
propos du chapitre 8.
Chapitre 8

Validation sur une description


rduite du timbre

Description spectro-harmonique du timbre


Base de test : problmes de petite taille
Evaluation des fonctions dagrgation
Le problme est-il bien pos ?

Nous proposons dans ce chapitre une validation exprimentale des concepts et formalismes
introduits au chapitre prcdent. Nous commenons par introduire un ensemble rduit de
descripteurs du timbre puis montrons quils permettent de traiter une classe particulire de
problmes, sans remettre en cause le cadre thorique du chapitre 7.
Nous valuons dans un premier temps la qualit des fonctions dagrgation en comparant,
pour un ensemble consquent de mixtures de test, lestimation des descripteurs au calcul par
extraction directe. Dans un second temps, nous prouvons que le problme de lorchestration
assist par ordinateur, reformul en 7.4 comme un problme doptimisation multicritre sous
contraintes, est bien pos : nous calculons pour cela les fronts de Pareto pour un ensemble
de problmes de petite taille et montrons quils contiennent des configurations pertinentes
pour le compositeur.

8.1 Description rduite du timbre instrumental


8.1.1 Hypothses et limitations
Nos recherches sur lorchestration assiste par ordinateur sont nes dune demande de
compositeurs formule au sein dun groupe de travail de lIRCAM. Les suggestions mises par
les membres de ce groupe (voir 4.2) fournirent alors une matire suffisante pour vingt ans
de recherche. La ncessit de disposer rapidement dun outil dorchestration a donc ncessit
certaines hypothses simplificatrices. Elles ont t brivement introduites dans [CTA+ 06].
Nous les rappelons ici de manire plus dtaille :

Aspects temporels : Tous les sons manipuls par notre systme (aussi bien la cible que
les chantillons de la connaissance instrumentale) sont supposs entretenus et sans volution
temporelle. Les non-entretenus (piano, guitare, harpe, glockenspiel, pizzicati. . .), de mme que

101
102 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

les sons prsentant une variation temporelle (trmolos, vibratos, crescendos, decrescendos,
glissandi. . .) sont absents de la banque de sons instrumentaux.

Composantes harmoniques, composantes bruites : La cible et les sons de la base


sont supposs contenir des composantes sinusodales. Les sons uniquement bruits ne peuvent
tre dcrits, ni donc traits. Les percussions sons potentiellement entretenus (caisse claire,
cymbales. . .) sont donc absentes de la base. En outre, la modlisation du bruit nest pas
supporte. Les aspects transitoires du son sont ngligs.

Connaissance instrumentale : Nous supposons que la base de sons constituant la connais-


sance instrumentale est reprsentative des possibilits de jeu dans le cadre des restrictions
exposes ci-dessus. Nous supposons galement que la base est cohrente du point de vue des
dynamiques (voir 7.1.2) : nous faisons lhypothse que les niveaux denregistrement refltent
fidlement la puissance acoustique des instruments et permettent destimer avec prcision
la qualit des mlanges. Nous restreignons en outre la connaisance instrumentale aux sons
harmoniques monophoniques, pour lesquels la hauteur est clairement identifie.

Effets despace : En dernier lieu, nous ngligeons les qualits acoustiques du lieu dcoute
ainsi que les positions des instrumentistes et de lauditeur. Lhypothse sous-jacente est que le
timbre obtenu par un mlange instrumental ne dpend que des paramtres dcriture et non
des conditions dexcution de la musique.

En regard de lexprience musicale et des souhaits des compositeurs (voir 4.2) ces hypo-
thses pourront paratre extrmement rductrices voire irralistes. Elles ont toutefois permis,
aprs trois annes de recherche, de construire un outil dorchestration dont les potentiali-
ts dpassent dj ce que ltat de lart propose aujourdhui. En outre, la considration de
phnomnes tels que les effets despace na de sens quune fois leves les imprcisions de la
connaissance instrumentale. Il serait en effet absurde de calculer une rverbration avec une
grande prcision sans parfaitement matriser les caractristiques timbrales des sources sonores.
Il nous semble donc lgitime de considrer que de telles hypothses naffectent pas, aujourdhui,
la qualit des rsultats de faon significative.

8.1.2 Descripteurs retenus pour lorchestration


Nous introduisons ici les descripteurs utiliss par notre systme. Compte tenu des hypo-
thses formules en infra, les aspects temporels et spectro-temporels du timbre ne sont pas
pris en compte. Le signal sera donc toujours un segment de son correspondant une partie
statique du timbre ; lattaque, en particulier, ny figurera jamais.
Nos descripteurs se divisent en deux catgories : harmoniques, multidimensionnels (princi-
paux partiels rsolus) et spectraux, scalaires (centrode spectral et tendue spectrale). Nous ne
donnerons pas ici de dtails techniques quant au calcul et la manipulation de ces descripeurs.
Le lecteur dsireux dapprofondir ces notions est invit consulter lannexe A.

Principaux partiels rsolus (MRP)


Rappelons que lespace de timbres de McAdams et al. [MWD+ 95] ne concerne que des sons
de mme hauteur et de mme intensit perceptive. Une description harmonique de la cible nous
8.1. DESCRIPTION RDUITE DU TIMBRE INSTRUMENTAL 103

a donc paru ncessaire. Elle consiste en un ensemble des principaux partiels rsolus par
le systme auditif. On sait en effet que la membrane basilaire de loreille interne se comporte
comme un ensemble de filtres passe-bande [Zwi61]. Un partiel est rsolu lorsquil est seul
lintrieur dune bande critique. Si une mme bande contient plusieurs partiels, seul le plus
lev en amplitude est considr comme rsolu.
Nous dsignerons dsormais par MRP (Main Resolved Partials) les principaux partiels
rsolus. Dans le cas dun son monophonique (de hauteur unique) ou polyphonique (peru
comme un accord), les MRP jouent un rle dterminant dans la perception de la (des) hau-
teur(s). Dans le cas dun son complexe (une cloche par exemple), ils dterminent la couleur
harmonique du son.

Centrode spectral
Le centrode spectral est souvent dfini comme le centre de gravit spectral du son. Les
psychoacousticiens le relient la brillance : les sons brillants ont un centrode lev, les sons
sourds un centrode bas. Son rle dans la perception et les jugements de similarit de timbre
na plus tre dmontr : le centrode spectral figure toujours parmi les dimensions principales
des espaces de timbres (voir section 2.5).
Le centrode peut tre calcul en considrant le spectre comme la densit dune variable
alatoire dont les valeurs sont les frquences du spectre et les probabilits dobservation sont
les amplitudes normalises [Pee04] :
Z
sc = f a(f ) df (8.1)
0

Etant donn que les frquences peuvent tre exprimes sur une chelle linaire ou logarith-
mique, et que le spectre peut tre calcul en amplitude, en energie ou en dcibels, il y a en tout
six faons de calculer le centrode spectral. Pour des raisons dadditivit des descripteurs, nous
prfrons le centrode linaire, calcul avec des frquences linaires et un spectre damplitude.
La formule 8.1 permet de calculer le centrode instantan, associ une fentre tempo-
relle unique. Le centrode global (caractrisant la brillance gnrale du son) est obtenu par
une moyenne du centrode instantan, pondre par lintensit perceptive sur chaque fentre
temporelle (voir A).

Etendue spectrale (spread )


De mme que le centrode est la moyenne du spectre (ou premier moment spectral), lten-
due spectrale correspond lcart-type (second moment spectral), appel couramment spread.
Dun point de vue perceptif, il est reli lpaisseur spectrale du son ( ne pas confondre
avec lpaisseur spatiale de Koechlin [Koe43]). Lpaisseur spectrale est en quelque sorte la
bande passante ; une voix humaine sera plus paisse en conditions naturelles dmission que
sortant dun vieil appareil de radio. Pour donner un exemple musical, hauteur et centrode
quivalents, une trompette a un son trs pais avec une sourdine Harmon et trs troit avec
une sourdine Cup. En termes probabilistes, ltendue spectrale scrit [Pee04] :
Z
ss = (f sc)2 a(f ) df (8.2)
0

o sc est le centrode spectral du son. De mme que le centrode, il y a six calculs possibles pour
ltendue. Toujours pour des raisons dadditivit des descripteurs, nous travaillerons avec un
104 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

spread linaire, calcul avec des frquences linaires et un spectre damplitude. La formule 8.2
renvoie galement une valeur instantane. Le calcul de ltendue globale fait intervenir lin-
tensit perceptive instantanne (voir A).

8.1.3 Extensibilit de la description


Nous nous limitons donc a une vision spectrale, ou spectro-harmonique, du timbre, et
sommes conscients que cette simplification nglige de nombreux aspects du son. Helmoltz
dj, pour qui les diffrences de perception sonore nont longtemps tenu qu la frquence
et lamplitude des partiels, stait rendu compte de limportance des facteurs temporels et
des parties transitoires. La caractristique des sons la plus significative dun point de vue
musical nest pas quils soient identifiables en tant quentits multidimensionnelles cohrentes,
mais quils prsentent des variations temporelles significatives, et conservent toutefois leur
identit. (Erickson, Sound Structure in Music [Eri75]).
On sait aujourdhui que ces variations temporelles jouent un rle majeur dans notre percep-
tion du timbre. Schouten [Sch68] a propos un ensemble de dimensions pour la caractrisation
du timbre, adaptes aux proccupations contemporaines : rapport entre composantes tonales
et bruites, enveloppe spectrale, enveloppe temporelle, glissement de formants, variation de
frquence fondamentale, forme de lattaque. Tous ces aspects sont dsormais accessibles la
description des sons [PMH00] [Pee04] et peuvent tre extraits directement du signal audio
laide du programme ircamdescriptor de Geoffroy Peeters. Or, nous avons vu en 7.2.2 que
disposer dun modle descriptif nest pas suffisant pour le problme de lorchestration ; la dif-
ficult principale rside dans la prdiction des descripteurs dun mlange de sons. Il serait
en effet impensable en termes de temps de calcul dvaluer la qualit des propositions
dorchestration en gnrant un mixage des composantes, puis en extrayant les descripteurs
de la mixture (voir section 7.2.2).
Nous avons donc besoin pour chaque descripteur utilis, non seulement dune mthode dex-
traction, mais aussi dune mthode daddition (cf. 7.3). Les descripteurs introduits en 8.1.2
satisfont cette exigence sans toutefois ncessiter une expertise approfondie du domaine. En
outre, cette caractrisation rduite du timbre nous a dj permis dobtenir des rsultats signi-
ficatifs auprs des compositeurs. Aprs tout, notre description recouvre une bonne partie de
lespace de timbres de McAdams et al. [MWD+ 95]1 . . .
Rappelons galement que la conception et la manipulation des descripteurs du timbre ne
constituent pas le cur de nos travaux. En attendant de disposer dun ensemble de descripteurs
additifs du timbre, nous avons avanc dans nos recherches avec une description simple mais
facilement manipulable.

8.2 Cration dune base de test


Le problme dune valutation quantitative de nos approches ou de nos mthodes sest
prsent plusieurs reprises au cours de nos travaux : mesures de la prcision des fonctions
dagrgation (section 8.3), pertinence de la description et de lapproche multicritre (sec-
tion 8.4 et 8.5), performances de lalgorithme de rparation des configurations inconsistantes
1
Il nen effet pas aberrant de considrer lirrgularit spectrale comme incluse dans les principaux partiels
rsolus (MRP), les diffrences damplitude entre les partiels dimportance moindre pouvant tre considres
comme moins significatives dans le calcul de lirrgularit spectrale.
8.2. CRATION DUNE BASE DE TEST 105

(chapitre 10), valuation de lalgorithme dorchestration (chapitre 11). Pour lensemble de ces
valuations, une base commune dinstances de test a t gnre. Chaque cas de test est un
son rsultant dun mlange dchantillons de la connaissance instrumentale, qui peut servir
de cible pour un problme dorchestration. Nous dtaillons dans cette section le processus de
cration de cette base.

8.2.1 Gnration de mixtures

La connaissance instrumentale de notre outil dorchestration provient de la base Studio


Online (SOL) [BBHL99], enregistre lIRCAM (voir section 7.1.2). Seuls sont utiliss par
notre systme les chantillons de sons harmoniques, entretenus et sans variations temporelles,
au sens large les chantillons prsentant des modulations damplitude (trmolos) et de
frquences (vibratos) sont exclus. Les raisons de ces restrictions ont t exposes en 8.1.1.
Notre base de donnes compte ainsi 4763 chantillons, soit environ un tiers de SOL, et regroupe
les instruments suivants : flte, hautbois, clarinette en Si bmol, basson, trompette en Do,
trombone tnor, cor, violon, alto, violoncelle et contrebasse.
Enregistrs en solo, en dehors de tout contexte musical, les chantillons de SOL sont la
plupart du temps trs lgrement faux. Lorsquon les mlange pour gnrer des mixtures de test
ou pour simuler des orchestrations, de pnibles phnomnes de dissonance et de modulation
damplitudes apparaissent. Nous avons donc repitch automatiquement les chantillons
de notre propre base laide une analyse en frquence fondamentale et dun algorithme de
stretch dans SuperVP [DP91].
A partir de ces sons individuels, nous avons dans un second temps gnr des mixtures
instrumentales de deux types. Les premires, que nous qualifions de monophoniques , nin-
cluent que des sons de mme hauteur, et leur cardinalit varie entre 1 et 4 sons. Les secondes,
polyphoniques , sont formes partir de 2, 3 ou 4 sons de la base, de hauteurs toutes
diffrentes. Pour ces dernires, lambitus de laccord (cest--dire lcart entre la note la plus
haute et la plus basse) nexcde jamais deux octaves, afin de favoriser la fusion des timbres
on sait en effet que deux sons harmoniques de hauteurs trop loignes sont perus comme
appartenant deux plan sonores distincts. Dans tous les cas, les mixtures ne peuvent
impliquer deux fois le mme instrument, et leur tessiture est limite Do2 2 dans le grave et
R5 dans laigu.
La mthode daddition utilise est une simple somme de signaux, chaque signal tant
pralablement convolu avec la rponse impulsionnelle dune petite salle, diffrente chaque
fois et puise alatoirement parmi un ensemble de rponses gnres numriquement avec le
programme de spatialisation Spat [Jot97]. Cette opration permet de simuler un effet de salle
en crant une rverbration artificielle. Son but est dune part dviter dinvraisemblables effets
de phase et de modulation damplitude, frquents lors de laddition de signaux harmoniques
de mme hauteur. Dautre part, elle vise sabstraire de la spcificit de lchantillon lie
linstrumentiste et aux conditions denregistrement (voir section 7.1.2).
500 mixtures de chaque classe ont t gnres, soit une base de test rassemblant 3500
instances de cardinalit variable.

2
Dans lintgralit de ce document, Do4 dsigne le Do central. Cest la convention de notation adopte par
la base SOL.
106 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

8.2.2 Construction de cibles : description et contraintes


Les descripteurs audio introduits au paragraphe 8.1.2 ont t extraits de chacune des
mixtures selon le processus expos en annexe A. Cet ensemble de descripteurs va servir dans un
premier temps lvaluation des fonctions dagrgation (voir paragraphe 8.3). Ensuite, chaque
jeu de descripteurs sera considr comme la cible dun problme dorchestration imitative dont
le but sera de retrouver la mixture originale.
Chaque cible est en outre complte par trois contraintes permettant de rduire la taille
de lespace de recherche (rappelons que ce dernier ne comporte que des configurations consis-
tantes) :
Contraintes de hauteur : Lespace de recherche est limit aux configurations compre-
nant toutes les hauteurs de la mixture cible, et uniquement ces hauteurs-l. Pour les
mixtures monophoniques, lespace est donc restreint des combinaisons de sons de hau-
teurs identiques ; pour les cibles polyphoniques, le nombre de hauteurs diffrentes dans
une configuration est gal au degr de polyphonie de la mixture.
Contraintes deffectif : Lespace de recherche est limit aux configurations nutilisant
quune seule fois le mme instrument.
Contraintes de cardinalit : Lespace de recherche est limit aux configurations impli-
quant le mme nombre dinstruments que la mixture cible. Pour les mixtures trois
sons, on ne cherchera donc que des solutions trois sons.
Les mixtures cibles vrifient systmatiquement les trois contraintes de hauteur, effectif et
cardinalit. Elle font donc chaque fois partie de lespace de recherche. Lobjet de la section 8.4
sera justement dy reprer leur position.

8.2.3 Espaces de recherche, fronts de Pareto


Chacune des 3500 mixtures de la base de test a donc t considre comme la cible dun
problme dorchestration particulier, assortie de contraintes de hauteur, deffectif et de car-
dinalit. Pour chaque problme, lintgralit des configurations consistantes a t gnre. Le
tableau 8.1 donne un aperu de la cardinalit des espaces de recherche. Pour les mixtures 4
sons, le temps de calcul est dj de lordre de plusieurs minutes. Lexploration systmatique
(brute force) des combinaisons possibles dans la rsolution de problmes de grande taille sera
donc proscrire. Nous verrons au chapitre 9 de quelle manire le problme combinatoire peut
tre trait en un temps raisonnable.
Les espaces de critres sont alors obtenus par applications successives des fonctions dagr-
gation et fonctions de comparaison sur les espaces de dcisions. Nous extrayons de chaque
espace de critres les fronts de Pareto laide de lalgorithme 1. Afin de prouver la validit
de lapproche multicritre et labsence de redondance dans lemploi de critres exclusivement
spectro-harmoniques, nous considrons pour chaque problme plusieurs combinaisons de cri-
tres. De chaque espace de critres nous extrayons donc 7 fronts de Pareto correspondant aux
diffrents jeux de critres du tableau 8.2.
La complexit de lalgorithme 1 est dans le pire des cas en O(n2 K), o n est la taille de
lespace de recherche et K le nombre de critres. Afin de traiter les problmes 4 sons en
un temps raisonnable nous crons une partition de lespace de recherche en sous-ensembles de
lordre de 105 configurations, et utilisons lalgorithme 2 de mise jour du front de Pareto. Sa
complexit est dans le pire cas en O(npK), o K est le nombre de critres, p la taille du front
courant et n la taille du sous-ensemble de lespace des critres utilis pour la mise jour.
8.2. CRATION DUNE BASE DE TEST 107

Tab. 8.1 Tailles moyennes des espaces de recherche pour des problmes de petite taille (seules
sont comptabilises les configurations consistantes avec les contraintes de hauteur, deffectif
et de cardinalit).

Type de cible Taille de lespace


monophonique - 1 son 82
monophonique - 2 sons 2, 85.103
monophonique - 3 sons 7, 29.104
monophonique - 4 sons 1, 01.107
polyphonique - 2 sons 5, 70.103
polyphonique - 3 sons 3, 65.105
polyphonique - 4 sons 2, 00.107

Algorithme 1 Extraction du front de Pareto (extract_pareto_front)


Arguments: Une partie C = {c1 , c2 , . . .} de lespace de critres.

1: P {c1 }
2: pour i = 2 . . . #C faire
3: P P {ci }
4: pour tout p P p 6= ci faire
5: si ci p alors
6: P P \ {p}
7: sinon si p ci alors
8: P P \ {ci }
9: aller la ligne 2
10: fin si
11: fin pour
12: fin pour

Tab. 8.2 Diffrentes combinaisons de critres testes

k(1) centrode seul


k(2) spread seul
k(3) MRP seuls
k(12) centrode + spread
k(13) centrode + MRP
k(23) spread + MRP
k(123) centrode + spread + MRP
108 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Algorithme 2 Mise jour du front de Pareto (update_pareto_front)


Arguments: Une partie C = {c1 , c2 , . . .} de lespace de critres, un ensemble P de solutions non
domines, mettre jour avec les lments de C.

1: pour i = 1 . . . #C faire
2: P P {ci }
3: pour tout p P p 6= ci faire
4: si ci p alors
5: P P \ {p}
6: sinon si p ci alors
7: P P \ {ci }
8: aller la ligne 1
9: fin si
10: fin pour
11: fin pour

Les tableaux 8.3 recensent les tailles moyennes des fronts de Pareto pour chaque type de
mixture et chaque combinaison de critres. De faon vidente, la taille des fronts augmente
toujours avec le nombre de critres. En effet, une configuration efficiente dans un espace rduit
de critres lest encore dans un espace plus large, alors que linverse nest pas vrai. Cest un des
effets de la multidimensionnalit, qui veut que les distances diminuent quand la dimension des
espaces augmente. Nous aurons loccasion de rediscuter ces phnomnes et les consquences
quils engendrent pour notre problme. Ce qui nous semble remarquable ce stade, cest que la
taille relative des fronts de Pareto par rapport aux espaces de recherche chute considrablement
avec la taille du problme, comme en atteste le dernier tableau de 8.3. Seule une configuration
sur 10000 est efficiente dans un espace trois critres pour une cible polyphonique de 4 sons ;
le problme est donc dautant plus difficile que la cardinalit de lespace de recherche est
leve. Laugmentation du nombre de critres ne se traduit pas par une explosion du nombre
de solutions efficientes.
Dans la situation idale o les fonctions dagrgation prdiraient exactement les valeurs
issues de lanalyse, il est clair que les distances relatives entre la cible analyse et la configura-
tion compose des lments de la cible serait nulle pour chacun des critres. Corrlativement,
le front de Pareto serait alors rduit un unique point, lorigine du repre. Dune manire
plus gnrale, on peut dire quen optimisation multicritre la taille de fronts de Pareto diminue
dautant plus quil est possible dobtenir simultanment de bonnes valeurs sur chacun des
critres, comme cela semble tre le cas pour nos problmes de test. Il est donc normal que les
fronts soient de faible cardinalit.

La figure 8.1 rsume le processus de cration dune instance de test. A partir dun jeu
de hauteurs et dun orchestre ne contenant quun seul instrument de chaque type, on dduit
dans un premier temps un ensemble de contraintes de hauteur, deffectif et de cardinalit. Ces
contraintes vont servir dune part dlimiter lespace de recherche, dautre part gnrer une
mixture instrumentale consistante forme dchantillons de la connaissance instrumentale (les
botes RI dsignent les rponses impulsionnelles dune salle de petite taille, voir 8.2.1). Les
descripteurs extraits de la mixture constituent alors la cible dun problme dorchestration
pour lequel plusieurs fronts de Pareto sont extraits de lespace des critres. Une instance de
test est donc compos dune cible, dun jeu de contraintes, dun espace de recherche (et de
8.2. CRATION DUNE BASE DE TEST 109

Tab. 8.3 Tailles moyennes des fronts de Pareto

Mixtures monophoniques

1 son 2 sons 3 sons 4 sons


k(1) 1 1 1 1
k(2) 1 1 1 1
k(3) 1 1 1 1
k(12) 4.3 7.9 10.9 13.7
k(13) 5.0 22.5 326.4 81.4
k(23) 5.1 23.1 329.4 90.6
k(123) 9.0 44.3 402.6 244.3

Mixtures polyphoniques

2 sons 3 sons 4 sons


k(1) 1 1 1
k(2) 1 1 1
k(3) 1 1 1
k(12) 8.6 12.7 16.6
k(13) 25.5 34.7 28.5
k(23) 25.8 35.3 27.5
k(123) 50.8 115.2 196.9

Proportion de lespace de recherche (seuls les fronts 3 critres sont reports ici)

Type de cible Ratio


monophonique - 1 son 11.11%
monophonique - 2 sons 1.55%
monophonique - 3 sons 0.55%
monophonique - 4 sons 0.002%
polyphonique - 2 sons 0.89%
polyphonique - 3 sons 0.03%
polyphonique - 4 sons 0.001%
110 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Notes Espace de Front de Pareto


Contraintes
Orchestre recherche thorique

RI

DB Extraction de
RI + Mixture Cible
(sons) descripteurs

RI

Fig. 8.1 Processus de cration dune instance de test (un cas de test est constitu de
lensemble des lments en bleu).

lespace de critres associ) et de fronts de Pareto pour diffrentes combinaisons de critres.

8.3 Evaluation des fonctions dagrgation et de comparaison


Si (si )1iNs la partie de constituant la connaissance instrumentale, alors chaque
instance de la base de test correspond une mixture M un sous-ensemble I {1, . . . , Ns } tel
que : M
(si r(si )) = M
iI
o r(s) dsigne rverbration ajoute une composante s.
Dfinition 8.1. Nous appellons solution thorique associe une instance de test repr-
sente par une mixture M , la configuration (si )iIT dont les lments sont les composantes de
la mixture M . Thoriquement, cest la configuration de lespace de recherche la plus proche de
M . Nous la notons KT , et on a : M
KT = si
iIT

Remarque 8.1. Si les fonctions dagrgation sont de bons prdicteurs des descripteurs dune
configuration, peu sensibles la rverbration, on doit alors abserver les relations suivantes :
d
d, DM (KT ) ' 0 ,

o DM d (K ) est la fontion de comparaison entre la cible M et la solution thorique K pour


T T
le descripteur d (voir dfinition 7.6 et proprit 7.1).
Nous cherchons dans cette section valuer l erreur intrinsque d des fonctions dagr-
gation relatives chaque descripteur d (voir dfinition 7.5 et formulation 7.3), mentionne au
paragraphe 7.4 :   
d (M ) = fd d (si1 ) , . . . , d siIT + d , (8.3)
8.3. EVALUATION DES FONCTIONS DAGRGATION ET DE COMPARAISON 111

2500 2000

2000
1500
Centrode calcul (Hz)

Spread calcul (Hz)


1500

1000

1000

500
500

0 0
0 500 1000 1500 2000 2500 0 500 1000 1500 2000
Centrode mesur (Hz) Spread mesur (Hz)

Fig. 8.2 Estimation des moments spectraux des cibles polyphoniques 4 sons

La figure 8.2 permet de se faire une ide de la qualit de lestimation des moments spec-
traux pour les cibles polyphoniques 4 sons. Des nuages de points similaires sont obtenus
pour les autres types de mixtures. En ce qui concerne les MRP (rappelons quil sagit dun
descripteur multidimensionnel), la reprsentation de lestimation est plus problmatique, car
lerreur destimation dfinie en 8.3 est de mme dimension que le descripteur associ. Afin
de comparer des erreurs exclusivement scalaires, nous choisissons donc de mesurer, pour les
MRP, lerreur propage dans la fonction de comparaison :
M RP
DM (KT ) = 0M RP

Nous valuons donc, pour chaque instance de test, les descripteurs associs la solution
thorique, puis nous calculons les erreurs destimation des moments spectraux et des MRP.
Lerreur relative aux moments est dfinie par  = (dbKT dM )/dM et peut donc tre ngative
en cas de sous-valuation. Lerreur relative au MRP scrit M RP = DM M RP (K ), elle est
T
donc toujours positive. Les moyennes et carts-type de ces erreurs sont reportes dans les
tableaux 8.4. La figure 8.3 permet en outre de se faire une ide de la distribution des fonctions
de comparaison pour les cibles polyphoniques 4 sons.
Les tests sur les sons isols (mixtures monophoniques une seule composante) permettent
de quantifier leffet de la rverbration sur les valeurs de descripteurs. Il semble que dans notre
cas leffet de salle (ou la mthode utilise pour le simuler) diminue en moyenne les valeurs des
moments spectraux (donc rende le son moins brillant et moins large), tout en conservant
bien lenveloppe spectrale dans la partie basse du spectre. Nous expliquons ces phnomne en
rappelant que la rverbration se comporte en gnral comme un filtre passe-bas.
Pour lensemble des instances de test, le biais destimation est denviron +11% pour le
centrode et +8,5% pour ltendue spectrale. Mme si lon peut considrer ces valeurs comme
relativement leves, leur constance doit nous rassurer : la qualit de lestimation ne se dgrade
pas avec la taille de la mixture. Il y a donc fort parier que lerreur destimation des moments
spectraux soit uniquement due la rverbration pour les mixtures considres dans ces tests.
112 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Tab. 8.4 Erreurs moyennes destimation des descripteurs (cart-type de lerreur destima-
tion)
Mixtures monophoniques

1 son 2 sons 3 sons 4 sons


centrode 10.4% (9.7%) 10.7% (9.5%) 11.1% (9.2%) 11.2% (9.3%)
spread 8.8% (7.6%) 8.2% (8.5%) 7.7% (8.0%) 7.5% (7.7%)
MRP 5.0% (5.8%) 5.1% (5.5%) 5.0% (5.1%) 4.7% (5.5%)

Mixtures polyphoniques

2 sons 3 sons 4 sons


centrode 11.0% (10.4%) 11.2% (9.9%) 11.2% (10.4%)
spread 9.0% (8.8%) 9.5% (9.1%) 9.1% (9.2%)
MRP 5.9% (6.1%) 6.3% (6.9%) 6.6% (7.3%)

0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 0 0.2 0.4 0.6 0.8 1
Centrode Spread MRP

Fig. 8.3 Distribution des fonctions de comparaison pour les cibles polyphoniques 4 sons
8.4. POSITION DE LA SOLUTION THORIQUE DANS LESPACE DES CRITRES113

En ce qui concerne les MRP, les faibles valeurs de la distance en cosinus indiquent une forte
corrlation entre les vecteurs damplitude des partiels les plus importants, donc une grande
similitude entre les enveloppes spectrales mesures et calcules.

N.B. Rappelons encore une fois que si les deux premiers moments spectraux correspondent
bien des dimensions perceptives (la brillance pour le centrode et lpaisseur pour ltendue),
ces relations nont jamais t tablies que pour des sons monophoniques. Nous ne savons donc
a priori pas comment interprter une valeur de centrode ou dtendue pour des mixtures
dont les lments ont des hauteurs diffrentes. La seule conclusion que nous pouvons tirer
de notre test est que lestimation des moments spectraux par le calcul et leur extraction
par un processus danalyse conduisent approximativement aux mmes valeurs. Nous verrons
toutefois la section 8.5.4 que les moments spectraux contribuent grandement lidentification
de solutions perceptivement pertinentes.

8.4 Position de la solution thorique


dans lespace des critres
Nous avons affirm au paragraphe 7.4 quen gnral lquation 7.1 na pas de solutions.
Exceptionnellement ici, dans le cadre de notre base de test, chaque problme admet au moins
sa solution thorique (voir dfinition 8.1) comme solution :

KT M

Dans lhypothse o lerreur destimation des fonctions dagrgation serait nulle, le front de
Pareto associ une instance de test serait alors rduit la seule solution thorique (voir
section 8.2.3). Or, les tableaux 8.3 prouvent bien que cette erreur ne peut tre nglige, et que
les fronts contiennent bien plus quune seule configuration. Mais contiennent-ils au moins la
solution thorique ?
Dun point de vue perceptif, la mixture cible et la solution thorique sont par construction
similaires. La question que nous soulevons dans cette section est de savoir si la seconde occupe
une place privilgie dans lespace de critres, dont la topologie est induite par la premire
(cf. section 7.6). Nous montrons que la solution thorique est dautant mieux place dans
lespace des critres que le nombre de descripteurs est lev.

8.4.1 Le front de Pareto contient-il la solution thorique ?


Le tableau 8.5 reporte les pourcentages des cas o la solution cible appartient au front de
Pareto, en fonction du type de cible et du jeu de descripteurs. A chaque fois, ce pourcentage
est comparer avec le random , cest dire la probabilit quune solution choisie au hasard
appartienne au front. Cette probabili est gale au rapport entre la taille du front et la taille de
lespace de recherche (soit lensemble des solutions consistantes avec les contraintes de hauteur,
deffectif et de capacit). Le tableau infrieur donne le rapport entre la frquence observe et la
probabilit due au hasard. Un rapport suprieur 1 indique donc une performance suprieure
au hasard.
Linterprtation de ces donnes est sujette caution. Les principaux partiels rsolus (MRP)
apparaissent indniablement comme le critre le plus dterminant, puisque la frquence
laquelle la solution thorique est prsente dans le front augmente significativement ds que
114 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Tab. 8.5 Frquence laquelle la solution thorique appartient au front de Pareto (tableau
infrieur : rapport entre la frquence observe et probabilit dappartenance au front - un
rapport suprieur 1 indique une performance suprieure au hasard).

Frquences observes

mono-1 mono-2 mono-3 mono-4 poly-2 poly-3 poly-4


k(1) 10.8 % 0.2 % 0% 0% 0.2 % 0% 0%
k(2) 7.8 % 0.4 % 0% 0% 0% 0% 0%
k(3) 31.2 % 3.4 % 0.2 % 0% 2.8 % 0% 0%
k(12) 41.8 % 5.4 % 0.6 % 0% 3.4 % 0.2 % 0%
k(13) 58.0 % 14.6 % 2.8 % 0.61 % 11.2 % 1.6 % 0%
k(23) 59.0 % 13.4 % 4.8 % 0.61 % 11.2 % 1.% 0%
k(123) 75.2 % 27.8 % 9.6 % 1.63 % 26.0 % 4.4 % 0.6 %

Proportion de la probabilit dappartenance au front

mono-1 mono-2 mono-3 mono-4 poly-2 poly-3 poly-4


k(1) 8.8 5.7 - - 11.4 - -
k(2) 6.3 11.4 - - - - -
k(3) 25.4 97.2 145.8 - 159.7 - -
k(12) 7.9 19.6 40.3 - 22.5 56.9 -
k(13) 9.5 18.5 6.3 759.3 25.1 168.4 -
k(23) 9.4 16.6 10.6 682.3 24.7 103.5 -
k(123) 6.8 17.9 17.4 674.5 29.2 139.5 610.1
8.4. POSITION DE LA SOLUTION THORIQUE DANS LESPACE DES CRITRES115

ce critre est utilis. En outre, le tableau infrieur montre que lemploi simultan des trois
critres est prconiser pour les instances quatre sons.
Cela dit, mme si les performances par rapport au random semblent satisfaisantes en
combinant les trois critres, la frquence dappartenance au front de Pareto diminue de faon
drastique avec la taille du problme, et il y a fort parier qutant donn la marge der-
reur intrinsque aux fonctions dagrgation et le caractre exclusivement spectro-harmonique
des descripteurs utiliss, la solution thorique sorte systmatiquement du front pour les
problmes de grande taille3 . Que faut-il en conclure ? Peut-tre simplement que mesurer une
frquence dappartenance nest sans doute pas pertinent pour valuer notre approche. Nous
prfrons donc tenter de savoir si le front de Pareto, lorsquil ninclut pas la solution tho-
rique, contient au moins des solutions satisfaisantes pour lutilisateur. Ce sera lobjet de la
section 8.5. En attendant, nous cherchons estimer quelle distance du front se situe la
solution thorique.

8.4.2 La solution thorique est-elle loigne du front ?

Nous valuons dans cette section la distance au sens de Pareto entre la solution tho-
rique et le front. Nous calculons pour chaque instance de test et chaque combinaison de critres
le nombre de solutions de lespace de recherche qui dominent la solution cible. Plus ce nombre
est faible, et plus la solution cible est proche du front au sens de la dominance de Pareto.
Les rsultats de ce test sont reports dans le tableau 8.6. La statistique r50 correspond
au nombre mdian de configurations dominant la solution thorique pour chaque classe de
mixtures et chaque combinaison de critres. La mesure dom% est le pourcentage moyen de
solutions ne dominant pas la solution cible ; pour les solutions efficientes, on a : dom% = 100.
Elle se calcule de la faon suivante :

 
r
dom% = 100 1 (8.4)
#E

o r est le rang moyen de la solution cible et #E la taille de lespace de recherche.


Cette fois lintrt de lapproche multicritre nous semble plus vident. Quelle que soit
la classe de mixtures considre, le nombre de configurations dominant la solution thorique
diminue quasi-systmatiquement dun facteur 10 ds que lon passe de 2 3 critres, et dun
facteur 20 lorsquon passe du seul critre sur les MRP (le plus performant) lensemble des
trois critres. Mme si le rang de la solution thorique reste relativement lev pour les plus
grandes instances, elle est en moyenne domine par moins de 1% de lespace. Nous sommes
donc plutt satisfaits de ces rsultats au regard de la description limite du timbre laquelle
nous nous restreignons.
Nous devons toutefois nous mfier des consquences invitables de la multidimensionnalit,
voques au paragraphe 8.2.3 : la taille du front de Pareto augmente avec le nombre de
critres. En grande dimension, les solutions ont naturellement tendance tre moins domines.
Les rsultats du tableau 8.6 doivent donc tre interprts en connaissance de cause. Un test
dcoute prsent au paragraphe 8.5.3 nous confortera toutefois dans lapproche multicritre.

3
Sans doute lextension des critres des descripteurs de variation temporelle, de bruit, de rugosit, etc.,
permettrait-elle de ramener la solution thorique dans le front.
116 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Tab. 8.6 Nombre mdian de configurations dominant la solution thorique (dom% : pour-
centage de lespace ne dominant pas la solution thorique)

Mixtures monophoniques

mono-1 mono-2 mono-3 mono-4


r50 dom% r50 dom% r50 dom% r50 dom%
k1 9 84 270 83 7149 81 1215486 79
k2 10 83 277 84 6611 84 982176 82
k3 4 88 110 89 2059 88 216987 87
k12 8 86 233 83 6959 81 1064636 80
k13 6 85 201 84 6593 82 879714 80
k23 7 85 192 85 4524 85 661301 83
k123 1 97 5 99 104 99 11114 99

Mixtures polyphoniques

poly-2 poly-3 poly-4


r50 dom% r50 dom% r50 dom%
k1 582 83 38346 83 1909090 83
k2 624 83 38493 83 1852530 83
k3 157 93 5591 94 203606 95
k12 542 84 34644 84 1656381 84
k13 331 87 21212 86 864101 88
k23 324 87 17476 88 708116 89
k123 7 99 239 99 8772 99
8.5. QUALIT DES SOLUTIONS DU FRONT DE PARETO 117

8.5 Qualit des solutions du front de Pareto


Dans cette section, nous montrons que la similarti de certaines solutions du front avec
la solution thorique augmente avec le nombre de critres, et que lutilisation simultane des
trois critres garantit une pertinence plus leve des solutions efficientes. Nous introduisons
au paragraphe 8.5.2 trois heuristiques permettant didentifier des solutions du front a priori
pertinentes. Lune de ces heuristiques utilise la notion de norme induite par une configuration.
Nous lexplicitons au paragraphe suivant.

8.5.1 Norme induite par une configuration


Etant donn un point x de lespace de critres dans un problme de minimisation, les
points dominant x se situent dans lhyperparalllogramme de diagonale [0; x] (voir figure 5.2).
On se propose ici didentifier cette rgion de lespace par une proprit mtrique.
En considrant lespace de N critres comme lhyperquadrant positif dun espace mtrique
de dimension N , un hyperparalllogramme de diagonale [0; x] nest rien dautre quune boule
engendre par une norme de Tchebycheff pondre.

Dfinition 8.2. Soit la partie de [0; 1]N telle que :


X
= (1 , . . . , N ) , i = 1 (8.5)
i

Soit = (1 , . . . , N ) . La norme dfinie sur un espace de critres C, de dimension


N , par :
x C, kxk = max i xi (8.6)
i

est appele norme de Tchebycheff pondre par le jeu de poids = (1 , . . . , N ).

Dfinition 8.3. Soit x = (x1 , . . . , xN ) C un point de lespace des critres correspondant


une configuration K E de lespace de recherche. On appellera norme induite par x (ou
par K) et on notera k kx (ou k kK ) la norme de Tchebycheff vrifiant :

(i, j) {1; N }2 , i xi = j xj (8.7)

Remarque 8.2. Si toutes les coordonnes de x sont strictement positives, alors lunicit de
la norme induite par x est assure par lquation 8.5. Le calcul des poids associs la norme
induite est donn en annexe B.

Nous pouvons alors noncer les deux proprits essentielles de la norme induite :

Proprit 8.1. Soit x C un point de lespace des critres et k kx la norme induite par x
sur C. On a alors :
y C, y  x k ykx kxkx (8.8)

Dmonstration. Par construction de la norme induite, on a :

i, kxkx = i xi
118 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Par consquent :
k ykx kxkx max i yi kxkx
i
i, i yi kxkx
i, i yi i xi
i, yi xi
yx

La proprit 8.1 est fondamentale. Cest elle qui nous permettra, au chapitre 9, de trans-
former localement un problme multicritre en un problme uni-critre.

Proprit 8.2. Soit x C un point de lespace des critres et k kx la norme induite par x
sur C. k kx vrifie :
, k xk kxkx (8.9)

Dmonstration. Soit = (1 , . . . , N ) le jeu de poids associ k kx . Soit l = (l1 , . . . , lN )


et k kl la norme de Tchebycheff associe l. La condition 8.5 impose :

j {1; N }, lj j

On a alors :
lj xj j xj
lj xj kxkx
max li xi kxkx
i
kxkl kxkx

En dautres termes, k kx est, de toutes les normes de Tchebycheff pondres, celle qui
attribue x la plus petite valeur, donc celle qui permet dobtenir le meilleur rang pour x.
Cette proprit sera pour nous dun grand intrt dans linfrence des prfrences de lutili-
sateur voque au paragraphe 7.2.4. En effet, si le compositeur met une prfrence pour une
configuration K de lespace de recherche, alors la norme induite par K est celle qui reflte le
mieux cette prfrence. Le calcul des poids associs k kK peut donc nous renseigner sur
limportance relative des critres perceptifs qui a conduit au choix de K.

Remarque 8.3. La dmonstration de la proprit 5.1 tablissant lquivalence entre un pro-


blme multicritre et un ensemble de problmes mono-critre (voir section 5.7) est alors im-
mdiate. Dans le sens direct, il suffit de choisir k k = k kx et dinvoquer la proprit 8.1.
La rciproque est vidente par dfinition de la norme de Tchebycheff.

8.5.2 Trois heuristiques


Nous cherchons maintenant savoir si au moins une solution du front thorique peut tre
considre comme satisfaisante , cest--dire la fois proche de la solution cible sur le plan
sonore (dans lespace des descripteurs) et sur le plan symbolique (dans lespace de dcisions).
Nous dfinissons dans ce but trois heuristiques pour choisir automatiquement dans le front
thorique trois solutions supposs pertinentes :
8.5. QUALIT DES SOLUTIONS DU FRONT DE PARETO 119

Heuristique He : Optimum de Salukwadze. La premire ide qui vient lesprit consiste


choisir le point du front le plus proche de la solution thorique au sens de la norme eucli-
dienne dans lespace des critres. Ce point, introduit par Salukwadze dans [Sal79], est appel
optimum de Salukwadze . Bronstein [BBBK07] la rcemment utilis pour convertir des
distances multi-values en distances mono-values. Nous le notons Ke . Nous verrons par la
suite que les solutions dcouvertes par cette heuristique sont rarement pertinentes.

Heuristique H : Classement selon la norme induite. Une autre manire de choisir


une solution du front consiste tirer un rayon depuis lorigine du repre (dans lespace
des critres) vers la solution thorique et de choisir la solution du front lendroit o le
rayon intercepte ce dernier. Lhypothse sous-jacente est que les descripteurs de la solution
thorique, bien quayant t mal valus (sinon le front de Pareto la contiendrait), peuvent
nanmoins nous informer sur une direction privilgie de lespace. Cette direction est lie aux
prfrences implicites aux choix de la solution thorique comme meilleure configuration
(voir paragraphe 8.5.1). Nous faisons lhypothse quelle permet didentifier une bonne
solution dans le front. En pratique, nous choisissons la solution du front qui minimise la
norme de Tchebycheff induite par la solution thorique (voir annexe B). Nous la notons K .

Heuristique Hs : Proximit symbolique. Enfin, la troisime solution retenue est celle


qui minimise la distance symbolique avec la solution thorique. Cette distance est calcule
sur des attributs hirarchiquement ordonns selon des niveaux de dissemblances dcroissants.
Pour mesurer la distance entre deux sons, on commence par comparer leurs hauteurs, puis,
en cas dgalit, leur dynamiques, leurs familles dinstruments, leurs instruments en cas de
nouvelle galit, et enfin leurs modes de jeu. En outre, deux sons de hauteurs diffrentes seront
toujours distants dune valeur suprieure la distance entre deux sons de mme hauteur,
la proprit se transmettant par rcurrence aux niveaux de dissemblance infrieurs. Pour
comparer deux configurations, nous procdons tout dabord un alignement (au sens dune
distance ddition) de leurs lments respectifs puis sommons les distances symboliques entre
les lments appairs. Le point obtenu par cette mthode sera not Ks .

La figure 8.4 illustre ces trois heuristiques dans un cas bi-critres. La distance symbolique
tant calcule dans lespace de dcisions, Ks a donc t plac alatoirement dans lespace des
critres sur cette figure. Pour chaque classe de problmes et chaque combinaison de critres,
nous identifions dans les fronts de Pareto les solutions K , Ke et Ks laide des heuristiques
H , He et Hs , et valuons leur qualit laide des mesures suivantes :

M AD (mean audio distance) Distance euclidienne moyenne dans lespace des descrip-
teurs entre la solution thorique et la solution du front trouve par lheuristique. Les distances
associes chaque descripteur sont les fonctions de comparaison. Ainsi que mentionn la
partie 7.6, il est impossible dagrger ces distances sans connatre les prfrences de lutili-
sateur. Faute de mieux, nous exprimons donc la statistique M AD comme la norme L2 du
vecteur des distances associes chaque descripteur4 .
4
Pour calculer la statistique M AD nous utilisons systmatiquement toutes les fonctions dagrgation, et ce
quels que soient les critres utiliss. La distance ainsi obtenue est alors une distance euclidienne sur lespace
des descripteurs normaliss, dont la dimension est indpendante du nombre de critres choisis, ce qui permet
en outre des comparaisons entre des espaces de critres de dimensions diffrentes.
120 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

KT
minimisation
de distance

Ke symbolique
ne

Kl
ien
clid

Ks
T
K
eu

de
nce

n
io
ct
ista

re
di
d

en
de

nt
fro
ion

le
sat

ec
imi

av
min

n
io
ct
e
rs
te
in

Fig. 8.4 Trois heuristiques pour trouver des solutions pertinentes dans le front de Pareto
lorsque ce dernier ne contient pas la solution thorique KT . K (heuristique H ) est obtenue
par classement du front selon la norme de Tchebycheff induite par KT ; Ke (heuristique He )
par minimisation de la norme euclidienne, et Ks (heuristique Hs ) par minimisation de la
distance symbolique entre KT et le front (la position de Ks nest pas significative sur cette
figure).
8.5. QUALIT DES SOLUTIONS DU FRONT DE PARETO 121

P F M (perfect family match) Frquence laquelle la solution du front trouve par lheu-
ristique comporte exactement les mmes familles dinstruments que la solution thorique.

M F M (mean family match) Nombre moyen de familles communes la solution du front


trouve par lheuristique et la solution thorique.

P IM (perfect instrument match) Frquence laquelle la solution du front trouve par


lheuristique comporte exactement les mmes instruments que la solution thorique.

M IM (mean instrument match) Nombre moyen dinstruments communs solution du


front trouve par lheuristique et la solution thorique.

Nous reportons dans les tableaux 8.7 et 8.8 les mesures moyennes relatives aux mixtures
monophoniques et polyphoniques quatre sons.
Ces rsultats confirment tout dabord que les principaux partiels rsolus (MRP) constituent
le critre le plus pertinent dans lvaluation des configurations, puisque la distance moyenne
dans lespace des descripteurs et les mesures de proximit symbolique entre la solution du
front trouve par lheuristique et la solution thorique sont systmatiquement plus faibles
quand les partiels sont utiliss. Mais le rsultat principal est le suivant : aussi bien pour
les cibles monophoniques que polyphoniques, la qualit des solutions trouves par les
heuristiques H , He et Hs augmente avec le nombre de critres ; la distance audio moyenne
et les valeurs de similarit symbolique atteignent leurs optima lorsque les trois critres sont
considrs simultanment.
Toutefois, si cette tendance est globalement observe pour les trois heuristiques, elle est
moins marque pour la seconde dentre elles, qui choisit la solution du front la plus proche de
lorigine au sens de la norme euclidienne. Ses performances sont systmatiquement infrieures
aux deux autres heuristiques, et trois critres ne sont que de peu suprieures aux cas mono- ou
bi-critres. Loptimum de Salukwadze choisi par cette heuristique est la solution dun problme
doptimisation o tous les critres sont agrgs par une norme euclidienne. La qualit moindre
de cette solution prouve donc la supriorit dune vritable approche multicritre par rapport
ce que Talbi [Tal99] appelle la transformation vers luni-objectif.
Les mesures employes pour valuer la qualit des solutions trouves par les heuristiques
se divisent en deux catgories : lvaluation symbolique (P F M , M F M , P IM et M IM )
et lvaluation audio (M AD). Les solutions Ks obtiennent toujours de meilleurs rsultats
sur le critre symbolique et les solutions K sont toujours plus performantes sur le critre
audio, sans quaucune catgorie de solutions ne surpasse lautre sur les critres audio et sym-
boliques simultanment. Il est donc impossible a priori de dcider que lune des heuristiques
est meilleure que lautre. En revanche les solutions dcouvertes par lheuristique He sont sys-
tmatiquement battues sur les critres audio et symboliques. Il est donc permis de douter de
la pertinence de He , ce qui sera dailleurs confirm par la suite.

Nous avons donc prouv dune part que lutilisation simultane de trois critres spectro-
harmoniques pour lvaluation des configurations garantit des solutions efficientes plus proches
de la solution thorique, dautre part que ces trois critres doivent tre considrs conjointe-
ment dans une approche multicritre, et non agrgs en une seule valeur optimiser.
Il reste maintenant savoir si les solutions trouves par les heuristiques reprsentent vri-
tablement dun point de vue perceptif des propositions intressantes pour lutilisateur.
122 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Tab. 8.7 Statistiques M AD (mean audio distance), P F M (perfect family match), M F M


(mean family match), P IM (perfect instrument match), M IM (mean instrument match) pour
les trois heuristiques H , He et Hs et pour toutes les combinaisons de critres dans le cas de
mixtures monophoniques 4 sons.

Heuristique H

M AD PFM MF M P IM M IM
k(1) 0.217 16.9 % 2.89 5.1 % 2.22
k(2) 0.250 15.5 % 2.87 6.3 % 2.21
k(3) 0.243 23.9 % 3.02 10.0 % 2.41
k(12) 0.123 18.6 % 2.90 5.9 % 2.24
k(13) 0.081 23.3 % 3.00 10.0 % 2.33
k(23) 0.075 24.3 % 3.05 8.6 % 2.41
k(123) 0.046 26.9 % 3.08 12.9 % 2.49

Heuristique He

M AD PFM MF M P IM M IM
k(1) 0.217 16.9 % 2.89 5.1 % 2.22
k(2) 0.250 15.5 % 2.87 6.3 % 2.21
k(3) 0.243 23.9 % 3.02 10.0 % 2.41
k(12) 0.183 9.8 % 2.67 4.7 % 1.97
k(13) 0.164 14.3 % 2.77 6.5 % 2.15
k(23) 0.167 14.5 % 2.80 6.3 % 2.16
k(123) 0.168 9.8 % 2.59 6.1 % 1.95

Heuristique Hs

M AD PFM MF M P IM M IM
k(1) 0.217 16.9 % 2.89 5.1 % 2.22
k(2) 0.250 15.5 % 2.87 6.3 % 2.21
k(3) 0.243 23.9 % 3.02 10.0 % 2.41
k(12) 0.143 36.7 % 3.26 12.9 % 2.60
k(13) 0.122 53.1 % 3.44 26.3 % 2.89
k(23) 0.126 53.5 % 3.46 25.1 % 2.91
k(123) 0.094 72.0 % 3.70 41.2 % 3.22
8.5. QUALIT DES SOLUTIONS DU FRONT DE PARETO 123

Tab. 8.8 Statistiques M AD (mean audio distance), P F M (perfect family match), M F M


(mean family match), P IM (perfect instrument match), M IM (mean instrument match) pour
les trois heuristiques H , He et Hs et pour toutes les combinaisons de critres dans le cas de
mixtures polyphoniques 4 sons.

Heuristique H

M AD PFM MF M P IM M IM
k(1) 0.378 3.4 % 1.69 0.0 % 0.63
k(2) 0.421 2.8 % 1.63 0.2 % 0.61
k(3) 0.299 6.0 % 2.04 1.4 % 1.03
k(12) 0.310 3.4 % 1.76 0.4 % 0.71
k(13) 0.133 6.4 % 1.96 1.6 % 0.99
k(23) 0.133 7.2 % 2.00 0.4 % 0.99
k(123) 0.084 7.8 % 2.06 2.6 % 1.08

Heuristique He

M AD PFM MF M P IM M IM
k(1) 0.378 3.4 % 1.69 0.0 % 0.63
k(2) 0.421 2.8 % 1.63 0.2 % 0.61
k(3) 0.299 6.0 % 2.04 1.4 % 1.03
k(12) 0.305 5.0 % 1.87 0.2 % 0.95
k(13) 0.190 4.8 % 2.09 1.2 % 1.21
k(23) 0.216 6.0 % 2.09 1.4 % 1.28
k(123) 0.239 4.4 % 1.87 1.4 % 1.07

Heuristique Hs

M AD PFM MF M P IM M IM
k(1) 0.378 3.4 % 1.69 0.0 % 0.63
k(2) 0.421 2.8 % 1.63 0.2 % 0.61
k(3) 0.299 6.0 % 2.04 1.4 % 1.03
k(12) 0.279 10.6 % 2.31 1.0 % 1.07
k(13) 0.154 16.8 % 2.59 3.4 % 1.51
k(23) 0.175 19.0 % 2.62 4.0 % 1.54
k(123) 0.114 36.8 % 3.11 11.2 % 2.03
124 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Tab. 8.9 Test dcoute 1 : Pour chaque combinaison de critres, frquence laquelle la
meilleure solution du front de parmi K , Ke et Ks est juge satisfaisante.

mono-4 poly-4
k(1) 10 % 10%
k(2) 10 % 0%
k(3) 20 % 10%
k(12) 25 % 20%
k(13) 40 % 40%
k(23) 75 % 45%
k(123) 80 % 60%

8.5.3 Tests dcoute


Ayant puis la connaissance que nous pouvons tirer des descripteurs et des attributs dans
lvaluation de la qualit des solutions K , Ke et Ks , le seul moyen daller plus avant dans
la validation de notre approche est un test perceptif. Nous avons mis en place deux tests qui
visent dune part confirmer la supriorit de lapproche multicritre pour le problme de
lorchestration, dautre part vrifier la qualit des solutions trouves par les heuristiques
introduites la section prcdente.
Ces tests nont pas la prtention dtre de vritables tests dcoute raliss selon un proto-
cole scientifique rigoureux. Leur but nest pas de dcouvrir un mcanisme perceptif ou cognitif
particulier, mais seulement de confirmer une intuition. Ils t subis par un petit nombre de
sujets, et leurs rsultats sont interprter dans un sens exclusivement qualitatif.

Test 1 : validation de lapproche multicritre


Pour ce premier test nous avons, pour chaque combinaison de critres, gnr les trois
solutions trouves par les heuristiques H , He et Hs , et ce pour 40 instances de test choisies
alatoirement parmi les mixtures monophoniques et polyphoniques 4 sons. Pour chaque
combinaison de critres nous avons retenu parmi les solutions K , Ke et Ks celle que nous
jugions la plus proche de la cible dun point de vue perceptif. Nous avons ainsi obtenu 7
propositions par instance de test, correspondant aux 7 combinaisons de critres du tableau 8.2.
Pour chaque instance, les sujets devaient choisir la ou les (ventuellement aucune) solutions
qui lui semblaient la ou les plus proches de la cible sonore. Le but de ce test est de montrer la
supriorit de lapproche multicritre.
Les rsultats sont regroups dans le tableau 8.9. Comme on pouvait sy attendre, les
similarits sont maximales lorsque les trois critres sont considrs. Ces chiffres confirment les
statistiques de proximit audio et symboliques des tableaux 8.7 et 8.8.

Test 2 : valuation des heuristiques H , He et Hs


Dans ce second test ont t gnres les solutions trouves par les heuristiques H , He et
Hs , uniquement dans un cadre tri-critres, et ce pour 40 instances de test choisies alatoirement
parmi les mixtures monophoniques et polyphoniques 4 sons. Pour chaque instance, les sujets
devaient choisir la ou les (ventuellement aucune) solutions parmi les trois qui lui semblaient
8.5. QUALIT DES SOLUTIONS DU FRONT DE PARETO 125

Tab. 8.10 Test dcoute 2 : Les trois critres tant considrs simultanment, frquence la
quelle chacune des solutions K , Ke et Ks est juge satisfaisante. Proche : frquence laquelle
au moins une des trois solutions est proche de la cible. Trs proche : frquence laquelle au
moins une des trois solutions est trs proche la cible.

mono-4 poly-4
H 55 % 30%
He 25 % 15%
Hs 65 % 45%
Proche 100 % 80%
Trs proche 75 % 35%

les plus proches de la cible sonore, puis valuer cette similarit sur une chelle trs simple :
peu similaire, proche ou trs proche. Le but de ce test est dvaluer la pertinence des solutions
du front en multicritre.
Ce test prouve la supriorit des heuristiques H et Hs sur He . L encore, nous retrouvons
les rsultats du paragraphe prcdent. La solution Ke , qui rsulte dune transformation du
problme vers luni-objectif, est la moins pertinente. Par ailleurs, notons quau moins lune
des solutions proposes par ces heuristiques est juge proche de la cible dans une grande
proportion de cas (100 % des cas en monophonique, 80 % en polyphonique).

Nous nirons pas plus loin dans lexploitation de ces rsultats. Bien que trs informels et
raliss sur un petit nombre de sujets, ces tests nous semblent suffisants pour justifier aussi
bien lapproche multicritre que la qualit des solutions trouves.

8.5.4 Contributions relatives des critres


Dornavant convaincus que de meilleures solutions peuvent tre trouves en considrant
simultanment les trois critres dans le processus doptimisation, nous nous proposons ici de
justifier a posteriori notre approche en valuant pour diffrentes instances de test l informa-
tion apporte par chacun des critres. Le tableau 8.10 indiquant que les heuristiques H et
Hs permettent didentifier dans le front de Pareto des solutions pertinentes, nous calculons
donc, pour les fronts trois critres et pour chaque instance de test, les jeux de poids associs
la norme induite (voir section 8.5.1 et annexe B) par les solutions K et Ks . Le poids associ
un critre peut tre interprt comme limportance de ce dernier dans le choix de la solution.
Ces poids calculs, nous estimons, sur la base des frquences auxquelles ils surviennent, les
probabilits des vnements suivants :

A : wsc > wM RP Le poids associ au centrode spectral est suprieur au poids associ
aux partiels.
B : wsc > 0.5 Le poids associ au centrode spectral est suprieur 0.5 (son rle est
dterminant dans le choix de la solution).
C : wss > wM RP Le poids associ ltendue spectrale est suprieur au poids associ
aux partiels.
126 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

D : wss > 0.5 Le poids associ ltendue spectrale suprieur 0.5 (son rle est dter-
minant dans le choix de la solution).
E : wM RP < 0.5 Le poids associ aux partiels est infrieur 0.5 (le rle des moments
spectraux est dterminant dans le choix de la solution).

A partir des probabilits observes, nous pouvons dduire les intervalles de confiance pour
les probabilits relles de ces vnements en inversant un test de Student. Ce test permet de
confronter une probabilit observe P (X) = p une probabilit thorique P (X) = pt . Sous
lhypothse nulle H0 : P (X) = pt , alors la statistique :
|p pt |
t= p n (8.10)
p(1 p)
suit une loi normale centre rduite. Etant donn une probabilit observe P (X) = p, nous en
dduisons lintervalle de confiance au niveau pour la probabilit thorique :
r
p(1 p)
pt = p t (8.11)
n
Les bornes infrieures des intervalles de confiance au niveau 0.01 sont reportes dans le
tableau 8.11. Globalement, les probabilits des vnements A, C, D, E et dans une moindre
mesure B sont loin dtre ngligeables. Les cas sont donc nombreux dans lequels les partiels
ninterviennent pas de faon majeure dans lvaluation des solutions. Nous justifions ainsi
lemploi simultan de plusieurs critres spectro-harmoniques. Une analyse plus fine mrite
toutefois de distinguer les heuristiques employes.
Lorsque la solution de lheuristique H est retenue, les probabilits des vnements sont
indpendantes de la taille du problme et ne dpendent que du caractre monophonique ou
polyphonique des cibles. Si la solution obtenue par lheuristique H est la plus pertinente,
cela signifie que les coordonnes de la solution thorique dans lespace des critres donnent la
bonne direction doptimisation (voir figure 8.4). Autrement dit, les erreurs dans lestimation
des descripteurs de la solution thorique sont toutes du mme ordre de grandeur, a fortiori
faible. En consquence, il y a fort a parier que cette dernire est relativement proche de la
frontire de Pareto. Dans ce cas, si lestimation des descripteurs est correcte pour tous les
critres, il est normal que les partiels apportent lessentiel de linformation dans 60 % des cas,
comme en atteste les probabilits moyennes de lvnement E.
En revanche, lorsque lheuristique Hs donne une meilleure solution, alors la position de
la solution cible dans lespace des critres ne donne pas la bonne direction doptimisa-
tion. Nous pensons que ce faux cap est d des erreurs destimation diffrentes selon les
descripteurs. La difficult du calcul des principaux partiels rsolus (notamment cause des
phnomnes de masquage) permet de faire lhypothse que les MRP de la solution thorique
ont t mal valus. En consquence, leur importance relative dans lidentification dune so-
lution pertinente dans le front est diminue. Cest bien ce que confirme la lecture du tableau
infrieur, en particulier pour les mixtures polyphoniques, pour lesquelles la probabilit que le
poids associ aux partiels soit infrieur 0.5 augmente fortement avec la taille du problme.
Dans les cas o Ks est une solution meilleure que K , les MRP ne permettent donc pas de
lidentifier, et sont peu peu relays par les moments spectraux qui interviennent alors des
fins de robustesse dans lvaluation des solutions. Pour les cibles monophoniques toutefois,
limportance des partiels augmente avec la taille du problme, sans doute car leur valuation
est plus aise (les phnomnes de masquage interviennent peu dans ces cas).
8.5. QUALIT DES SOLUTIONS DU FRONT DE PARETO 127

Tab. 8.11 Bornes infrieures des intervalles de confiance au niveau 0.01 pour les probabilits
thoriques des vnements A : wsc > wM RP , B : wsc > 0.5, C : wss > wM RP , D : wss > 0.5 et
E : wM RP < 0.5.
Heuristique H

Pinf (A) Pinf (B) Pinf (C) Pinf (D) Pinf (E)
mono-1 0.209 0.098 0.237 0.114 0.419
mono-2 0.213 0.101 0.228 0.110 0.398
mono-3 0.183 0.072 0.240 0.109 0.405
mono-4 0.174 0.056 0.225 0.107 0.416
poly-2 0.152 0.055 0.176 0.082 0.325
poly-3 0.164 0.075 0.155 0.056 0.308
poly-4 0.163 0.055 0.201 0.094 0.333

Heuristique Hs

Pinf (A) Pinf (B) Pinf (C) Pinf (D) Pinf (E)
mono-1 0.262 0.154 0.270 0.126 0.476
mono-2 0.333 0.179 0.343 0.215 0.502
mono-3 0.377 0.241 0.407 0.255 0.606
mono-4 0.174 0.056 0.225 0.107 0.416
poly-2 0.305 0.180 0.335 0.199 0.509
poly-3 0.454 0.298 0.480 0.289 0.695
poly-4 0.590 0.382 0.541 0.327 0.808
128 CHAPITRE 8. VALIDATION SUR UNE DESCRIPTION RDUITE

Conclusion
Nous concluons ici quant au caractre bien pos du problme de lorchestration formul
comme une tche doptimisation multicritre avec trois critres spectro-harmoniques a priori
non indpendants : le centrode spectral linaire, ltendue spectrale linaire, et les principaux
partiels rsolus. Afin de prouver la validit de cette formulation, nous avons gnr 3500 mix-
tures monophoniques et polyphoniques comprenant entre 1 et 4 sons. Chacune de ces mixtures
a t considre comme la cible dun problme dorchestration particulier, avec contraintes de
hauteurs, de capacit et de cardinalit. Pour chaque problme, le front de Pareto (les solutions
du problme multicritre) a t extrait aprs un parcours exhaustif de lespace de recherche, et
ce pour diffrentes combinaisons de critres. Lenjeu tait de vrifier si les solutions thoriques
de chaque problme taient pertinentes, savoir proches de la mixture cible. Cette tude
notamment montr :
quaugmenter le nombre de critres augmente la probabilit de trouver la solution tho-
rique dans le front de Pareto ;
quaugmenter le nombre de critres diminue la portion de lespace dominant la solution
thorique ;
que les solutions du front thorique sont dautant plus proches de la cible que le nombre
de critres est lev, et ce aussi bien en termes symboliques que descriptifs et perceptifs ;
enfin, que malgr une slectivit ingale des critres spectraux, les critres a priori mi-
neurs peuvent apporter une information prvalante dans lidentification dune bonne
solution, et que lemploi simultan de critres non indpendants permet souvent dva-
luer de manire plus robuste les solutions.

Nous nous autorisons donc dsormais poser le problme de lorchestration comme une
tache doptimisation combinatoire multicritre. Convaincus que les solutions des fronts de Pa-
reto sont pertinentes pour le compositeur, nous pouvons ds lors nous consacrer la recherche
dalgorithmes permettant de dcouvrir ces solutions en un temps raisonnable.
Chapitre 9

Algorithme dorchestration

Modlisation orchestre pour la gestion des contraintes de capacit


Crossover et mutation pour lorchestration
Poids alatoires, fonctions scalarisantes de Tchebycheff
Directions doptimisation et prfrences dcoute

Nous prsentons dans ce chapitre un algorithme gntique adapt au problme de lorches-


tration. Notre choix sest port sur ce type dapproche lexclusion de mtaheuristiques
plus rcentes pour au moins trois raisons :
1. Les AGs font lobjet dune littrature abondante et on t employs avec succs dans
des situations trs varies. En outre, la thorisation des AGs constitue, depuis le dbut
des annes 90, un courant de recherche majeur (voir notamment Cerf [Cer94] et Amiot
& Durand [AD05]).
2. Les oprateurs de croisement (voir paragraphe 5.5) rpondent une vision intuitive de la
recherche de combinaisons, en manipulant les sous-ensembles. Ils permettent ainsi de g-
nrer, partir dorchestrations existantes, de nouvelles combinaisons en mlangeant
les plans sonores . Soient par exemples deux orchestrations {A, B} et {C, D} affi-
chant de bonnes valeurs de fitness, o A et C (respectivement B et D) dsignent des
mlanges impliquant les mmes groupes dinstruments. Il semble alors naturel de tes-
ter les configurations {A, D} et {C, B}, dductibles des premires par application dun
crossover. Si seule la configuration {A, D} est bien value, on peut alors en conclure
que les plans sonores B et C ne sont pas dun grand intrt. En revanche, mergent et
persistent au cours de la recherche les sous-ensembles localement optimaux. En outre,
le compositeur satisfait avec une orchestration {a, b, c, d} mais convaincu de pouvoir
mieux faire cherchera naturellement dans un voisinage : {a0 , b, c, d}, {a, b0 , c, d}, etc.
Dans le langage des AGs, il ralisera donc une mutation.
3. Enfin, la non-linarit et la non-diffrentiabilit de certaines fonctions dagrgation (voir
annexe A) ne permettent pas davoir recours des mthodes traditionnelles doptimisa-
tion telles que la descente de gradient par exemple.

9.1 Un problme de sac dos ?


Nous avons vu, la section 7.6, que lespace de recherche E du problme de lorchestration
tait isomorphe {0; 1}Ns , o Ns est la taille de la connaissance instrumentale. Il nous faut

129
130 CHAPITRE 9. ALGORITHME DORCHESTRATION

donc trouver un sous-ensemble I de {0; 1}Ns tel que la mixture compose des lments dindices
i I maximise la similarit perceptive avec la cible orchestrer, et ce dans la limite des
capacits instrumentales.
Ainsi formul, le problme de lorchestration sapparente fort un problme de sac dos
binaire [MT90] (Binary Knapsack Problem KP-O/1 ), dans lequel il sagit de remplir un
sac laide dobjets de poids (pi ) et dutilits (ui ) en maximisant lutilit totale, sans excder
la capacit C du sac :
P
max z(x) = xi ui
(KP-0/1) s.t. x P i {0; 1} (9.1)
xi p i C

Si la similitude apparente entre les deux problmes1 laisse supposer le caractre N P de


lorchestration telle que dfinie en 7.4 (le problme du sac--dos tant lui-mme N P), elle ne
permet pas en revanche de r-utiliser pour la rsolution du premier les mthodes propres au
second. Trois raisons cela :

1. Dans le cas de lorchestration, lutilit dun lment dpend des lments dj prsents
dans la configuration. Lajout dun trombone brassy na par exemple pas le mme
effet dans un alliage mezzo-fote de cordes que dans un accord de cuivres jou fortissimo.
2. Lutilit dune configuration ne peut pas tre dfinie comme la somme des utilits de
ses composantes. Pour sen convaincre, remarquons simplement que lajout dun lment
dans une configuration peut trs bien en dgrader la qualit.
3. Les contraintes instrumentales dans le cas de lorchestration ne se ramnent pas une
unique capacit C, mais un vecteur de capacits dont chaque lment reprsente la
quantit de chaque instrument dans lorchestre considr.

Notons toutefois quil existe une variante du problme du sac dos, connue sous le nom de
Multiple Container Knapsack Problem, dans laquelle le sac est divis en plusieurs conteneurs
de capacits variables. Nous tirons parti de la modlisation de ce problme dans la section
suivante.

9.2 Modlisation et encodage


Soit (si )1iNs la connaissance instrumentale du systme dont une orchestration reprsente
un sous-ensemble. Soit (cj )1jNI le vecteur des effectifs instrumentaux, o NI est le nombre
total dinstruments prsents dans (si ), et cj le nombre doccurrences de linstrument j dans
lorchestre. Soit Dj la partie de {1, ..., Ns } associe linstrument j, i.e. (si )iDj sont les sons
de la base associs linstrument j. Soit enfin R la matrice des allocations instrumentales,
dfinie par :

1 si i Dj
i {1, ..., Ns }, j {1, ..., NI }, Rji =
0 sinon

1
Le caractre uni-critre de problme 9.1, en regard de laspect multicritre de lorchestration, ne doit pas
remettre en cause cette similitude. Il existe dailleurs une formulation multicritre du problme du sac dos.
9.2. MODLISATION ET ENCODAGE 131

Le problme dorchestration multicritre (POMC) se formule alors comme un problme de


minimisation sous contraintes linaires :
min DTdk (x) = DTdk (x1 , . . . , xNs )



k = 1, . . . , K

(POMC) (9.2)

s.t. xi {0; 1}
RxC

Nous rappelons que DTdk (x) est la fontion de comparaison entre la cible T et un configuration
x pour le descripteur dk (voir dfinition 7.6 et proprit 7.1).

Encore une fois, la formulation 9.2 incite considrer le problme de lorchestration comme
un problme de sac dos multicritre conteneurs multiples. Mais, comme nous lavons dit au
paragraphe prcdent, la non-linarit (et plus particulirement la non-additivit) des fonctions
objectifs minimiser ne peut que nous en dissuader. Aussi sduisant soit-il, le cadre formel
du sac dos nest pas assez souple pour supporter la complexit des mlanges de timbres.
Les variables de dcision du problme 9.2 sont binaires : xi = 1 si et seulement si lchan-
tillon si de la base de donnes est retenu dans lorchestration, 0 sinon. On serait donc facilement
tent davoir recours la technique dencodage la plus rpandue dans les algorithmes gn-
tiques, qui consiste reprsenter les solutions par des chanes binaires (bit-string encoding),
ici de longueur Ns . Trois raisons sopposent ce choix :
1. La taille du problme. Nous travaillons actuellement avec un rservoir denviron 5000
sons. Pour une population de 1000 individus, lencodage du type bit-string implique donc
le stockage et la mise jour rcurrente dune matrice 5 millions dlments. Mme si
cela reste encore acceptable, la taille mmoire deviendra vite une limite sitt que nous
travaillerons avec davantage de sons et des populations potentiellement plus grandes.
2. Le petit nombre ditems impliqus dans une solution. Dans notre problme
dorchestration au maximum une petite centaine de sons (dans le cas de trs grands
orchestres) seront choisis parmi plusieurs milliers, occasionnant une frquence trs faible
de valeurs gales 1 dans la matrice reprsentant la population. On pourrait certes
choisir davoir recours une reprsentation parcimonieuse des donnes, mais cela ne
rsout pas le problme des contraintes multiples de capacit (cf. infra).
3. La multiplicit des contraintes de capacit. Dans le problme du sac dos, la
seule contrainte est la capacit globale du sac. La gestion des solutions inconsistantes
produites au cours des gnrations fait en gnral appel une mthode de rparation
de type glouton qui retire rcursivement les lments les plus volumineux jusqu
ce que la contrainte de capacit soit satisfaite ; ventuellement, des items plus petits
peuvent alors tre insrs dans le sac sil reste de la place. En orchestration, il y a
autant de contraintes de capacit que de type dinstruments, soit onze contraintes pour
linstrumentarium actuellement disposition, et leur respect exige le recours autant
de procdures de rparation. Autant donc chercher une reprsentation qui permette de
sen affranchir.
Compte tenu de ces remarques nous optons pour un encodage en N -uplets dentiers. Soit
(si )1iNs un ensemble de sons instrumentaux reprsentatifs dun orchestre de taille N . Une
solution K E est alors reprsente par un N -uplet i = (i1 , ..., iN ) valeurs dans D1 ...DN .
Chaque domaine Dk est dfini par :
Dk = Dk {e} , (9.3)
132 CHAPITRE 9. ALGORITHME DORCHESTRATION

o e est llment neutre, indiquant que linstrument k nest pas impliqu dans lorchestration,
et Dk la partie de {1, ..., n} associe linstrument k, i.e. (si )iDk sont les sons de la base
associs linstrument k.
En outre, afin dviter les doublons dencodage (i.e. deux gnomes diffrents exprimant la
mme solution) nous imposons la condition suivante, trs facilement satisfaite laide dun tri
par parties aprs chaque gnration dune solution :

(k, l) {1, ..., N }2 t.q. Dk = Dl , (k < l) (ik < il ) (9.4)

Formulation 9.1. Le problme de lorchestration formul en 7.4 et 9.2 se rcrit alors en un


problme doptimisation combinatoire sans contraintes :
Variables : i1 , ..., iN
Domaines : D1 , ..., DN
Critres : k {1, ..., K}, min DTdk (i) = DTdk (i1 , . . . , iN )

Remarque 9.1. Grce cette reprsentation des solutions (qui se confond strictement avec
leur encodage gntique), une configuration est donc dfinie comme un ensemble de couples
variable/valeur dont chaque variable correspond un instrument j de lorchestre, valeurs
dans Dj . On notera D = D1 ... DN , quivalent E et {0; 1}Ns

Remarque 9.2. Comme nous le verrons au paragraphe suivant, les oprateurs gntiques
sont stables sur D. Toute configuration gnre alatoirement ou produite par une opration
gntique est donc, par dfinition, consistante avec les contraintes de capacit (i.e. lie aux
effectifs instrumentaux de lorchestre).

En dautres termes, le problme de lorchestration ainsi reformul est non contraint. Nous
verrons au chapitre 10 de quelle manire les ventuelles contraintes autres que celles de capacit
peuvent tre prises en compte au sein de lalgorithme de recherche.

9.2.1 Oprateurs gntiques


Dans notre algorithme dorchestration, nous utilisons le crossover uniforme et la mutation
monopoint, ou 1-mutation. La figure 9.1 donne un exemple de ces oprations dans le cas dun
quatuor cordes.

Dfinition 9.1. Soient i = (i1 , . . . , iN ) et j = (j1 , . . . , jN ) deux chromosomes parents de


D = D1 ... DN . Les rejetons k et l du crossover uniforme sont des N -uplets vrifiant :

kn = in ln = jn ou
n {1, . . . , N }, (9.5)
kn = jn ln = in

En pratique, les rejetons sont engendrs par interversion alatoire des coordonnes des chro-
mosomes parents.

Remarque 9.3. Lquation 9.5 certifie que si (i, j) D2 (i.e. i et j reprsentent deux configu-
rations consistantes avec les contraintes de capacit), alors (k, l) D2 (le crossover uniforme
est stable sur D).
9.2. MODLISATION ET ENCODAGE 133

Vn1 non-vibrato B5+ p non-vibrato B5+ p


Vn2 sul-tasto Eb5+ mf
Alt sul-ponticello D4 f sul-ponticello D4 f
Vc non-vibrato G3 f non-vibrato G3 mf

Vn1 art-harm B6 p art-harm B6 p


Vn2 sul-tasto Eb5+ mf
Alt sul-ponticello D4 f sul-ponticello D4 f
Vc non-vibrato G3 mf non-vibrato G3 f

Crossover uniforme

Vn1 art-harm B6 p non-vibrato B5+ p


Vn2
(a)
Alt sul-ponticello D4 f sul-ponticello D4 f
Vc non-vibrato G3 mf non-vibrato G3 mf

art-harm B6 p

(b)
sul-ponticello D4 f

art-harm B6 p
sul-tasto Eb5+ mf
(c)
sul-ponticello D4 f
non-vibrato G3 mf

1-mutation
(a) substitution - (b) dltion - (c) insertion

Fig. 9.1 Oprateurs gntiques pour lorchestration (cas dun quatuor cordes). La case
vide (en gris) dsigne llment neutre.
134 CHAPITRE 9. ALGORITHME DORCHESTRATION

Lorsque deux chromosomes parents sont recombins non pas par un crossover uniforme,
mais, comme cest souvent le cas, par un crossover monopoint (voir figure 5.5, les gnes loi-
gns ont plus de chances dtre spars par le crossover que les gnes voisins dans la chane
(voir Whitley [Whi93]). Cette proprit est parfois souhaitable dans le cas de reprsentations
binaires chantillonnant un espace de dcisions valeurs relles, pas dans le cas de lorchestra-
tion. Considrons par exemple un quatuor cordes reprsent par des quadruplets (violon1,
violon2, alto, violoncelle), comme il en va sur la figure 9.1. Le crossover monopoint spa-
rera toujours le premier violon du violoncelle, et maintiendra toujours lun des duos (violon1,
violon2) ou (alto, violoncelle). En dautres termes, le potentiel exploratoire du crossover mo-
nopoint dpend de lordre dans lequel les instruments de lorchestre sont encods dans les
chromosomes. Le crossover uniforme nimplique quant lui aucune de ces restrictions, raison
pour laquelle nous le prfrons pour lorchestration.

Dfinition 9.2. Soit i = (i1 , . . . , iN ) un chromosome parent de D = D1 ... DN . La


mutation monopoint (ou 1-mutation) de i engendre un chromosome j dfini par :

n {1, . . . , N }, in = jn
!m {1, . . . , N }, (9.6)
jm Dm \ {im }

En pratique, j est engendr par modification dune seule variable m, la nouvelle valeur tant
choisie dans le domaine associ Dm . La mutation monopoint est donc stable sur D.

Les domaines associs chaque variable contenant llment neutre e (voir section 9.2),
la mutation monopoint peut donc prendre la forme soit dune substitution, soit dune instan-
ciation de variable (insertion) soit dune dsinstanciation (dltion). La figure 9.1 illustre ces
trois types de mutation.

9.3 Calcul de fitness


Dans notre algorithme dorchestration la fitness (i.e. ladaptabilit dun individu son
environnement) est calcule laide de fonctions scalarisantes de Tchebycheff, car cette ap-
proche est en lien direct avec notre problmatique dinfrence des prfrences dcoute du
compositeur (voir sections 7.2.4 et 8.5.1). A chaque itration de lalgorithme, la population
est value avec un jeu de poids diffrent, donc selon des prfrences dcoute diffrentes. Si
= (1 , . . . , K ) est le jeu de poids courant, la fitness courante dun point x de lespace
des critres est donne par :
f (, x) = max k xk ,
1kK

o (x1 , . . . , xK ) sont les coordonnes rduites de x, permettant de saffranchir des diffrentes


chelles de valeurs prises par chacun des critres (voir section 5.7).
Lorsque lalgorithme se termine, le compositeur peut, sil le dsire, relancer la recherche
partir dune solution efficiente courante. La direction de recherche est alors fige par la
norme induite par la solution choisie (cf. section 8.5.1). Le mme algorithme est utilis, cette
fois-ci avec les poids associs la norme induite, dterministes et invariants. La direction
doptimisation fixe, le problme devient alors mono-critre. Grce lapproche par fonctions
scalarisantes, la mthode permettant d affiner une solution intermdiaire nest donc pas
conceptuellement diffrente de lalgorithme de recherche globale . Seul change le caractre
des poids : ils ny sont plus alatoires, mais fixs par le choix intermdiaire du compositeur. Il
9.4. MAINTIEN DE LA DIVERSIT 135

y a quivalence entre le choix dune solution et le choix dune fonction scalarisante (ou dune
direction doptimisation).
En un sens, le but de la recherche multicritre est ici de trouver la bonne fonction
scalarisante pour un problme dorchestration donn. Notons que grce cette approche, le
seul fait de rendre les poids alatoires ou dtermins permet de commuter entre un problme
multicritre et un problme mono-critre.

9.4 Maintien de la diversit


Dans notre algorithme dorchestration, le calcul de fitness nest pas affect par la densit
locale. En revanche, cette dernire est utilise pour rduire la taille de la population ds que
celle-ci dpasse une valeur limite Nmax . Les individus sont alors itrativement retirs des zones
les plus denses jusqu ce que la taille de la population atteigne de nouveau Nmax . Une fois
identifie le sous-ensemble de densit maximale, le retrait dun individu peut se faire de trois
manire diffrentes :
1. random : on retire un individu au hasard.
2. pareto : on retire au hasard un individu domin au sein du sous-ensemble. Si aucun
lment du sous-ensemble nen domine un autre, le retrait est alatoire.
3. fitness : on retire lindividu de plus faible fitness selon la fonction scalarisante courante.
La densit locale est value par la mthode PADE (Population size Adaptive Density Es-
timation) prsente la section 5.8 : lespace de critre est dcoup par une hypergrille
dont les caractristiques (dimensions, nombre de cellules) sont dtermines par les valeurs de
critres de la population courante, et la densit de chaque individu est gale au nombre de
configurations qui partagent la mme cellule que lui.
Nous obtenons ainsi la procdure decrease_PADE (voir algorithme 3) qui permet de ramener
une population une cardinalit infrieure tout en prservant sa diversit :

Algorithme 3 Rduction de population par prservation de la diversit (decrease_PADE)


Arguments: Une population X = {x1 , x2 , . . .} associe une partie C = {c1 , c2 , . . .} de lespace
de critres, une taille maximale Nmax , une mthode dlimination method (random, pareto, ou
fitness)

1: tant que #X > Nmax faire


2: D calculer la densit PADE de C
3: I argmax(D)
4: si method = random alors
5: i choisir aleatoirement un lment dans I
6: sinon si method = pareto alors
7: i choisir aleatoirement un lment domin dans I
8: sinon si method = fitness alors
9: i choisir llment de plus faible fitness dans I
10: fin si
11: X X \ {xi }
12: C C \ {ci }
13: fin tant que
136 CHAPITRE 9. ALGORITHME DORCHESTRATION

9.5 Pseudo-code
Lalgorithme que nous prsentons ici permet dobtenir, en un temps raisonnable, une ap-
proximation du front de Pareto associ tout problme pouvant tre ramen la formula-
tion 9.1. Grce la modlisation propose au paragraphe 9.2, les contraintes de capacit (i.e.
les restrictions imposes par les effectifs instrumentaux de lorchestre) sont toujours satisfaites.
Cette version de lalgorithme aborde donc des problmes exclusivement non contraints. Son
extension des problmes assortis de contraintes supplmentaires est lobjet du chapitre 10.
La qualit de lapproximation retourne par notre algorithme est value au chapitre 11.
Lalgorithme 4 est un AG inspir de lalgorithme MOGLS (Multi-Objective Genetic Local
Search) de Jaszkiewicz [Jas01] [Jas02] pour son approche de loptimisation multicritre par
tirage alatoire de fonctions sclarisantes (voir sections 5.7 et 9.3). Dans lalgorithme MOGLS,
une seule configuration est obtenue chaque gnration par crossover, avant dtre amliore
par une mthode de recherche locale (il sagit en loccurence dune simple descente) selon la
fonction scalarisante en cours. La nouvelle configuration remplace alors, dans la population, la
configuration de moins bonne fitness. La partie gntique de MOGLS peut donc tre considre
comme un moyen de gnrer la configuration initiale dun algorithme de descente pour lequel
la fonction optimiser est chaque fois diffrente.
Ishibushi et Murata [IY02] font observer que dans cette classe dalgorithmes dit hy-
brides la partie gntique tient un rle dexploration alors que la recherche locale est
dvolue lintensification de la recherche. Les auteurs constatent par ailleurs quen gnral
la majorit du temps de calcul est absorbe par la recherche locale, et recommandent, pour
une performance optimale des mthodes hybrides, dviter ce dsquilibre. Soucieux de privil-
gier dans un premier temps lexploration de lespace de recherche au profit de lintensification
dans une zone particulire, nous avons donc choisi dlibrment de ne pas implmenter de
recherche locale dans notre algorithme dorchestration. Ce parti pris va lencontre des rsul-
tats de Ishibushi et Murata [IY02], selon lesquels la mthode MOGLS sans recherche locale
est moins performante que le SPEA de Zitzler & Thiele [ZT98b] [ZT98a] [ZT99]. Rappelons
toutefois que le but premier de notre algorithme est de dcouvrir une configuration intres-
sante pour le compositeur, rvlatrice de ses prfrences en termes dcoute du timbre (voir
section 7.2). Si cette configuration nest pas pleinement satisfaisante, elle permet au moins
didentifier la fonction scalarisante la plus pertinente pour un problme donn, selon laquelle
une intensification de la recherche (voir paragraphe 9.3) pourra toujours tre mene par la
suite. Pas de recherche locale dans cet algorithme donc, mais, comparativement MOGLS,
un plus grand nombre de configurations engendres par les oprateurs gntiques chaque
gnration.
Lalgorithme 4 prend en arguement une cible orchestrer T . Une population initiale de
pop
taille Ninit est gnre par instanciation alatoire des variables, avec une probabilit dinstan-
ciation gale 0.55. Ainsi, chaque configuration de la population initiale mobilise en moyenne
un peu plus de la moiti de la ressource orchestrale.
A chaque gnration, un sous-ensemble de la population (de taille Nmate ) est slectionn
par tournoi binaire, dont la supriorit sur les autres mthodes de slection a t voque
au paragraphe 5.6. Deux individus sont tirs alatoirement dans la population courante, et
le meilleur des deux selon la fonction scalarisante en cours est retenu dans le bassin de re-
production. Cette opration est rpte jusqu ce que le bassin atteigne la taille Nmate . Les
oprations de crossover et mutations sappliquent alors sur les lments du bassin, et les nou-
veaux individus sont intgrs la population courante.
9.5. PSEUDO-CODE 137

Algorithme 4 Algorithme dorchestration


pop pop pareto
Arguments: Une cible dorchestration T , les paramtres de population Ninit , Nmax , Nmate , Nmax ,
un nombre maximal ditrations itermax .
pop
1: X gnrer une population alatoire de taille Ninit
2: C valuer_population(X, T )
3: P extract_pareto_set(C) // (algorithme 1)
4: iter 1
5: tant que iter itermax faire
6: C valuer_population(X, T )
7: tirer un jeu de poids // (selon la formule 5.8 de Jaszkiewicz )
8: f kCk
9: M slectionner Nmate individus dans X par tournoi binaire selon f
10: O crossover(M )
11: O 1-mutation(O)
12: CO valuer_population(O, T )
13: X X O
14: P update_pareto_set(CO , O) // (algorithme 2)
pareto
15: si #P > Nmax alors
pareto
16: P decrease_PADE(P, Nmax , random) // (gestion de la taille de lapproximation
par lalgorithme 3)
17: fin si
pop
18: si #X > Nmax alors
19: X X \P
20: C valuer_population(X, T )
21: f kCk
pop
22: X decrease_PADE(X, Nmax #P, f ) // (gestion de la taille de la population do-
mine : on retire les individus domins les moins adapts pour la fitness courante)
23: X X P
24: fin si
25: iter + +
26: fin tant que
27: retourner P
138 CHAPITRE 9. ALGORITHME DORCHESTRATION

pop
Si la taille de la population dpasse une valeur limite Nmax , la procdure decrease_PADE
est invoque pour liminer les individus situs dans les zones les plus denses. La diversit de la
population dans lespace des critres est ainsi prserve (voir sections 9.4 et 5.8). En pratique,
on retire itrativement les individus de densit locale maximale et de moins bonne fitness selon
la fonction scalarisante en cours. Afin dviter de retirer des solutions de lapproximation
courante, lchantillonnage de la population par la procdure decrease_PADE ne sapplique
quaux solutions domines.
A chaque gnration, lapproximation courante est mise jour par lalgorithme 3
pareto
(update_pareto_set). Si la taille de cette dernire dpasse une valeur limite Nmax , la pro-
cdure decrease_PADE est invoque. Lalgorithme se termine lorsque le nombre de gnrations
atteint itermax .

9.6 Extension aux modles dinstruments


Dans lalgorithme 4, la procdure valuer_population dsigne lapplication squentielle,
sur les configurations valuer, des fonctions dagrgation et fonctions de comparaison (voir
paragraphes 7.3 et 7.6). Lintgration future dans notre systme des travaux de Damien Tar-
dieu [TR07] sur les modles dinstruments (introduits au paragraphe 7.1.2) ne remet pas en
cause le droulement de lalgorithme dorchestration : la procdure valuer_population
renvoie alors une mesure probabiliste des configurations, entirement calcule par les modles
instrumentaux. Lindpendance des mthodes dvolution et dvaluation permet de commuter
aisment entre une approche par descripteurs (la ntre) et une approche par modles (celle
de Damien Tardieu).
Chapitre 10

Gestion des contraintes

Tous les attributs supportent des contraintes


CDCSolver : une mthode de rparation des configurations inconsistantes
Un nouvel algorithme dorchestration sous contraintes
Contrle de lvolution temporelle laide de contraintes

Nous prsentons dans ce chapitre une mthode efficace pour la gestion, dans un problme
dorchestration, de contraintes autres que celles lies leffectif instrumental (voir chapitre
9). Nous commenons par numrer un ensemble de contraintes N -aires portant sur les attri-
buts des configurations, puis montrons quelles se rpartissent en deux catgories : contraintes
de design et contraintes de conflit. Nous introduisons alors lheuristique de recherche locale
CDCSolver, qui sappuie sur cette dichotomie pour trouver en un temps acceptable une confi-
guration consistante avec lensemble du rseau de contraintes. CDCSolver est valu par com-
paraison avec un algorithme alatoire sur des problmes de petite taille et de difficult variable.
Nous terminons avec lintgration de CDCSolver dans lalgorithme dorchestration.

10.1 Contraintes en orchestration


10.1.1 Contraindre la recherche pour mieux lorienter
La notion gnrique de contrainte a t introduite au paragraphe 7.5. Nous lavions alors
dfinie comme une condition que doivent satisfaire les attributs dune configuration. Rappelons
qu la diffrence des descripteurs, qui caractrisent le timbre selon une dimension perceptive,
les attributs sont les paramtres symboliques de lcriture musicale (instrument, note, mode
de jeu, dynamique, sourdine. . .). Les contraintes portes sur les attributs ne restreignent donc
lespace des timbres quindirectement, en limitant les possibilits combinatoires dans lespace
des attributs (ou espace des dcisions voir section 7.6).
La contrainte la plus vidente imaginer est la contrainte de capacit, lie aux limitations
de leffectif orchestral : si lorchestre ne comprend par exemple que deux violons, lattribut
instrument ne pourra prendre la valeur violon quau plus deux fois, sans quoi la solu-
tion nest pas ralisable. Le caractre incontournable des contraintes de capacit nous a fait
adopter au paragraphe 9.2 une modlisation du problme permettant de sen affranchir. Une
orchestration est reprsente par un N -uplet donc chaque coordonne correspond un instru-
ment prcis de lorchestre, si bien quune configuration obtenue par instanciation alatoire des
variables ou par une opration gntique (voir section 9.2.1) est toujours consistante avec les

139
140 CHAPITRE 10. GESTION DES CONTRAINTES

contraintes de capacit. Dune faon plus gnrale, on dira que la consistance est garantie pour
toute contrainte de cardinalit maximale place sur lattribut instrument , quelle que soit
la valeur de ce dernier. Mais, nous allons le voir, il existe bien dautres types de contraintes,
portant sur dautres attributs.

Notre exprience avec les compositeurs au cours de notre recherche dune part, et celle plus
gnrale des contraintes en composition assiste par ordinateur dautre part, nous enseignent
qu lexception des problmes de composition entirement formalisables par la PPC1 , il est
trs difficile de spcifier des contraintes en dehors dun contexte musical. Imaginons le cas
dun compositeur dsirant orchester une srie daccords et disposant dj de lorchestration
du premier. Selon le degr de contraste dsir chaque changement daccord, on peut imposer
pour laccord courant davoir au plus ou au moins un certain nombre de notes communes avec
le prcdent. Aussi rudimentaire soit-il, laccord initial constitue dj un contexte : cest ici
un point de dpart, ce sera ailleurs un point de passage, ou un point darrive. Contraindre
une orchestration , cest donc dj penser le matriau musical dans sa mise en temps, dans ses
relations temporelles aux autres objets musicaux. Or notre outil dorchestration a t conu
comme un environnement hors temps dexploration du timbre : il produit une matire, un
objet brut que le compositeur devra polir avant de linsrer dans la composition. De
fait, dans la grande majorit des cas, tous les problmes dorchestration commencent sans
contraintes.
Bien souvent toutefois, les critiques faites aux suggestions dorchestration dans le cas o
elles ne satisfont pas le compositeur portent certes sur leurs proprits timbrales, mais aussi
sur leurs attributs : telle hauteur est prsente dans la cible et manque dans lorchestration,
tel mode de jeu est inaudible en prsence dinstruments jouant fortissimo, telle sourdine est
ncessaire, la densit harmonique (i.e. le nombre de hauteurs diffrentes joue simultanment)
est trop faible ou trop forte, lorchestration mobilise une trop grande ou trop petite proportion
de lorchestre, etc. La possibilit dajouter des contraintes sur les attributs est alors bienvenue
pour guider la recherche vers des solutions plus pertinentes. Certes ces contraintes ne
viennent pas spontanment au compositeur, mais elles surgissent en raction aux solutions
libres retournes par le systme. Dun certain point de vue, on peut dire quelles viennent
combler les carences ventuelles de la description du timbre (voir section 8.1) qui, dans certains
cas, ne suffit pas pour dcouvrir les solutions les plus proches de la cible au sens perceptif.

10.1.2 Langage lmentaire de contraintes


Dun point de vue formel, nous dfinissons donc une contrainte par la donne dun attribut,
dun oprateur, et deux lments optionnels :

<attribut><oprateur ><quantit (opt.)><valeur (opt.)>

En thorie, nimporte quel attribut est recevable : instrument, famille, hauteur, mode de jeu,
dynamique, sourdine, corde. . . si cela bien sr a un sens musicalement. Quant aux oprateurs,
ils se rpartissent en trois catgories selon le nombre darguments supplmentaires quils re-
quirent, comme lindique le tableau 10.1.
Loprateur all-diff associ un attribut A signifie que toutes les composantes de lorches-
tration doivent avoir des valeurs diffrentes pour lattribut A.
1
Les problmes de sries dintervalles, de suites daccords ou de canons rythmiques, pour nen citer que
quelques uns, appartiennent cette catgorie voir ce sujet la thse de Charlotte Truchet [Tru04].
10.1. CONTRAINTES EN ORCHESTRATION 141

Tab. 10.1 Oprateurs darit variable exprimant des contraintes sur les attributs des confi-
gurations.
Oprateur Argument 1 Argument 2
all-diff - -
at-most-diff quantit n -
at-least-diff quantit n -
at-most quantit n valeur v
at-least quantit n valeur v

Ex.1 Lorchestration ne doit jamais impliquer deux fois la mme hauteur scrit :
<attribut=note><oprateur =all-diff >

Loprateur at-most-diff (respectivement at-least-diff ) associ un attribut A et une quan-


tit n signifie que lorchestration doit comporter au plus (respectivement au moins) n valeurs
diffrentes pour lattribut A.
Ex.2 Lorchestration doit impliquer au minimum trois cuivres scrit :
<attribut=famille><oprateur =at-least-diff ><quantit=3><valeur =brass>

Ex.3 Tous les instruments doivent jouer avec la mme dynamique scrit :
<attribut=dynamique><oprateur =at-most-diff ><quantit=1>

Loprateur at-most (respectivement at-least) associ un attribut A, une quantit n et une


valeur v signifie que lorchestration doit comporter au plus (respectivement au moins) n fois
la valeur v pour lattribut A.
Ex.4 Au moins deux cordes doivent jouer avec le bois de larchet scrit :
<attribut=mode-de-jeu><oprateur =at-least><quantit=2><valeur =legno-tratto>

Ex.5 Au plus deux instruments peuvent jouer fortissimo scrit :


<attribut=dynamique><oprateur =at-most><quantit=2><valeur =ff >

Ces cinq oprateurs permettent de dfinir un langage de contraintes simple, expressif, et


facilement extensible par lajout de nouveaux attributs. On pourrait trs bien imaginer, par
exemple, un attribut qui prcise quel instrumentiste est requis pour mettre le son considr.
Tous les sons de flte, flte basse et flte picolo peuvent en effet tre produits par un fltiste.
Si lorchestre nen comprend quun seul, alors la contrainte :
<attribut=instrumentiste><oprateur =at-most><quantit=1><valeur =fltiste>

permet deffectuer la recherche avec tous les sons de flte tout en garantissant quun seul son
sera compris dans lorchestration. Le mme raisonnement est videmment valable pour les
clarinettistes, trompettistes, trombonistes, saxophonistes et percussionnistes, qui peuvent tre
amens changer dinstrument au cours dune mme uvre.
Nous avons en outre pourvu notre langage de deux oprateurs de cardinalit globale : size-
min et size-max. Comme leur nom lindique, ils permettent de minorer ou de majorer le nombre
142 CHAPITRE 10. GESTION DES CONTRAINTES

Tab. 10.2 Contraintes de cardinalit globale

Oprateur Argument 1 Argument 2


size-min quantit n -
size-max quantit n -

dinstruments impliqus dans une orchestration. Ces oprateurs sont dun grand intrt lorsque
le compositeur veut augmenter la masse orchestrale ou au contraire rserver une partie de
lorchestre pour un matriau musical se superposant la texture propose par loutil.
Pour les raisons voques au dbut de cette section, les contraintes lies lexcution
i.e. au droulement de la musique dans le temps ne sont pas prises en compte au sein de
notre systme. Modliser le potentiel sonore des instruments hors de tout contexte temporel
est une tche difficile, mais abordable du moins partiellement dans le cadre dune
thse. Matriser les possibilits denchanement de timbres ralisables par un instrument solo
est dune complexit bien suprieure, et ne parlons mme pas de linfinit de variations que
peut produire un orchestre. Nous verrons cependant en fin de chapitre de quelle manire les
contraintes peuvent tre utilises pour transformer progressivement une orchestration, sans
toutefois disposer dune formalisation temporelle du timbre. Lvolution sera alors contrle
non pas par des descripteurs perceptifs, mais par les attributs symboliques des configurations
successives.

10.1.3 Fonctions de cot

La notion de fonction de cot a t introduite au paragraphe 7.5. Elle sappuie sur


le concept de contraintes molles (soft constraints) avec lequel les mthodes de recherche
locale sont famillires (voir paragraphe 6.4.1) : chaque contrainte est remplace par une fonc-
tion de cot positive que lon cherche minimiser. Cette dernire est nulle si et seulement
si la contrainte est satisfaite, et de valeur dautant plus leve que la contrainte est vio-
le. Lide sous-jacente est quon a dautant plus de chance de parvenir une configuration
consistante que la configuration initiale viole peu les contraintes. En dautres termes, nous
supposons la fonction de cot globale, obtenue par sommation des fonctions de cot associes
aux contraintes, est localement monotone.

Nos fonctions de cot ne dpendent que de loprateur impliqu dans la contrainte : at-
most, at-least, at-most-diff, at-least-diff, all-diff, size-min, size-max. Nous les construisons selon
la rgle suivante : elles renvoient le nombre minimum de variables modifier pour que la
contrainte soit satisfaite. Elles sont calcules partir de la reprsentation des configurations
introduites la section 9.2 : chaque variable correspond un instrument, et chaque valeur
un son jouable par linstrument. Une requte pralable dans une base de donne permet
de retourner, pour chaque son, la valeur de lattribut impliqu dans la contrainte avant den
calculer la consistance. Dans la suite de cette section, nous dsignons respectivement par n et
v les premier et second arguments ventuels de nos oprateurs.
10.1. CONTRAINTES EN ORCHESTRATION 143

at-most, at-least
Soit nv le nombre de fois o apparait la valeur v dans la configuration (effectif de la valeur
v). On a alors trivialement, pour les oprateurs at-least et at-most :
zat-least = max(nv n, 0) et zat-most = max(n nv , 0) (10.1)

at-least-diff
Soit maintenant nA le nombre total de valeurs que peut prendre lattribut A et (ni )1inA
les effectifs des valeurs prises par A. Soit la fonction indicateur de R+ ((x) = 1 si x > 0,
(x) = 0 sinon). La fonction de cot pour loprateur at-least-diff compte le nombre de valeurs
diffrentes pour lattribut A et renvoie la diffrence avec la quantit limite n si cette dernire
et suprieure :
nA
!
X
zat-least-diff = max n (ni ), 0 (10.2)
i=1

at-most-diff
De faon non intuitive, la fonction de cot pour at-most-diff nest pas la symtrique de la
prcdente. Soit par exemple la contrainte :
<attribut=note> <oprateur =at-most-diff > <quantit=1>
(Tous les instrument doivent jouer la mme note)
Soient alors les deux configurations K1 = (C4,A4,C4,A4) et K2 = (C4,C4,C4,A4) (seules
les hauteurs ont t mentionnes par souci de lisibilit. Si on compte le nombre de valeurs
diffrentes pour lattribut A et que lon renvoie sa diffrence avec la quantit limite n si
cette dernire est infrieure, on obtient alors z(K1 ) = z(K2 ) = 1. Autrement dit, il ny a
aucun intrt pour un algorithme de recherche locale remplacer A4 par C4 pour la seconde
variable, alors que K2 est plus proche de satisfaire la contrainte que K1 (il faut modifier une
seule variable dans K2 contre deux dans K1 ).
Soit (ni )1inA la permutation de (ni )1inA pour laquelle les effectifs sont classs dans
lordre dcroissant, ce qui donne (2, 2) pour K1 et (3, 1) pour K2 . On a alors :
nA
X
zat-most-diff = ni , (10.3)
i=n+1

ce qui donne z(K1 ) = 2 et z(K2 ) = 1.

all-diff
Quant loprateur all-diff, lide la plus immdiate consiste retourner leffectif maximal
moins 1. Toutefois, si nous considrons les deux configurations K1 = (C4,A4,C4,A4) et K2 =
(C4,G4,C4,A4), on obtient pour la contrainte all-diff sur les hauteurs les valeurs de cot
z(K1 ) = z(K2 ) = 1. Encore une fois, un algorithme de recherche locale naura donc aucun
intrt remplacer A4 par G4 pour la seconde variable, alors que K2 est plus proche de
satisfaire la contrainte que K1 . Alors quavec la foncion :
nA
X
zall-diff = (ni 1)(ni 1) , (10.4)
i=1
144 CHAPITRE 10. GESTION DES CONTRAINTES

on obtient z(K1 ) = 2 et z(K2 ) = 1.

size-min, size-max
Soit n le nombre de variables dont la valeur est diffrente de llement neutre e (voir
section 9.2). On a alors trivialement :

zsize-min = max(n n , 0) et zsize-max = max(n n, 0) (10.5)

Consistance globale
Comme la plupart des mthodes de recherche locale, notre algorithme favorise dans
ces dplacements les configurations de consistance maximale pour lensemble du rseau de
contraintes. Lvolution dans lespace de recherche est donc guide par une fonction de cot
globale , que nous dfinissons comme la somme des fonctions de cot associes chaque
constrainte. Elle peut sinterprter une estimation du nombre de variables modifier pour
parvenir une solution satisfaisant toutes les contraintes.

10.2 Contraintes de design, contraintes de conflit


La mthode CDCSolver est une heuristique de recherche locale permettant de rsoudre
les problmes de satisfaction de contraintes formaliss laide du langage simple introduit
la section 10.1.2. Comme toute mthode de recherche locale, CDCSolver dispose dune
heuristique de voisinage qui chaque configuration associe un sous-ensemble de lespace de
recherche, parmi lequel sera choisie la nouvelle configuration. Le voisinage est dtermin de
manire amliorer la consistance globale de la solution courante. Dans lalgorithme de re-
cherche adaptative (Codognet & Truchet [CD01] [CDT02] [Tru04]), prsent la section 6.5
et dont sinspire en partie CDCSolver, le voisinage est construit en remplaant la variable
implique dans le plus grand nombre de contraintes par toutes les valeurs de son domaine.
Hlas, cette stratgie nest pas directement applicable notre problme. Il est en effet une
difficult inhrente aux contraintes globales : on ne peut, par dfinition, identifier prcisment
sur quelles variables elles portent. Si une contrainte est viole, il nest pas possible de dcider
a priori des variables modifier pour la satisfaire. Nous verrons toutefois au paragraphe sui-
vant quun calcul de complexit raisonnable permet de choisir une variable prioritaire. Cette
dernire dpendra avant tout du type de contrainte rencontre :
soit la contrainte porte sur une incompatibili entre les valeurs de diffrentes variables :
on parlera alors de contrainte de conflit, et lon cherchera rduire la fonction de cot
associe en modifiant une variable dont la valeur est diffrente de llment neutre ;
soit la contrainte dfinit une caractristique dsire dans la solution : on parlera alors de
contrainte de design, et lon cherchera rduire la fonction de cot associe en modifiant
une variable dont la valeur est gale llment neutre.
Au sein dune mthode de rsolution manipulant des instanciations partielles (i.e. des
configurations o les variables ne sont pas toutes instancies), une contrainte de conflit peut
tre rsolue par dsinstanciation dune variable. Lheuristique CN -tabou (Vasquez & Dupont
[VHD03]) introduite la section 6.6 sappuie sur ce principe pour traiter des contraintes bi-
naires. A chaque tape de lalgorithme, la configuration courante est une instanciation partielle
et localement consistante (les variables instancies ne violent aucune contrainte). Les conflits
10.2. CONTRAINTES DE DESIGN, CONTRAINTES DE CONFLIT 145

potentiellement engendrs par linstanciation dune nouvelle variable sont alors rsolus par ds-
instanciation des variables incompatibles avec la nouvelle valeur. Lalgorithme sarrte lorsque
toutes les variables sont instancies.
Dun point de vue plus abstrait, on peut donc dire que lheuristique CN -tabou permet de
traiter des problmes dfinis par un ensemble de contraintes de conflit et par une contrainte
de design exigeant que toutes les variables doivent tre instancies. Lalgorithme avance dans
la rsolution en diminuant la fonction de cot associe la contrainte de design (i.e. en
instanciant des variables), tout en sadaptant la vole aux contraintes de conflit qui surgissent
des nouvelles instanciations.

Lalgorithme CDCSolver (Conflict/Design Contraint Solver ) gnralise ce principe toute


containte de design ou de conflit. Nous proposons pour cela une extension des notions
dinstanciation partielle et de consistance locale :
Dfinition 10.1. Soit un CSP dfini par la donne dun ensemble de variables et de do-
maines associs, et de contraintes N -aires distinguables en contraintes de design et contraintes
de conflit. On dira quune configuration est partiellement instancie si et seulement si
au moins une contrainte de design nest pas satisfaite. On dira quune configuration est
localement consistante si et seulement si elle vrifie toutes les contraintes de conflit.
A partir dune configuration initiale inconsistante, lalgorithme CDCSolver modifie itra-
tivement les variables impliques dans les contraintes de conflit (nous verrons au paragraphe
suivant comment ces variables sont choisies) jusqu lobtention dune instantiation partielle
localement consistante. Ensuite, une variable dont la valeur est gale llment neutre (ce
qui, dun point de vue musical, correspond un silence pour linstrument associ) est modi-
fie de manire rduire les violations des contraintes de design. Ce processus est ritr ds
quune contrainte de conflit est viole (on peut alors parler de propagation des affectations),
jusqu lobtention dune configuration consistante avec lensemble des contraintes. Un m-
canisme de mmoire court-terme de type tabou [GL97] permet en outre dviter les cycles
dans la recherche et de sortir des minima locaux (voir paragraphe 6.4.1).

N.B. Dans un contexte dorchestration, une configuration dont certaines variables ont pour
valeur llment neutre (cest--dire, dun point de vue musical, un silence) nest en aucun
cas une instanciation partielle. Il nest en effet prcis nulle part que tous les instruments
disponibles doivent tre mobiliss dans une orchestration. Ce sont au contraire les variations
de leffectif instrumental et des plans sonores qui, au cours du temps, crent la richesse du
timbre orchestral. En cela, lorchestration se distingue des problmes classiques pour lesquels
il ny a en gnral pas dlment neutre. Dans le problme des N -reines par exemple, une
configuration dans laquelle la position dune reine nest pas dtermine nest videmment pas
recevable. A lextrme inverse, une configuration constitue uniquement dlments neutres
est une solution, certes inintressante, mais admissible pour un problme dorchestration sans
contraintes de design : le silence total ne peut pas violer de contrainte de conflit. Encore une
fois, la notion d instanciation partielle na de sens quen prsence de contraintes de design.
Dans la plupart des CSP classiques, il ny en a quune seule : toutes les variables doivent tre
instancies.

Le tableau 10.3 recense lensemble des oprateurs introduits au paragraphe 10.1.2 et les
rpartit en fonction du type de contrainte quils induisent. Notre langage de contraintes pour
lorchestration peut ainsi tre tendu de deux manires :
146 CHAPITRE 10. GESTION DES CONTRAINTES

Tab. 10.3 Classification des oprateurs par type de contrainte

Contraintes de design Contraintes de conflit


at-least at-most
at-least-diff at-most-diff
size-min size-max
all-diff

soit, nous lavons mentionn en infra, par lajout de nouveaux attributs ;


soit par lajout de nouveaux oprateurs, ds lors quils sidentifient lun des deux types
de contraintes design ou conflit et quils saccompagnent dune fonction de cot
conforme (i.e. propotionnelle au niveau de violation de la contrainte, et dans lidal
renvoyant le nombre minimal de variables modifier pour la satisfaire).

10.3 CDCSolver
Dans cette section, nous nous concentrons sur la dimension thorique de lheuristique
CDCSolver et en exposons les mcanismes au travers des notions gnriques de contraintes de
design et contraintes de conflit, indpendamment des oprateurs dfinis en supra.
Nous avons dtaill, au chapitre 6, deux mthodes rcentes de recherche locale pour la
rsolution de problmes de satisfaction de contraintes : la recherche adaptative et lheuris-
tique CN -tabou. La premire manipule des configurations totalement instancies et utilise
une projection des contraintes sur les variables pour choisir celle modifier en priorit.
La seconde garantit en permanence une consistance locale sur des instanciations partielles.
Lorsquune nouvelle valeur est assigne une variable libre, linstancation est propage en
dsaffectant les variables en conflit.
Lalgorithme CDCSolver combine les deux mthodes. A partir dune configuration incon-
sistante, on commence par modifier ou dsinstancier en les remplaant par llment neutre
les variables impliques dans les contraintes de conflit. Lorsque ces dernires sont toutes
vrifies, une variable libre est alors instancie de manire rduire les contraintes de design.
Les affectations se poursuivent soit jusqu la satisfaction de lensemble des contraintes, soit
jusqu lapparition de nouveaux conflits. Dans ce dernier cas, le processus prcdent est rpt
tant quun nombre maximal ditrations na pas t dpass. A chaque mouvement, une heu-
ristique permet de dterminer la variable modifier en premier (dans le cas dune contrainte
de conflit) ou instancier en priorit (dans le cas dune contrainte de design). Contrairement
la recherche adaptative, il nest pas possible de comptabiliser le nombre de contraintes violes
dans lesquelles intervient chaque variable, en raison du caractre global de nos contraintes.
Nous procdons alors de la manire suivante :
Si une contrainte de conflit est viole dans la configuration courante K, alors nous calcu-
lons la consistance pour toutes les configurations obtenues partir de K en remplaant
tour tour chaque variable instancie par llment neutre. La configuration de cot
minimal correspond alors la variable modifier en priorit (voir algorithme 5).
Si une contrainte de design est viole dans la configuration courante K, alors nous calcu-
lons la consistance pour toutes les configurations obtenues partir de K en remplaant
10.3. CDCSOLVER 147

tour tour chaque variable libre par une valeur alatoire de son domaine. La confi-
guration de cot minimal correspond alors la variable instancier en priorit (voir
algorithme 6). Si aucune variable nest libre, le choix seffectue par dsinstanciation,
selon la mthode applique aux variables de conflit.
Dans les deux cas, la valeur de la variable modifie est remplace par toutes les autres du
domaine, et la configuration de cot global minimal est retenue comme configuration courante.

Algorithme 5 Modification de la pire variable conflictuelle (change_worst_variable)


Arguments: Une configuration initiale K = (x1 , . . . , xN ), une fonction de cot z.

1: pour i {1, . . . , N } faire


2: si xi 6= e alors
3: Ki (x1 , . . . , xi1 , e, xi+1 , . . . , xN )
4: zi z(Ki )
5: sinon
6: zi
7: fin si
8: fin pour
9: i argmin zi
10: pour xji Di \ {xi } faire
11: Kj (x1 , . . . , xi 1 , xji , xi +1 , . . . , xN )
12: zj z(Kj )
13: fin pour
14: j argmin zj
15: retourner Kj

Cycles et minima locaux

Le fonctionnement de CDCSolver (voir algorithme 7) est donc bas sur une alternance de
mthodes change_worst_variable et instanciate_best_variable. Bien souvent, ces dernires
ont des objectifs contradictoires : remplacer une variable affecte par llment neutre permet
de soulager les contraintes de conflit, au risque de violer davantage de contraintes de design
(et vice-versa). Lalgorithme peut donc rapidement se retrouver enferm dans un cycle d
la prsence dun minimum local dans la fonction de cot (voir section 6.4.1). Pour viter ce
problme, CDCSolver dispose dune mmoire court terme de type tabou . Cette technique
propose par Glover [GL97] consiste stocker dans une liste FIFO dite liste tabou
les dernires configurations visites. Lors de lexploration du voisinage courant, le mouvement
ne peut se faire vers une configuration de la liste tabou.
En pratique on se contente souvent, pour viter davoir rechercher une configuration
passe dans une liste potentiellement longue, de marquer tabou la dernire variable modi-
fie ; on ne pourra alors pas changer cette variable tant quelle demeurera dans la liste tabou.
CDCSolver utilise une version dynamique de ce principe : lorsquune variable est modifie,
elle est marque tabou pour un nombre ditrations gal au nombre de fois o la variable a
dj t modifie depuis le dbut de lexcution. Ce mcanisme, utilis par Vasquez & Dupont
[VHD03] dans lheuristique CN -tabou, permet de sadapter en cours dexcution la longueur
des cycles engendrs par le paysage de la fonction de cot.
148 CHAPITRE 10. GESTION DES CONTRAINTES

Algorithme 6 Instanciation de la meilleure variable libre (instanciate_best_variable)


Arguments: Une configuration initiale K = (x1 , . . . , xN ), une fonction de cot z.

1: pour i {1, . . . , N } faire


2: si xi = e alors
3: xri une valeur alatoire de Di
4: Ki (x1 , . . . , xi1 , xri , xi+1 , . . . , xN )
5: zi z(Ki )
6: sinon
7: zi
8: fin si
9: fin pour
10: si min zi = alors
11: K change_worst_variable(K)
12: retourner K
13: sinon
14: i argmin zi
15: pour xji Di faire
16: Kj (x1 , . . . , xi 1 , xji , xi +1 , . . . , xN )
17: zj z(Kj )
18: fin pour
19: j argmin zj
20: retourner Kj
21: fin si

Dans notre algorithme, seules les variables non tabou peuvent donc tre modifies. Cette
restriction est forte, car elle interdit dexplorer de nombreuses configurations nayant pas encore
t visites. La technique habituellement utilise pour contrecarrer cet effet est laspiration : si
la modification dune variable marque tabou permet datteindre une valeur de cot inf-
rieure celle de la meilleure configuration obtenue jusqualors, le statut tabou est exception-
nellement rvoqu. En pratique, les mthodes change_worst_variable et change_best_variable
commencent par essayer de modifier une variable marque tabou . Si laspiration nest pas
justifie, le voisinage non tabou est alors explor.
Pour des raisons de lisibilit, les oprations lies la gestion des statuts tabou ne
figurent pas dans les algorithmes 5, 6 et 7.

Complexit

Soient N le nombre de variables (i.e. le nombre dinstruments dans lorchestre), d le nombre


moyen de valeurs dans chaque domaine Di et p le nombre de contraintes dans un problme
dorchestration. A chaque itration de CDCSolver, le calcul de la variable modifier nces-
site au plus N p oprations (procdures change_worst_variable ou change_best_variable et
engendre un voisinage de d 1 configurations sur lesquelles la consistance doit tre calcule
chaque fois, soit (d 1)p oprations. La complexit chaque itration de CDCSolver est donc
dans le pire cas en O((N + d 1)p).
Dans lalgorithme de recherche adaptative, lidentification de la variable modifier ne
dpend que des valeurs des p contraintes calcules sur la configuration en cours, soit un calcul
chaque tape en O(dp). La complexit de CDCSolver est donc lgrement suprieure, mais
10.3. CDCSOLVER 149

Algorithme 7 Rparation des configurations inconsistantes (cdcsolver)


Arguments: Une configuration initiale K, une fonction de cot z.

1: Kbest K
2: iter 1
3: tant que iter < itermax faire
4: tant que K viole au moins une contrainte faire
5: tant que K viole au moins une contrainte de conflit faire
6: K change_worst_variable(K)
7: si z(K) z(Kbest ) alors
8: Kbest K
9: fin si
10: iter + +
11: fin tant que
12: si K viole au moins une contrainte de design alors
13: K instanciate_best_variable(K)
14: si z(K) z(Kbest ) alors
15: Kbest K
16: fin si
17: iter + +
18: fin si
19: fin tant que
20: fin tant que
21: retourner Kbest

reste du mme ordre de grandeur que la recherche adaptative, le paramtre N tant dans tous
les cas major par la taille des plus gros orchestres.

Intgration de la fitness dans la fonction de cot

La fonction de cot z dans lalgorithme 7 est par dfaut la somme des fonctions de cot as-
socies chaque contrainte du rseau. A chaque mouvement, lalgorithme se dplace donc vers
la configuration du voisinage courant qui viole le moins les contraintes. Si plusieurs choix sont
possibles, la nouvelle configuration est choisie alatoirement, sans se soucier de ses proprits
timbrales (i.e. de ses valeurs de descripteurs).
Dans un contexte doptimisation multicritre, on pourrait trs bien dcider de choisir, au
sein du voisinage courant de consistance maximale (i.e. de fonction de cot minimale), une
solution non-domine. Cela ncessiterait toutefois un grand nombre de comparaisons de valeurs
chaque mouvement. En revanche, il existe un cas de figure dans lequel les poids relatifs des
critres intervenant dans les fonctions scalarisantes de Tchebycheff (voir sections 5.7 et 9.3)
sont connus : lorsquaprs une premire excution de lalgorithme, le compositeur choisit une
solution intermdiaire pour relancer la recherche (voir section 13.3) ou pour la transformer
laide de contraintes (voir sections 10.6 et 13.3), alors les poids ne sont plus alatoires, mais
dduits des valeurs de critres de cette solution (voir annexe B). La recherche devient alors
mono-critre, guide par une fonction scalarisante unique.
Nous avons dans ce cas tout intrt considrer, en plus de la consistance, la valeur de
fitness pour guider les mouvements de CDCSolver. Lors de lexploration du voisinage cou-
rant, la nouvelle configuration sera celle de meilleure fitness parmi les configurations les plus
150 CHAPITRE 10. GESTION DES CONTRAINTES

consistantes (i.e. de cot minimal). Il suffit pour cela de modifier la fonction de cot z dans
les mthodes change_worst_variable ou change_best_variable ainsi que dans lalgorithme
principal : en rajoutant z la valeur de fitness, on obtient une fonction de cot qui favo-
rise les configurations les plus consistantes, tout en pnalisant, niveau gal de violation de
contraintes, les configurations de plus grande fitness (i.e. les moins adaptes).
Quand cela est possible, CDCSolver prend donc sa charge une partie de loptimisation.
La recherche profite alors de la complmentarit entre les mthodes de recherche locale et les
mthodes population.

10.4 Evaluation
Lalgorithme CDCSolver a t valu laide sur des problmes de petite taille. Nous
rutilisons ici les cibles polyphoniques quatre sons construites la section 8.2 et utilises
dans lensemble du chapitre 8 pour valider notre approche thorique de lorchestration sur une
description rduite du timbre instrumental.
Rappelons que ces cibles ont t construites de manire satisfaire trois types de
contraintes, cela afin de rduire suffisamment lespace de recherche pour pouvoir en calcu-
ler lensemble des possibilits en un temps acceptable :
Contraintes de cardinalit : les cibles sont des mixtures impliquant exactement quatre
instruments.
Contraintes de hauteur : les cibles sont des mixtures comprenant quatre notes diffrentes
dans un intervalle de deux octaves.
Contraintes de capacit : les cibles sont des mixtures nutilisant quune seule fois le mme
instrument.
Chaque cible ainsi construite induit un espace de possibilits, que nous avons choisi de res-
treindre par un orchestre constitu dun seul instrument de chaque type ; les contraintes de
capacit y sont donc toujours vrifies, grce la modlisation adopte dans le chapitre prc-
dent. En outre, nous excluons de cet ensemble de possibilits toute configuration ne compre-
nant pas exactement quatre instruments. Ces deux limitations nous permettent de rutiliser
les espaces de recherche patiemment calculs au chapitre 8 pour chaque mixture cible.

N.B. Les mixtures dont nous nous servons dans cette valuation nont ici pas dintrt en
tant que cibles (i.e. comme objectifs dun problme doptimisation), mais parce quelles sont
lies des espaces de possibilits dj calculs et qui peuvent tre dfinis par deux contraintes
et un filtre : contraintes de cardinalit (lespace se limite aux combinaisons de quatre instru-
ments), contraintes de capacit (on ne peut pas avoir deux fois le mme instrument dans une
combinaison), et filtre sur les hauteurs (lespace de recherche est limit aux sons dont la hau-
teur appartient celle de la mixture cible ce nest quau cours de la recherche proprement
dite que la condition davoir exactement toutes les notes de la cible dans la solution deviendra
une contrainte).

A chaque cible correspond donc un ensemble de configurations dj calcules et satisfaisant


une contrainte de cardinalit. Les contraintes de capacits tant implicitement satisfaites par
la reprsentation mme des combinaisons, nous nen ferons plus mention dans cette section.
Pour chaque cible, lensemble ainsi dfini va alors pouvoir constituer lespace de recherche
dun problme de satisfaction de contraintes sur lequel valuer lalgorithme CDCSolver. Nous
10.4. EVALUATION 151

appelerons dsormais cet ensemble espace de rfrence de niveau 2 car il est dfini laide
de deux contraintes de cardinalit :

<attribut=><oprateur =size-min><quantit=4><valeur =>


<attribut=><oprateur =size-max><quantit=4><valeur =>

A partir de cette espace de rfrence, nous construisons des sous-ensembles inclus les uns
dans les autres par ajout successif de contraintes supplmentaires mentionnes dans le tableau
10.4 (chaque niveau est donc dfini par toutes les contraintes des niveaux infrieurs). Cette
opration est rpte pour toutes les mixtures polyphoniques quatre sons : notre base de
test dnombre donc 500 instances de problmes, comprenant chacune 5 niveaux de difficult
croissante (de 3 7) par rapport aux espaces de recherche (ensembles de rfrence de niveau
2). CDCSolver a donc t excut 2500 fois dans ce processus dvaluation.

Tab. 10.4 Contraintes utilises pour lvaluation de CDCSolver

Niveau Description
2 Exactement quatre instruments dans lorchestration
3 Les quatre notes de la cible prsentes dans lorchestration
4 Les instruments sont tous de familles diffrentes
5 Au moins un violoncelle dans lorchestration
6 Au plus deux dynamiques diffrentes
7 Au plus un mode de jeu ordinario

Tab. 10.5 Evaluation de CDCSolver : taille des ensembles de solutions

Niveau Nombre moyen Proportion


de solutions // niveau 2
2 2.3 108 100.00%
3 2.0 107 8.78%
4 705880 0.31%
5 230700 0.10%
6 120360 0.05%
7 14927 0.01%

Le tableau 10.5 donne une ide de la taille moyenne des ensembles consistants pour chaque
niveau de contrainte. Il permet de se faire une ide de la difficult du problme : pour le niveau 6
par exemple, seules 0.05% des configurations du niveau 2 sont consistantes. La probabilit de
tirer au hasard une solution est donc denviron 1 sur 2000. Une mthode de recherche purement
alatoire ou un algorithme generate-and-test (voir paragraphe 6.3.1) dcouvriront une solution
au bout de 2000 itrations en moyenne.
Les performances comparatives de CDCSolver par rapport un algorithme alatoire (ran-
dom) sont reportes dans le tableau ??. La dernire colonne montre que plus la difficult du
problme augmente, plus la performance relative de CDCSolver est leve.
152 CHAPITRE 10. GESTION DES CONTRAINTES

Tab. 10.6 Performances de CDCSolver compares un algorithme purement alatoire (les


configurations sont values selon leur niveau de violation de contrainte).

Niveau Taux moyen Nombre moyen Random Performance


de russite ditrations // random
3 100.00% 5.0 12.2 2.6
4 99.90% 19.4 403 26.0
5 99.30% 41.1 1115 32.1
6 99.50% 38.3 2104 67.0
7 95.50% 102.8 19469 264.1

Dans cette valuation, lalgorithme CDCSolver ne pouvait excder 500 itrations. Dans
plus de 99 % des cas pour les problmes de niveau infrieur ou gal 6, et dans plus de 95 % des
cas pour le niveau 7, une configuration consistante a t trouve en moins de 500 itrations. Le
nombre moyen ditrations bien infrieur 500 pour lensemble des niveaux de difficult montre
que la lgre dgradation des performances pour les problmes de niveau 7 peut tre impute
des instances particulirement difficiles pour lesquelles davantage ditrations auraient t
ncessaires.

Nous avons vu la section 10.3 que le mouvement vers une configuration du voisinage
courant pouvait tre dtermin de deux manires :
soit en choisissant une configuration non tabou qui minimise la somme des fonctions de
cot associes aux contraintes ;
soit en choisissant, parmi les configurations non tabou qui minimisent la somme des
fonctions de cot associes aux contraintes, celle de fitness minimale, sous rserve que
celle-ci soit calculable (i.e. quun jeu de poids ou une fonction scalarisante soit
spcifi pour lagrgation des contraintes en une valeur unique).
Nous avons galement test les performances de CDCSolver dans ce second cas de figure,
en donnant pour fonction scalarisante la norme induite (voir section 8.5.1 et annexe B) par
chaque solution thorique (i.e. la configuration qui reproduit exactement lorchestration utilise
comme mixture cible voir section 8.3).

Tab. 10.7 Performances de CDCSolver (les configurations sont values selon leur niveau
de violation de contrainte et sur leur fitness).

Niveau Taux moyen Nombre moyen Random Performance


de russite ditrations // random
3 100.00% 4.9 12.2 2.6
4 100.00% 16.6 403 25.2
5 100.00% 32.1 1115 36.4
6 100.00% 31.5 2104 69.1
7 96.60% 57.6 19469 356.6
10.4. EVALUATION 153

Les performances avec fitness sont reportes dans le tableau 10.7. Encore une fois, ces
dernires augmentent (relativement au hasard) avec la difficult du problme. Autre phno-
mne notable, les taux moyens de russite (dcouverte dune solution consistante) et le nombre
moyen ditrations sont meilleurs lorsque les critres audio interviennent dans lvaluation des
configurations. La fitness semble donc apporter une information supplmentaire pour diminuer
le niveau de violation des contraintes. Cest a priori surprenant, car la fitness est calcule
laide de la norme induite par la solution thorique du problme doptimisation, laquelle na
a priori aucune raison de satisfaire les contraintes du tableau 10.4. Toutefois, remarquons que
par construction des cibles de test, les solutions thoriques sont toujours consistantes jusquau
niveau 3. Or les contraintes dfinissant le troisime niveau figurent (avec celles des niveaux
4 et 7) parmi les plus dlicates satisfaire : il faut dans le pire cas modifier trois variables
pour obtenir la consistance. Faire intervenir la fitness dans lvaluation des configurations per-
met donc peut-tre, en favorisant (en principe) les mouvements vers la solution thorique, de
satisfaire plus facilement la contrainte sur les hauteurs.

Tab. 10.8 Amlioration de fitness avec CDCSolver dans le cas o les valeurs de critres
interviennent dans lvaluation des configurations.

Niveau Fitness moyenne Fitness moyenne Amlioration


initiale finale
3 0.2706 0.1430 45.96%
4 0.2857 0.1337 50.53%
5 0.2800 0.1161 55.27%
6 0.2856 0.1403 47.35%
7 0.2751 0.1599 37.04%

Le tableau 10.8 montre en outre que lorsque les valeurs de critres audio sont prises en
compte dans lvaluation du voisinage, CDCSolver amliore de faon significative la fitness
dune configuration alatoire inconsistante. Lalgorithme peut donc combiner la fois rpara-
tion et affinage des configurations. Cette observation est pour nous dun double intrt :
1. Dans un cas dorchestration sous contraintes, lorsque lalgorithme est relanc partir
dune solution intermdiaire juge pertinente par le compositeur (voir sections 9.3 et
13.3), le processus doptimisation est pris en charge la fois par lalgorithme gntique
et par CDCSolver. La complmentarit dune mthode population et dune mthode
de recherche locale (voir section 5.3) contribue alors lefficacit du processus global.
2. Lorsque CDCSolver est utilis pour transformer graduellement une solution dorchestra-
tion laide de contraintes (voir sections 10.6 et 13.3), le mouvement dune configura-
tion la suivante seffectue de manire minimiser les diffrences perceptives entre les
timbres.
En rsum, lintgration dune phase doptimisation au sein de CDCSolver est possible
et souhaitable sitt quune bonne fonction scalarisante a t identifie pour le problme en
cours. Nous retrouvons l le constat nonc aux chapitres prcdents quant notre approche
multicritre : elle doit permettre dinfrer au plus vite les prfrences dcoute du compositeur,
afin dinjecter cette information dans les tapes suivantes du processus de recherche.
154 CHAPITRE 10. GESTION DES CONTRAINTES

10.5 Intgration de CDCSolver dans lalgorithme dorchestra-


tion
Nous avons vu au paragraphe 6.7 que la gestion des contraintes au sein dun algorithme
gntique pouvait tre assure de plusieurs manires :
soit directement, en sassurant que la consistance est toujours respecte au sein de la
population ;
soit indirectement, en pnalisant les configurations non consistantes.
La premire mthode ncessite soit des oprateurs gntiques ad-hoc, capables dengendrer des
individus consistants, soit de rtablir systmatiquement la consistance de tout individu violant
les contraintes. On a dans le second cas recours une mthode de rparation cohrente
avec le processus doptimisation.
Nos oprateurs gntiques sont aveugles aux contraintes, et produisent des configu-
rations inconsistantes en grand nombre. On serait donc tent dutiliser CDCSolver comme
mthode de rparation. Malheureusement, lessentiel du temps de calcul risque, en suivant
cette mthode, dtre consacr rtablir la consistance, au dtriment de loptimisation.
En consquence, nous choisissons donc dutiliser notre mthode de satisfaction de
contraintes uniquement au dbut de lexcution de lalgorithme dorchestration : une popu-
lation initiale est dabord instancie alatoirement de manire satisfaire les contraintes de
cardinalit. Dans un second temps, les individus violant les autres contraintes sont rpars
laide de CDCSolver : on obtient ainsi une population initiale consistante avec lensemble
du rseau.
Dans la suite, la gestion directe des contraintes cde le pas une gestion indirecte : au cours
de lvolution, les solutions les plus consistantes sont favorises dans les tapes de slection
et de mise jour de la population (voir section 5.5), grce la dominance au sens de Deb
introduite la dfinition 6.1. Cette dernire a lavantage de ne ncessiter aucun paramtre
de pnalisation des critres pour les configurations inconsistantes : les configurations sont
compares soit sur leurs niveaux de violation des contraintes, soit sur leurs critres si elles
sont de consistances gales :

xy (z(x) < z(y) (z(x) = z(y) x y))

Dans notre algorithme dorchestration (voir section 9.5), les configurations ne sont jamais
compares selon la dominance de Pareto, mais toujours aprs une agrgation des critres par
une fonction scalarisante de Tchebycheff. Les relations de dominance entre les configurations
sont alors projetes sur une distance mono-value la fitness qui permet de comparer
toute paire de configurations.
En prsence de contraintes, nous utilisons aprs chaque agrgation des critres une fonction
pnaliser_fitness qui permet de retrouver les proprits de la dominance au sens de Deb.
Soient respectivement f = {f (x) | x X} et z = {z(x) | x X} les valeurs de fitness et de
fonction de cot dans la population courante. On dfinit alors :

f (x) si z(x) = 0
x X, pnaliser_fitness (f (x), z(x)) =
z(x) + max f sinon

Ce mcanisme de pnalisation intervient deux reprises au cours dune itration de lalgo-


rithme :
10.6. CONTRAINTES ET VOLUTION TEMPORELLE 155

Lors de la slection des individus pour la reproduction : les configurations ont dautant
plus de chances dtre slectionnes quelles violent peu les contraintes.
Lors de la mise jour de la population : les configurations de plus faible consistance
sont retires en premier.

Lalgorithme dorchestration sous contraintes (algorithme 8) prsente, outre les aspects de


pnalisation de fitness pour les configurations inconsistantes, deux particularits par rapport
sa version prcdente (algorithme 4) :
Lors de lapplication des oprateurs gntiques, le crossover nest pas ncessairement
suivi dune mutation (modification alatoire dune coordonne). Nous verrons en effet
au chapitre 11 quen prsence de contraintes, la mutation est plus mme que le crosso-
ver de produire des configurations inconsistantes. Elle nest donc plus utilise certaine-
ment, mais avec une probabilit pmute , gale la probabilit dobtenir une configuration
consistante par instanciation alatoire. Elle est calcule sur la population initiale avant
rparation.
La mise jour de la population (lorsque celle-ci dpasse sa taille maximale autorise)
peut se faire de deux manires diffrentes : soit on retire itrativement les solutions les
moins consistantes jusqu descendre la taille de population dsire, soit le nombre de
configurations de consistance minimale excde toujours la limite de taille, et la popula-
tion est alors rduite par la mthode decrease_PADE (algorithme 3).

10.6 Contraintes et volution temporelle


Limit dans un premier temps par une vision statique du timbre instrumental, notre sys-
tme ne peut a priori engendrer que des textures orchestrales stables, sans modifications
temporelles. Le compositeur souhaitant reproduire un timbre voluant dans le temps na donc
pour linstant dautre choix que de morceller la cible en autant dintervalles que ncessaire,
chercher une solution pertinente pour chaque segment indpendant, et enfin de relier les
piles du pont en orchestrant manuellement les transitions.
Au cours de ce processus long et fastidieux, les orchestrations sont recherches indpen-
damment les unes des autres, sans aucun contrle sur le dgr de continuit chaque transition.
Lapproche par contraintes peut ici apporter un regard diffrent sur la question de lvolution
temporelle. Selon la complexit du rseau de contraintes et le niveau de consistance dune
configuration donne, la rparation de cette dernire par une mthode de satisfaction de
contraintes engendre une configuration plus ou moins proche de ltat initial. On peut donc
trs bien considrer les contraintes comme un moyen de transformer un timbre, de le dpla-
cer vers une autre rgion de lespace. Celle-ci nest alors plus caractrise explicitement par
un ensemble de descripteurs perceptifs, mais implicitement, par un jeu de relations logiques
que les variables de lcriture musicale doivent vrifier.
Lalgorithme CDCSolver a t conu de manire parvenir une configuration consistante
en ne modifiant, chaque tape du calcul, quune seule variable dans la configuration courante.
En conservant la trace de la rsolution, on obtient alors une succession de configurations
voluant de manire continue vers la consistance.
La figure 10.1 est un exemple dune telle transformation. Lorchestration initiale, aux
cordes, a t obtenue partir dune voix chante. La recherche tait contrainte par lensemble
de contraintes suivantes :
156 CHAPITRE 10. GESTION DES CONTRAINTES

Algorithme 8 Algorithme dorchestration sous contraintes


pop pop pareto
Arguments: Une cible dorchestration T , les paramtres de population Ninit , Nmax , Nmate , Nmax ,
un nombre maximal ditrations itermax , une fonction de cot z.
pop
1: (X, pmute ) gnrer une population alatoire de taille Ninit // (pmute est la proportion de
configurations consistantes dans X)
2: pour K X faire
3: K cdcsolver(K, z) // (Rparation des configurations inconsistantes)
4: fin pour
5: C valuer_population(X, T )
6: P extract_pareto_set(C)
7: iter 1
8: tant que iter itermax faire
9: C valuer_population(X, T )
10: tirer un jeu de poids
11: f kCk
12: f pnaliser_fitness(f, z)
13: M slectionner Nmate individus dans X par tournoi binaire selon f
14: O crossover(M )
15: O 1-mutation(O, pmute ) // (taux de mutation gal la probabilit de consistance)
16: CO valuer_population(O, T )
17: X X O
18: P update_pareto_set(P, CO )
pareto
19: si #P > Nmax alors
pareto
20: P decrease_PADE(P, Nmax , random)
21: fin si
pop
22: si #X > Nmax alors
23: X X \P
24: C valuer_population(X, T )
25: f kCk
26: f pnaliser_fitness(f, z)
27: X {K X | z(K) = zmin }
28: si #X Nmaxpop
#P alors
pop
29: X les Nmax #P meilleurs lments selon f // (on limine en priorit les
lments violant le plus les contraintes. . .)
30: sinon
31: X decrease_PADE(X , Nmax pop
#P, f ) // (. . .ensuite seulement ceux de densit
maximale)
32: fin si
33: X X P
34: fin si
35: iter + +
36: fin tant que
37: retourner P
10.6. CONTRAINTES ET VOLUTION TEMPORELLE 157

Fig. 10.1 Passage continu dun accord de cordes vers un accord de vents laide de CDC-
Solver. Partition en Ut.
158 CHAPITRE 10. GESTION DES CONTRAINTES

<attribut=><oprateur =size-min><quantit=4><valeur =>


<attribut=><oprateur =size-max><quantit=4><valeur =>
<attribut=famille><oprateur =at-least><quantit=4><valeur =strings>

Lvolution du timbre se fait par un transfert continu des cordes vers les vents, en modifiant
la contrainte sur la famille dinstruments (les contraintes de cardinalit sont conserves de
manire abandonner progressivement les cordes) :

<attribut=famille><oprateur =at-least><quantit=4><valeur =woodwinds>

La partition de la figure 10.1 permet de suivre la trace de cette transformation (chaque mesure
correspond une tape du calcul). Lorchestration finale tant limite quatre instruments,
linstanciation dune nouvelle variable entraine systmatiquement la violation de la contrainte
de cardinalit maximale : une dsinstanciation est alors ncessaire. Lentre dun instrument
vent donc est aussitt suivie, la mesure suivante, par le retrait dun instrument cordes. En
ne conservant que les mesures impaires de la figure 10.1, on obtient un mouvement de timbre
nimpliquant jamais que quatre instruments.
Du point de vue des contraintes, le choix dun instrument rajouter ou retirer de lor-
chestration est, fonctions de cot gales, indiffrent : la seconde mesure par exemple, la
mme valeur de consistance est obtenue selon quon insre un basson, une flte, une clari-
nette ou un hautbois dans lorchestration. En revanche, la fitness permet de distinguer ces
possibilits, en retenant la configuration de fitness maximale selon la fonction scalarisante
en cours (cette dernire est calcule laide des valeurs de critres obtenus pour lorches-
tration initiale). La continuit du timbre est ainsi encourage dans le passage dune confi-
guration la suivante. Lexemple de la figure 10.1 peut tre cout en ligne sur le site :
http://recherche.ircam.fr/equipes/repmus/carpentier/phdsounds/.
Chapitre 11

Tests de performances

Difficult dvaluer les mthodes multicritres


Ncessit dune approche multi-expert
Evaluation de lalgorithme sur diffrentes classes de problmes
Intrt des principaux modules de lalgorithme dorchestration

Nous terminons cette partie avec un chapitre consacr lvaluation quantitative de notre
algorithme dorchestration. Nous commenons par montrer en quoi lvaluation des mthodes
multicritres est une tche particulirement dlicate, et discutons brivement les approches
en gnral adoptes dans la littrature. Nous proposons alors un cadre multi-expert dans
lequels les performances de notre mthode sont mesures selon plusieurs points de vue .
Nous montrons lintrt, selon chaque point de vue, des diffrents modules de lalgorithme
dorchestration : crossover, mutation, rparation des configurations initiales par CDCSolver,
maintien de la diversit par la mthode PADE.

11.1 Evaluation des mthodes multicritres


Les mthodes multicritres rcentes reposent sur la dominance de Pareto. Nous avons vu
la section 5.2 que cet ordre partiel sur lespace de recherche empche de comparer toute paire
de configurations. Cette indcidabilit entre deux solutions se rpercute, de manire dcuple,
sur la comparaison des performances de mtaheuristiques.
Lorsquon a en effet recours des mthodes incompltes, celles-ci ne retournent en gnral
jamais le front de Pareo thorique du problme, mais en donnent une approximation. Se pose
alors la question de comparer deux approximations PA et PB retournes par deux mtaheu-
ristiques diffrentes A et B. Dun point de vue formel, on serait tent de dire que la mthode
A est meilleure que B si et seulement si tout lment de PB est domin par au moins un
lment de PA . Or cette condition est si forte quen pratique elle nest, dans un sens comme
dans lautre, presque jamais observe. Il suffit quun seul lment de PB ne soit domin par
aucun lment de PA (et vice versa) pour que A et B soient incomparables.
La figure 11.1 reprsente deux approximations du front de Pareto obtenues avec deux
mthodes multicritres diffrentes pour le mme problme. A strictement parler, A et B sont
incomparables : il existe des points de A non-domins par B comme il existe des points de B
non domines par A. Il semble pourtant que lon puisse en dire un peu plus en abandonnant
le strict cadre de la dominance de Pareto. Il est en effet clair que A est meilleur que B sur

159
160 CHAPITRE 11. TESTS DE PERFORMANCES

critre 2
Approximation A
Approximation B

cne de dominance
de l'approximation B

critre 1

Fig. 11.1 Deux approximations incomparables du point de vue de la dominance de Pareto

le critre 2, alors que B est meilleur que A sur le critre 1. En outre, il existe une portion de
lespace des critres (le cne de dominance en gris) sur laquelle B domine totalement A, alors
que linverse nest pas vrai. Autrement dit, il existe un ensemble de fonctions scalarisantes de
Tchebycheff pour lesquelles les lments de B obtiennent une meilleure fitness que ceux de A.
Si en gnral deux approximations ne peuvent tre compares selon la dominance de Pareto,
on peut donc choisir de les considrer selon un point de vue particulier. Se concentrer sur
une rgion de lespace des critres peut constituer un tel point de vue. Comme nous aurons
loccasion de le voir, il en existe bien dautres. Cette approche est celle retenue par la plupart
des auteurs, qui en gnral ne font pas intervenir la dominance de Pareto (pour les raisons
voques ci-dessus) dans leurs processus dvaluation, mais proposent un certain nombre de
mesures de qualit .
Une mesure de qualit est une fonction M (le plus souvent unaire ou binaire) sur lensemble
des approximations, valeurs dans R. Elle saccompagne dune fonction dinterprtation, en
gnral implicite, permettant de dcider, en fonction des valeurs prises par M(A) et M(B)
(ou M(A, B) et M(B, A) dans le cas dune mesure binaire), si lapproximation A est meilleure
ou moins bonne que B. Lorsque le front de Pareto thorique est connu, on peut par exemple
utiliser la mtrique T (appele aussi generational distance) de Veldhuizen [vV99], qui renvoie
la moyenne des distances euclidiennes entre chaque point de lapproximation et le vrai front.
On rencontre de nombreuses mesures de qualit dans la littrature. Outre la mtrique T ,
les plus connues sont lerror ratio de Veldhuizen [vV99], les mtriques S (hypervolume) et
C (coverage) [ZT98b] [ZT98a] ainsi que lepsilon indicator [ZTL+ 03] de Zitzler et al., et les
indicateurs R1 , R2 et R3 de Hansen et Jaszkiewicz [HJ97]. Certaines dentre elles, que nous
utilisons dans notre processus dvaluation, seront dtailles la section suivante. Pour les
autres, nous renvoyons le lecteur aux travaux de Zitzler et al. [Zit99] [ZTL+ 03], Knowles et
al. [KFTZ05], Hansen et Jaszkiewicz [HJ97], Grosan [Gro05] ou encore Deb [DJ02].

Ziztler et al. [ZTL+ 03] ont rcemment propos un cadre formel pour lvaluation des m-
11.2. MESURES DE QUALIT RETENUES 161

critre 2
Approximation A
Approximation B

Front thorique

critre 1

Fig. 11.2 Ambiguit de la mtrique T

thodes multicritres et sont parvenus un certain nombre de rsultats thoriques fonda-


mentaux. Les auteurs ont entre autres montr que dans la plupart des cas, il est impossible
dtablir, partir dune mesure de qualit et sa fonction dinterprtation, quune approxima-
tion est meilleure quune autre. Considrons par exemple la mtrique T (distance moyenne
au front thorique) introduite ci-dessus. Il est intuitif de supposer que si T (B) < T (A), alors
lapproximation B est meilleure que A. La figure 11.2 montre que ce nest pas aussi simble :
si B est en effet peine plus proche du front thorique que A, elle ne couvre toutefois quune
faible partie du front de Pareto, alors que A donne une bonne approximation de son tendue.

Zitzle et al. [ZTL+ 03] ont montr que parmi toutes les mthodes dvaluation proposes
dans la littrature, seules deux mesures de qualit unaires et quatre mesures binaires per-
mettent de conclure la suprorit (au sens de Pareto) dune approximation sur une autre,
et ce dans un trs petit nombre de cas. Il faut donc tre extrmement prudent lors de leur
emploi. Lexemple de la figure 11.2 est frappant. Si les approximations sont compares selon
la distance au front thorique, alors B est incontestablement meilleure que A. Mais si on en
juge la diversit des solutions dans lespace des critres, alors A lemporte.
Lorsque deux approximations ne peuvent tre compares au sens de Pareto, il faut donc
les valuer selon plusieurs points de vue diffrents, afin de saisir prcisment en quoi elles
diffrent. En dautres termes, lvaluation des mthodes multicritres est aussi un problme
multicritre.

11.2 Mesures de qualit retenues


Nous proposons dans cette section un ensemble de mesures de qualit pour valuer les per-
formances de notre algorithme dorchestration. Comme nous le verrons au paragraphe suivant,
lalgorithme est dabord compar une recherche purement alatoire, puis diffrentes variantes
sont confrontes deux deux, afin de prouver la pertinence des principaux piliers de notre
162 CHAPITRE 11. TESTS DE PERFORMANCES

Point nadir

critre 2

Point idal

critre 1

Fig. 11.3 Hypervolume : portion de lespace domine par lapproximation

mthode de recherche : approche gntique, mutation, maintien de la diversit, rparation des


solutions avec CDCSolver.
La procdure que nous mettons ici en place est multi-expert . Les approximations sont
compares selon plusieurs points de vue que nous nagrgeons pas en une valeur unique.
Nous montrons ainsi que selon les problmes, modifier une partie de lalgorithme permet
dobtenir diffrents types et diffrentes qualits dapproximations.

11.2.1 Supriorit
Nous commenons par comparer les approximations selon la dominance au sens de Pa-
reto. Ce calcul est bas sur celui de lhypervolume H [Zit99], i.e. la partie de lespace des
critres domine par lapproximation (en gris sur la figure 11.3). Dans le cas gnral pour un
problme
 max i  de minimisation, H est le volume dlimit par lunion des polytopes de diagonale
x ; x , o xmax est le point nadir1 et xi un point de lapproximation. Lorsque lespace de
recherche nest pas connu, ces points sont estims par gnration alatoire dun grand nombre
de configurations (voir paragraphe 11.3).
Lorsque la dimension de lespace des critres est suprieure 2, le calcul de lhyper volume
peut devenir trs complexe, et ncessite alors le recours une mthode adapte. Lalgorithme
HSO (Hypervolume by Slicing Objectives) [WHBH06] est le plus courant.
En pratique, nous calculons lhypervolume binaire, qui consiste en la donne de deux
valeurs : H(A, B), la portion de lespace domine par A et non par B, et H(B, A), la portion de
lespace domine par B et non par A. Zitzler et al. [ZTL+ 03] ont montr que si H(A, B) > 0 et
H(B, A) = 0, alors A est meilleure que B, i.e. chaque lment de B est faiblement domin2 par
un lment de A, et A 6= B. Dans les cas o les deux approximations peuvent tre compares
1
Les coordonnes du point nadir sont les pires valeurs obtenues pour chacun des critres.
2
x domine faiblement y si et seulement si x  y ou x = y.
11.2. MESURES DE QUALIT RETENUES 163

selon la dominance de Pareto, le calcul de lhypervolume binaire permet didentifier lequel des
deux ensembles est meilleur que lautre.

11.2.2 Pseudo-dominance
Dans bien des cas toutefois, les approximations sont incomparables au sens de Pareto (voir
section 11.1). Il nous faut alors convenir dune notion plus souple de la dominance. Sur la figure
11.1 par exemple, certains lments de B dominent des points de A, alors que linverse nest
pas vrai. Lapproximation B peut donc tre juge prfrable A, car il existe des situations
pour lesquelles B est meilleure (elles sont reprsentes par le cne de dominance en gris).
Nous dfinissons alors cinq prdicats P1 , P2 , P3 , P4 , P5 , exprimant diffrents points de
vue sur les relations de dominance entre les lments des approximations :
(P1 ) Binary epsilon indicator : (A, B) est le facteur unique par lequel il faudrait diviser
lensemble des valeurs de critres de A pour que A domine B au sens de Pareto. Zitzler
et al. donnent un algorithme efficace pour le calcul de  dans [ZTL+ 03]. P1 (A, B) est
vrai si et seulement si (A, B) < (B, A).
(P2 ) Coverage : C(A, B) est le pourcentage dlments de B domins par A (voir par
exemple [ZT98b]). P2 (A, B) est vrai si et seulement si C(A, B) > C(B, A).
(P3 ) Binary R1 : Cette mesure introduite par Hansen et Jaszkiewicz [HJ97] value les
approximations laide dun ensemble de fonctions scalarisantes de Tchebycheff (voir
section 5.7). Etant donn un jeu de poids (i )1in , soient respectivement f (A, i ) et
f (B, i ) les meilleures valeurs de k ki obtenues sur respectivement A et B. R1 (A, B)
est alors gal au nombre fois o f (A, i ) < f (B, i ). P3 (A, B) est vrai si et seulement
si R1 (A, B) > R1 (B, A).
(P4 ) Binary R2 : De faon similaire, R2 est dfinie par :
n
1 X
R2 (A, B) = f (A, i ) f (B, i )
N
i=1

et P4 (A, B) est vrai si et seulement si R2 (A, B) < R2 (B, A).


(P5 ) Binary hypervolume : Cette mesure a t dfinie au paragraphe prcdent. P5 (A, B)
est vrai si et seulement si H(A, B) > H(B, A).
Au final, on dira que A pseudo-domine B si pour au moins trois des cinq Pi dfinis ci-dessus
Pi (A, B) est vrai.

11.2.3 Convergence
Nous avons vu au chapitre 5 quune bonne mtaheuristique pour loptimisation multicritre
devait assurer la fois la convergence vers le front de Pareto thorique et la diversit des
solutions optimales. Nous proposons donc une mesure adquate pour chacun de ces aspects.
Nous mesurons la convergence vers la frontire efficiente laide de la mtrique T (gene-
rational distance) introduite au dbut de ce chapitre. T (A) est dfinie comme la moyenne des
distances euclidiennes entre chaque point de lapproximation A et le font thorique. Lorsque
ce dernier nest pas connu, on utilise un ensemble de rfrence obtenu par gnration alatoire
dun grand nombre de configurations (voir paragraphe 11.3).
Nous dirons que A atteint un meilleur niveau de convergence que B si et seulement si
T (A) < T (B).
164 CHAPITRE 11. TESTS DE PERFORMANCES

critre 2
Approximation A
Approximation B
Front thorique

critre 1

Fig. 11.4 Deux approximations obtenant les mmes valeurs de diversit pour la mesure de
Grosan

11.2.4 Diversit
Grosan a propos dans [Gro05] une mesure pertinente pour la diversit des solutions de lap-
proximation dans lespace des critres. Pour chaque point de lapproximation, on marque
le point du front thorique le plus proche au sens de la distance euclidienne. La diversit de
lapproximation peut alors tre estime par le pourcentage de points marqus dans le front
thorique.
Cette mthode intuitive et facile mettre en uvre possde un inconvnient majeur,
illustr par la figure 11.4. Bien que beaucoup plus diversifie, lapproximation A marque
exactement le mme nombre de points que B sur le front thorique. On peut corriger ce dfaut
en commenant par ramener lapproximation et le front thorique au mme nombre dlments.
Nous rduisons le plus grand des deux ensembles la taille du plus petit laide de la procdure
decrease_PADE introduite la section 9.4, puis calculons la diversit D propose par Grosan.
L encore, lorsque le front thorique nest pas connu, on utilise un ensemble de rfrence
obtenu par gnration alatoire dun grand nombre de configurations (voir paragraphe 11.3).
Nous dirons alors que A est au moins aussi diversifi que B si et seulement si D(A) D(B),
et vice versa.

Nous valuons la section suivante diffrentes variantes de lalgorithme dorchestration.


Plusieurs couples de variantes sont compars sur un grand nombre dinstances, pour plusieurs
classes de problmes. Pour chaque couple et chaque classe les rsultats sont prsents dans un
tableau quatre entres (une par expert) dont la lecture est explicite par le tableau 11.1.

Remarque 11.1. Dans le cas de problmes contraints, la question dune mesure de consis-
tance des solutions de lapproximation pourrait se poser. Les instances de test tant toutefois
faiblement contraintes, le hasard des oprations gntiques permet toujours, dans le cadre de
cette valuation, de dcouvrir des configurations consistantes, mme en labsence dune m-
11.3. PERFORMANCES DE LALGORITHME DORCHESTRATION 165

Tab. 11.1 Grille de lecture pour la comparaison multi-expert de deux approximations

Expert Mthode A Mthode B


Supriorit Pourcentage des cas dans Pourcentage des cas dans
lesquels A est meilleure que B lesquels B est meilleure que A
Pseudo-dominance Pourcentage des cas dans Pourcentage des cas dans
lesquels A pseudo-domine B lesquels B pseudo-domine A
Convergence Pourcentage des cas dans Pourcentage des cas dans
lesquels A converge davantage que B lesquels B converge davantage que A
Diversit Pourcentage des cas dans Pourcentage des cas dans
lesquels A est au moins lesquels B est au moins
aussi diversifi que B aussi diversifi que A

thode de rparation telle que CDCDSolver. Assurs que les approximations ne contiennent que
des solutions satisfaisant les contraintes, nous ne retenons donc pas de critre de consistance
dans notre valuation.

11.3 Performances de lalgorithme dorchestration


Dans cette section, nous valuons notre algorithme dorchestration (algorithme 8) laide
du cadre multi-expert introduit ci-dessus. Nous utilisons cette fin les cibles monophoniques et
polyphoniques quatre sons dfinies au chapitre 8. Ces problmes sont assortis de contraintes
de hauteur et de cardinalit. Pour les problmes monophoniques, lespace de recherche est
limit aux sons de mme hauteur que la cible. Il suffit donc de deux contraintes (size-min et
size-max voir chapitre 10) pour imposer que les solutions impliquent exactement quatre
sons. Quant aux cibles polyphoniques, il faut encore rajouter quatre contraintes de hauteur
pour avoir exactement une fois chaque note de la cible dans les solutions.
Sous ces conditions lespace de recherche, et a fortiori le front de Pareto thorique ainsi que
les points idal3 et nadir, sont connus. Il est donc possible dvaluer lalgorithme dorchestration
sur des problmes contraints laide des mesures de qualit dfinies au paragraphe prcdent.
Afin galement de mesurer les performances de lalgorithme sur des problmes libres, nous
excutons notre algorithme sur chaque instance de test dcharge de ses contraintes. Dans
ce cas toutefois, lespace de recherche est trop grand pour pouvoir tre calcul en un temps
raisonnable. Nous nous contentons donc destimer le front de Pareto thorique (on parlera
alors densemble de rfrence), ainsi que les points idal et nadir, par instanciation alatoire
de 106 configurations.

En rsum, lalgorithme dorchestration est donc valu sur :


500 problmes monophoniques avec contraintes de cardinalit, pour lesquels lespace de
recherche est connu ;
500 problmes polyphoniques avec contraintes de cardinalit et de hauteur, pour lesquels
lespace de recherche est connu ;
500 problmes monophoniques non contraints, pour lesquels lespace de recherche est
inconnu ;
3
Les coordonnes du point idal sont les meilleures valeurs obtenues pour chacun des critres.
166 CHAPITRE 11. TESTS DE PERFORMANCES

500 problmes polyphoniques non contraints, pour lesquels lespace de recherche est
inconnu.

Dans le reste de cette section, les diffrentes versions de lalgorithme sont toujours para-
pop pop pareto
mtres par les mmes valeurs4 : Ninit = 200, Nmax = 500, Nmate = 50 et Nmax = 100.
Le paramtre itermax est calcul de manire ce que le nombre dvaluations de fitness soit
toujours gal 20 000.

11.3.1 Algorithme de rfrence


Dans le cadre de notre valuation multi-expert, nous comparons deux deux diffrentes
variantes de lalgorithme dorchestration. Il nous faut donc un algorithme de rfrence auquel
confronter une premire version. Conformment avec la dmarche adopte au chapitre 8 pour la
validation de la formulation du problme de lorchestration et au chapitre 10 pour lvaluation
de CDCSolver, nous utilisons lalgorithme 9, purement alatoire, comme rfrence. Outre la
cohrence par rapport nos processus de test prcdents, ce choix se justifie de deux manires :
Il nexiste pas notre connaissance dalgorithme dorchestration multicritre auquel se
confronter.
Notre algorithme dorchestration est bas sur une heuristique faisant intervenir du ha-
sard dans la rsolution. Le comparer un algorithme purement alatoire permet donc
dvaluer sa capacit organiser ce hasard.

Algorithme 9 Algorithme naf dorchestration (recherche alatoire)


Arguments: Une cible dorchestration T , un nombre dvaluations de fitness Nf , une taille maximale
pareto
de lensemble Pareto Nmax , une fonction de cot z.

1: X gnrer une population alatoire de taille Nf


2: X ne conserver que les solutions de X minimisant z
3: C valuer_population(X, T )
4: P extract_pareto_set(C)
pareto
5: si #P > Nmax alors
pareto
6: P decrease_PADE(P, Nmax , random)
7: fin si
8: retourner P

Dans la suite de cette section, cet algorithme sera simplement dsign par random .

11.3.2 Pertinence de lapproche gntique


Nous commenons par valuer une version trs rudimentaire de lalgorithme dorchestra-
tion, dans laquelle :
les configurations inconsistantes de la population initiale ne sont pas rpares par CDC-
Solver ;
la mutation gntique est dsactive ;
4
Notre intention est ici de dmontrer lintrt qualitatif des diffrentes composantes de lalgorithme 8, non
de dterminer des valeurs optimales de paramtres.
11.3. PERFORMANCES DE LALGORITHME DORCHESTRATION 167

Tab. 11.2 Performances dun algorithme gntique lmentaire par rapport une recherche
alatoire.
monophonique contraint monophonique libre
v.1.0 random v.1.0 random
Supriorit 18.40 % 2.04 % 8.79 % 1.23 %
Pseudo-dominance 84.25 % 15.75 % 61.15 % 38.85 %
Convergence 83.44 % 16.56 % 78.73 % 21.27 %
Diversit 69.12 % 84.25 % 25.15 % 78.32 %
polyphonique contraint polyphonique libre
v.1.0 random v.1.0 random
Supriorit 56.00 % 0.00 % 27.00 % 0.00 %
Pseudo-dominance 98.40 % 1.60 % 89.40 % 10.60 %
Convergence 95.20 % 4.80 % 98.00 % 2.00 %
Diversit 54.60 % 82.60 % 40.60 % 60.20 %

la procdure derease_PADE est remplace par une gestion nave de la population (lorsque
pop pop pop
la taille de celle-ci dpasse Nmax , on conserve uniquement les (Ninit +Nmax )/2 meilleures
configurations au sens de Deb).
En dautres termes, nous comparons au random un algorithme gntique lmentaire, que nous
dsignons par v.1.0 , dont les principales caractristiques sont :
des contraintes gres exclusivement par la dominance au sens de Deb (voir dfinition
6.1) ;
une slection par tournoi binaire (voir paragraphe 5.6) ;
une volution par crossover uniforme (voir dinition 9.1) ;
une gestion de la taille de la population par limination des plus mauvais individus au
sens de Deb.
Le tableau 11.2 rapporte les performances compares des algorithmes v.1.0 et random.
Sur les quatre types de problmes, les approximations retournes par v.1.0 dominent frquem-
ment (au sens de Pareto) celles dcouvertes par lalgorithme alatoire, et leurs performances
en termes de pseudo-dominance et de convergence sont crasantes, en particulier pour les pro-
blmes polyphoniques. Lintrt de lapproche gntique est patent : loprateur de crossover
uniforme permet bien damliorer itrativement la qualit des configurations.
Lorsquon compare toutefois les deux mthodes selon un critre de diversit, la supriorit
de lalgorithme gntique est moins vidente. Cependant, la capacit du hasard pur produire
des solutions trs diffrentes les unes des autres ne doit pas vraiment nous surprendre. Mais,
comme le montre la figure 11.5, cette diversit nest rien sans loptimalit : si les solutions
de lalgorithme alatoire sont en effet plus diversifies que celles de lalgorithme gntique,
en revanche ces dernires les dominent toutes au sens de Pareto. Il faut donc se mfier de la
mesure de diversit, et toujours linterprter en regard des autres critres.
En outre, rappelons quil est connu que sans mthode explicite de maintien de la diversit
(comme cest le cas pour v.1.0), un algorithme gntique tendance voluer vers une zone
particulire de lespace des critres, au dtriment des autres. Cest le phnomne de drive
gntique (ou genetic drift, voir paragraphe 5.5.4). La figure 11.5 en est un exemple. Elle
168 CHAPITRE 11. TESTS DE PERFORMANCES

critre 2
random
v.1.0

Front thorique

critre 1

Fig. 11.5 Diversit contre dominance

montre quun petit nombre de solutions optimales est souvent prfrable un large ensemble
de configurations mdiocres.

Nous aurons loccasion de rediscuter des effets de lalatoire pur dans la suite de cette
section. Nous verrons en outre que sous couvert de diversit apparente, une trop grande part
dalatoire introduit en ralit du bruit dans le processus doptimisation.

11.3.3 Pertinence de la mutation


Nous avons vu la section 5.5.3 que dans un algorithme gntique le crossover et la
mutation taient des acteurs complmentaires de lintensification et de la diversification de la
recherche. Nous valuons ici lintert de la mutation monopoint (voir dfinition 9.2) en termes
de convergence et de diversit. Nous introduisons pour cela lalgorithme v.1.1, similaire
v.1.0, mais dans lequel le crossover est systmatiquement suivi dune mutation.
Le tableau 11.3 montre que la mutation monopoint systmatique permet daugmenter tous
les critres de performance pour les problmes libres. En revanche, si elle amliore la diversit
des approximations en prsence de contraintes, elle dtriore nettement les autres critres, en
particulier pour les instances polyphoniques pour lesquelles la consistance est plus difficile
maintenir. Nous pouvons ici nouveau dceler les effets nfastes dun excs dalatoire.
En prsence de contraintes, la mutation systmatique en effet tendance engendrer des
configurations inconsistantes. Sous couvert de diversit, lvolution est compromise par un
bruit qui perturbe la convergence vers loptimalit.
Nous proposons donc de remplacer la mutation systmatique de la version v.1.1 par une
mutation alatoire (v.1.2) applique avec une probabilit adapte la difficult du problme
contraint (cest la stratgie retenue dans la version finale de lalgorithme). En pratique, la
probabilit de mutation est gale la probabilit de consistance dans la population initiale
11.3. PERFORMANCES DE LALGORITHME DORCHESTRATION 169

Tab. 11.3 Pertinence de la mutation gntique

monophonique contraint monophonique libre


v.1.1 v.1.0 v.1.1 v.1.0
Supriorit 1.43 % 1.84 % 3.48 % 1.02 %
Pseudo-dominance 59.30 % 40.70 % 62.58 % 37.42 %
Convergence 47.24 % 52.76 % % 50.31 % 49.69 %
Diversit 84.46 % 78.32 % 65.24 % 40.90 %
polyphonique contraint polyphonique libre
v.1.1 v.1.0 v.1.1 v.1.0
Supriorit 0.40 % 1.60 % 4.40 % 0.00 %
Pseudo-dominance 42.80 % 57.20 % 70.00 % 30.00 %
Convergence 40.20 % 59.80 % 62.00 % 38.00 %
Diversit 77.40 % 74.40 % 71.20 % 30.40 %

Tab. 11.4 Pertinence de la mutation alatoire pour les problmes contraints

monophonique contraint polyphonique contraint


v.1.2 v.1.0 v.1.2 v.1.0
Supriorit 2.25 % 0.82 % 1.60 % 1.40 %
Pseudo-dominance 57.26 % 42.74 % 53.60 % 46.40 %
Convergence 51.74 % 48.26 % 54.00 % 46.00 %
Diversit 79.35 % 79.75 % 76.00 % 76.20 %

Xinit :
pmute = P(z(x) = 0) , x Xinit
Pour les problmes libres, les versions v.1.2 et v.1.1 sont quivalentes. Nous ne comparons
donc v.1.2 et v.1.0 que sur les problmes contraints.
Le tableau 11.4 montre quen prsence de contraintes, la mutation alatoire nagit pas
comme un oprateur de diversification, mais permet dans certains cas de parvenir des ap-
proximations sensiblement meilleures, en termes de pseudo-dominance, que celles retournes
par la version v.1.0. La mutation agit donc ici comme un oprateur dintensification de la
recherche : lorsquelle nen dtriore pas la consistance, elle permet dans certains cas daffiner
la qualit des configurations.

11.3.4 Maintien de la diversit par population alatoire


Nous valuons ici la possibilit dencourager la diversit des approximations en introduisant
priodiquement (une gnration sur cinq) Nmate configurations alatoires dans la population
courante.
La lecture du tableau 11.5 est sans quivoque : La diversification par excs dalatoire a
un effet dvastateur sur lensemble des mesures de performance. Pour les problmes contraints,
lamlioration sensible de la diversit nest pas significative en regard de la dgradation des
autres indicateurs. Nous retrouvons l nos conclusions de la section 11.3.2 sur les consquences
du hasard pur.
170 CHAPITRE 11. TESTS DE PERFORMANCES

Tab. 11.5 Effets de lintroduction priodique de solutions alatoires

monophonique contraint monophonique libre


v.2.0 v.1.2 v.2.0 v.1.2
Supriorit 0.41 % 23.72 % 0.82 % 9.82 %
Pseudo-dominance 7.98 % 92.02 % 22.90 % 77.10 %
Convergence 23.72 % 76.28 % % 28.83 % 71.17 %
Diversit 79.96 % 76.69 % 43.56 % 63.60 %
polyphonique contraint polyphonique libre
v.2.0 v.1.2 v.2.0 v.1.2
Supriorit 0.00 % 56.40 % 0.00 % 13.80 %
Pseudo-dominance 2.00 % 98.00 % 16.40 % 83.60 %
Convergence 13.80 % 86.20 % 14.60 85.40 %
Diversit 75.60 % 63.80 % 24.00 % 76.80 %

Tab. 11.6 Pertinence de la rparation des solutions initiales pour les problmes contraints

monophonique contraint polyphonique contraint


v.3.0 v.1.2 v.3.0 v.1.2
Supriorit 13.70 % 0.41 % 1.80 % 0.20 %
Pseudo-dominance 58.28 % 41.72 % 56.60 % 43.40 %
Convergence 51.33 % 48.67 % 48.60 % 51.40 %
Diversit 78.73 % 74.64 % 81.80 % 74.60 %

11.3.5 Pertinence de la rparation des solutions initiales


Nous revenons donc la version v.1.2 de lalgorithme, et y rajoutons la rparation des
configurations inconsistantes dans la population initiale laide de CDCSolver. De faon vi-
dente, cette dernire version (v.3.0) est compare v.1.2 sur les problmes contraints uni-
quement.
Le tableau 11.6 montre que sans altrer la convergence, la rparation des solutions dans
la population initiale permet daugmenter de manire significative la diversit et la pseudo-
dominance des approximations, voire la dominance au sens de Pareto (supriorit). Il est donc
permis de supposer que dans la version v.1.2, une partie du temps de calcul est absorbe
par la recherche de la consistance, l o la version v.3.0 peut se contenter de maintenir la
consistance tablie par CDCSolver en dbut dexcution.

11.3.6 Maintien de la diversit par la mthode PADE


Nous terminons par valuer lintrt de la mthode PADE (Population size Adapted Den-
sisy Estimation voir sections 5.8 et 9.4)) pour le maintien de la diversit au sein de la
population. La version obtenue (v.4.0) correspond lalgorithme dorchestration prsent au
chapitre 10.
Daprs le tableau 11.7, le maintien explicite dune densit homogne dans la population
permet dobtenir des approximations beaucoup plus diversifies dans le cas de problmes
11.3. PERFORMANCES DE LALGORITHME DORCHESTRATION 171

Tab. 11.7 Intrt de la prservation de la densit selon la mthode PADE

monophonique contraint monophonique libre


v.4.0 v.3.0 v.4.0 v.3.0
Supriorit 4.50 % 1.02 % 5.11 % 0.61 %
Pseudo-dominance 50.72 % 49.28 % 65.44 % 34.56 %
Convergence 31.70 % 68.30 % 50.72 % 49.28 %
Diversit 83.25 % 75.05 % 76.29 % 28.63 %
polyphonique contraint polyphonique libre
v.4.0 v.3.0 v.4.0 v.3.0
Supriorit 0.20 % 1.20 % 0.80 % 0.00 %
Pseudo-dominance 39.20 % 60.80 % 73.40 % 26.60 %
Convergence 38.80 % 61.20 % 54.80 % 45.20 %
Diversit 76.60 % 74.60 % 87.60 % 12.40 %

libres. On constate galement une amlioration sensible de la pseudo-dominance, voire de la


convergence ou de la dominance de Pareto (supriorit) selon les types de problmes.
Lintrt de la mthode est en revanche moins vident pour les problmes contraints, pour
lesquels une lgre augmentation du critre de diversit se fait au prix dune dgradation signi-
ficative de la convergence, et mme des deux autres critres pour les instances polyphoniques.
Ce phnomne est peut-tre d au maintien dune population de taille fixe par la mthode
pop pop
PADE, l o la version v.3.0 ramne la cardinalit de la population (Ninit +Nmax )/2 ds que
pop
celle-ci dpasse Nmax . Dans la version v.3.0, la taille de la population volue ainsi en dents
de scie, avec une purge priodique o les configurations les moins consistantes sont limines.
A loppos, la version v.4.0 peut maintenir un grand nombre de configurations inconsistantes
dans la population, perturbant potentiellement lvolution.

Magr tout, la diversit des solutions de lapproximation est sans doute un critre privi-
lgier dans un cadre de cration musicale. Cest donc pour linstant la version v.4.0 qui est
implmente dans le prototype daide lorchestration qui fait lobjet de la dernire partie de
ce document.

Conclusion
Nous avons montr, travers un processus dvaluation multi-expert, que notre algorithme
dorchestration converge rapidement vers la frontire efficiente tout en maintenant la diversit
au sein de la population et parmi les solutions optimales. Au cours de cette valuation, les
paramtres de notre algorithme nont pas t modifis. On sait pourtant que loptimisation
par algorithmes gntiques demande une attention particulire dans le choix de paramtres
tels que la taille de la population et la taille du bassin de reproduction. Il conviendrait donc
de reprendre cette valuation avec diffrentes valeurs pour ces paramtres.
Gardons toutefois lesprit que le but ultime de notre mthode est avant tout de dcouvrir
une solution qui satisfasse les exigences esthtiques de lutilisateur. En garantissant lquilibre
entre convergence et diversit, on peut donc esprer identifier rapidement une configuration
pertinente, partir de laquelle la recherche peut tre intensifie par infrence des prfrences
172 CHAPITRE 11. TESTS DE PERFORMANCES

dcoute du compositeur (voir paragraphe 7.2.6). Le caractre interactif et supervis de lopti-


misation dans une situation de cration musicale doit donc temprer la ncessit de dcouvrir
les valeurs optimales pour les paramtres de lalgorithme. Si le choix de ces valeurs peut dans
certains cas tre crucial, il nengendre souvent quune lgre amlioration de performances si
la mthode doptimisation respecte les deux principes fondamentaux de la recherche multicri-
tre : convergence et diversit. Si ce gain peut tre dterminant dans le cas de problmes de
rfrence pour lesquels il existe de nombreux benchmarks, ou dans un contexte industriel o
une amlioration infime peut avoir des consquences normes en termes de cot, il ne consitue
en rien une priorit pour laide lorchestration. Ce pourquoi nous avons valu notre m-
thode de manire plus qualitative que quantitiative, en montrant lintrt de ses differentes
composantes dans un cadre de cration.
Rsum de la deuxime partie

Laide lorchestration est aborde comme la recherche, au sein de grandes banques de sons
instrumentaux, de combinaisons dchantillons sapprochant le plus possible dun timbre cible.
Afin dune part de tenir compte du caractre multidimensionnel de la perception du timbre,
dautre part de traiter directement le problme combinatoire des mlanges, nous ramenons
lorchestration une tache doptimisation combinatoire multicritre sous contraintes.
La caractrisation des possibilits timbrales des instruments et de leurs alliages est aborde
travers un paradigme de description du signal. Lanalyse automatique de grandes banques
dchantillons sonores permet de condenser une connaissance synthtique du son instrumental
en un ensemble de descripteurs perceptifs, de prvoir les proprits acoustiques des mlanges
de timbre et dvaluer leur similarit avec un timbre cible selon plusieurs dimensions. A tra-
vers ce cadre formel, les combinaisons instrumentales ne sont plus identifies par les variables
de lcriture musicale, mais par un vecteur de distances perceptives, dans un espace o un
problme doptimisation multicritre peut tre pos. Nous montrons sur un ensemble de pro-
blmes de petite taille quune description spectro-harmonique du timbre permet de traiter
un ensemble consquent de cas dorchestration et prouvons que les solutions optimales du
problme doptimisation correspondent des configurations pertinentes dun point de vue
perceptif. Nous validons ainsi lapport des approches descriptive, multicritre et combinatoire
pour aborder la complexit de lorchestration.
Un algorithme gntique multicritre est introduit, dans lequel les propositions dorchestra-
tion sont reprsentes par des N -uplets dentiers, ce qui permet dignorer les contraintes lies
aux limitations de linstrumentarium utilis. Les configurations sont values laide de fonc-
tions scalarisantes de Tchebycheff poids alatoires, garantissant loptimisation simultane
de lensemble critres perceptifs. Une mthode destimation de la densit locale au sein de la
population assure en outre le maintien de sa diversit et empche une convergence prmature
vers une zone particulire de lespace des critres.
Un cadre thorique pour lexpression et la gestion de contraintes globales sur les variables
symboliques de lorchestration est galement propos. La dcouverte de solutions consistantes
est prise en charge par lheuristique de recherche locale CDCSolver, qui sappuie sur la dis-
tinction entre contraintes de design et containtes de conflit, et dont lefficacit est prouve sur
des problmes de petite taille. Dans certains cas, CDCSolver peut assurer, en complment de
lalgorithme gntique, une partie de loptimisation. Une intgration dans lalgorithme dor-
chestration pour la gestion de problmes contraints est propose, de manire rpartir quita-
blement le temps de calcul : CDCSolver intervient comme procdure de rparation tandis que
lvolution vers les configurations consistantes est encourage par une dominance de Pareto
tendue. Nous montrons enfin comment CDCSolver peut tre utilis pour des transformations
continues de timbre.
Les performances de lalgorithme dorchestration sont values dans un premier temps sur

173
un ensemble de problmes contraints de petite taille pour lesquels les fronts de Pareto tho-
riques sont connus, puis sur des instances plus consquentes pour lesquelles le front thorique
est estim par une approximation de rfrence. Un systme dvaluation multi-expert est pro-
pos pour comparer diffrentes versions de lalgorithme selon diffrents critres : dominance
faible, pseudo-dominance, convergence, diversit. Nous prouvons tout dabord la supriorit
dune version nave de lalgorithme par rapport une recherche purement alatoire, et justi-
fions lapport de la mutation gntique, de la rparation des configurations inconsistantes, et
du maintien de la diversit.

174
Troisime partie

Outil daide lorchestration

175
Chapitre 12

Prototype actuel

Un premier outil dorchestration dvelopp sous Matlab c

Lapport des technologies existantes lIRCAM


En quoi les limites actuelles conditionnent lesthtique

Cette troisime partie est consacre au prototype doutil dorchestration, dvelopp par
nos soins en parallle de nos recherches. Le choix dun environnement de dveloppement sest
rapidement port sur Matlab c
, pour au moins quatre raisons majeures :
1. Matlab c
est un langage multi-plateforme. Le prototype est donc facilement portable
et utilisable par des compositeurs ne travaillant pas ncessairement sur des machines
AppleTM .
2. Matlab c
est un langage interprt. La modification de certains lments du projet
nimpose donc pas de recompiler lensemble.
3. Nos recherches ont t menes paralllement la thse de Damien Tardieu, doctorant
dans lquipe Analyse-synthse des sons lIRCAM et collaborant avec nous sur laide
lorchestration. Les travaux de ce dernier ont port sur la caractrisation du timbre
instrumental laide de descripteurs du signal audio (voir section 2.6) et de llaboration
de modles dinstruments (voir section 7.1.2 et [TR07]). Or, Matlab c
est un outil de
rfrence en traitement du signal. Afin de favoriser la communication et linteroprabilit
de nos recherches, il tait donc prfrable de travailler dans le mme environnement.
4. Si Matlab c
est majoritairement utilis pour le calcul numrique, il sagit galement
dun outil de dveloppement pratique et puissant pour le prototypage, notamment pour
la conception dinterfaces graphiques.

12.1 Architecture
Notre outil daide lorchestration rpond au schma gnral de la figure 12.1. La connais-
sance instrumentale y est reprsente par la base de donnes de descripteurs et dattributs
obtenus respectivement par extraction automatique et indexation manuelle du signal audio,
partir des chantillons de SOL [BBHL99], la banque de sons instrumentaux enregistre
lIRCAM (voir paragraphe 7.1.2).
La notion de cible orchestrer a t introduite au paragraphe 7.1.1. Elle est donne en
entre par le compositeur, par le biais dun son enregistr dans le cas dune orchestration

177
178 CHAPITRE 12. PROTOTYPE ACTUEL

Compositeur

Construction
Orchestre Contraintes
de la cible

EXPORT :

Exploration / - Partition
DB Algorithme d'orchestration
dtion des - MIDI
(desc.) [+ Solveur de contraintes]
solutions - Texte
- Son

DB Simulation
(sons)

Donnes symboliques
Signal audio

Fig. 12.1 Schma gnral de loutil dorchestration


12.2. COMPOSANTES HRITES DES OUTILS EXISTANTS 179

imitative ou dun son de synthse pour une orchestration gnrative. Le compositeur doit en
outre prciser la composition de lorchestre quil utilise, et est libre de spcifier un ensemble
de contraintes supplmentaires sur les attributs des solutions quil souhaite obtenir (voir sec-
tion 7.5 et chapitre 10).
Lalgorithme dorchestration, que nous avons prsent au chapitre 9, va alors chercher selon
les critres de timbres proposs en 8.1.2 un ensemble de configurations efficientes, en optimisant
les distances entre leurs descripteurs et ceux de la cible. Au cours de cette recherche, un solveur
de contraintes (voir chapitre 10) sassure que les configurations proposes sont consistantes
avec le rseau de contraintes dfinies par le compositeur.
Une fois la recherche termine, une interface de navigation permet au compositeur dex-
plorer lensemble des configurations efficientes trouves par le systme, selon plusieurs points
de vue. Espaces de dcisions, espace des descripteurs et espace de critres (voir section 7.6)
sont simultanment accessibles lutilisateur, et ce de faon croise (les dplacements dans un
espace se propageant dans les deux autres). Coupl cette interface, un chantillonneur per-
met, grce aux chantillons instrumentaux de la base de donnes, de simuler les propositions
dorchestration.
Linterface de navigation incorpore les mcanismes dinfrence des prfrences de lutili-
sateur introduits la section 7.2.4. Le compositeur a la possibilit de relancer la recherche
partir dune solution intermdaire ; dans ce cas, le systme privilgie la combinaison de cri-
tres qui a implicitement prsid au choix de cette solution. Tout se passe donc comme si la
recherche sintensifiait dans son voisinage. Lutilisateur peut galement diter manuellement
les solutions, ainsi que les transformer par ajout de contraintes suppmentaires.
La figure 12.1 montre que le signal audio intervient de faon privilgie dans la communi-
cation entre le compositeur et loutil dorchestration, que ce soit au niveau de la construction
de la cible ou de lexploration des solutions. Ce primat du sonore permet dviter le recours
un vocabulaire peu prcis pour la caractrisation du timbre, et de se cantoner aux symboles
usuels de lcriture musicale (hauteurs, intensits, mode de jeu,. . .). De plus amples dtails sur
linteraction avec loutil seront donns au chapitre 13.

12.2 Composantes hrites des outils existants


Nous avons vu au paragraphe 4.1 que laide lorchestration est un domaine de recherche au
carefour de nombreuses disciplines. Le contrle du timbre dans un environnement de composi-
tion assiste par ordinateur impose dtablir une connexion entre la reprsentation symbolique
des structures musicales et les connaissances rcentes en psychoacoustique et en description
du signal audio. En outre, de larges banques dchantillons sonores sont ncessaires pour la
modlisation des possibilits instrumentales, et ventuellement la simulation dorchestrations.
Le dveloppement dun environnement daide lorchestration passe donc par lintgration
de toutes ces comptences au sein dun mme outil. Cest une tache videmment impossible
accomplir seul dans le cadre dune thse de recherche. Il nest donc pas surprenant que dans
sa version actuelle, notre prototype utilise un certain nombre doutils existants et ncessite
lexcution en parallle de Matlab c
dautres programmes. Il sagit l dune contrainte
lourde : en informatique musicale, les utilisateurs nadoptent en gnral une technologie que
si lensemble des oprations qui lui sont rattaches sont ralisables dans un unique environne-
ment, o si cette technologie communique de manire souple (par exemple via une architecture
matre/esclave, en gnral sous forme de plug-in ) avec un environnement de rfrence.
180 CHAPITRE 12. PROTOTYPE ACTUEL

pm2 OpenMusic Matlab MaxMSP Disque dur

Construction de
Analyse d'un son
cible abstraite
OSC Mapping des
(orchestration
fondamentales
gnrative)

OSC
Construction /
Extraction des dition de cible
partiels principaux SDIF concrte
(pm2) (orchestration
imitative)

Recherche Connaissance
d'orchestrations instrumentale

Exploration /
transformation
Sampler
des solutions
d'orchestrations
OSC

Echantillons

OSC Editeur

Fig. 12.2 Prototype daide lorchestration : espace disque et outils existants ncessaires.
Les communications internes sont en pointills ; celles par fichier ou par OSC sont en traits
pleins.

Nous sommes aujourdhui loin de cette encapsulation idale des technologies. Nous ne
pouvons pas mme dire si, dans sa version finale, loutil dorchestration sera un programme
part entire (standalone), un plug-in , ou une bibliothque (mais dans quel langage ?) dans
lenvironnement de CAO OpenMusic [Ago98]. En vrit, nous pensons quil faut dabord en
passer par une phase consquente dexprimentation auprs des compositeurs avant de dcider
dune architecture finale et dune stratgie de dveloppement ; car ces dernires devront tre
suffisamment souples et visionnaires pour intgrer les rsultats de recherches futures.
En attendant, nous tirons parti des technologies existantes et implmentons, de ma-
nire rapide et sre, les modules satellites de notre outil au sein denvironnements tels
quOpenMusic ou Max/MSP [Puc91]. Quant Matlab c
, nous y rservons le cur de
notre recherche : optimisation combinatoire multicritre (chapitre 9), gestion des contraintes
(chapitre 10), et interfaces de navigation dans les propositions dorchestration (chapitre 13).

La figure 12.2 rsume lensemble des interactions entre Matlab c


dune part, les techno-
logies et bases de donnes disponibles aujourdhui lIRCAM dautre part.
Comme on peut le constater, la majeure partie des modules externes ont t dvelopps
dans Max/MSP [Puc91], un environnement conu lIRCAM par Miller Puckette la fin des
annes 80. Comme OpenMusic, Max/MSP tablit une correspondance entre un programme
et sa reprsentation graphique sous forme de botes connects entre elles au sein dun patch .
12.2. COMPOSANTES HRITES DES OUTILS EXISTANTS 181

Mais l o OpenMusic permet, travers des structures de donnes complexes, un haut niveau
dexpressivit pour la programmation, Max/MSP propose un langage plus pauvre, mais dune
trs grande efficacit pour le contrle et le traitement du signal en temps rel. OpenMusic
est donc prfr pour la composition, tandis que Max/MSP est utilis avant tout dans des
contextes performatifs.
En ce qui nous concerne, Max/MSP sest naturellement impos pour la conception des
interfaces dans lesquelles circulent des flux audio : analyse du son cible, simulation des propo-
sitions dorchestration (sampler ), dition des solutions. Dans les deux derniers cas, la difficult
est de dclencher la lecture simultane de plusieurs chantillons de la base de sons. Cet ordre
peut tre pass aussi bien depuis Matlab c
que Max/MSP, et la lecture doit commencer
aussitt aprs, sans quoi linteraction avec le compositeur travers une coute des proposi-
tions dorchestration nest pas possible. La rapidit de Max/MSP en termes daccs disque et
de chargement des buffers audio et sa grande facilit dutilisation (due au paradigme de pro-
grammation visuelle) permettent de satisfaire ces exigences tout en conomisant de fastidieuses
heures de dveloppement. Par ailleurs laspect modulaire de Max/MSP permet dimaginer un
certain nombre de traitements possibles (individuels ou collectifs) sur les chantillons impliqus
dans une orchestration : modification continue de paramtres de jeu (intensit, hauteur. . .),
modulations (vibratos, tremolos. . .), dplacements dans lespace ( laide du spatialisateur
Spat [Jot97] par exemple). Ces mouvements permettent, travers un processus interactif
dessais/erreurs, de crer des timbres dynamiques ; ils correspondent des paramtres tradi-
tionnels de lcriture musicale. Dautres traitements sont galement envisageables, si le son
des chantillons est pens comme une matire . A linstar du compositeur Grard Buquet
(voir section 14.5), on peut en effet utiliser laide lorchestration comme un environnement
de production sonore.
La souplesse et la rapidit dans la gestion des flux audio ne sont pas les seules raisons du
choix de Max/MSP. Cet environnement comporte galement un certain nombre d objets
prdfinis, tels que le clavier de piano ou la reprsentation dun accord sous forme de partition,
qui permettent dagir de faon rapide et intuitive sur le paramtrage dune orchestration. Ces
lments sont particulirement utiles pour le mapping de fondamentales opration qui
consiste expliquer le spectre de la cible par un ensemble de spectres harmoniques (pour
plus de dtails, voir sections 13.1 et A).
Les communications entre Matlab c
et Max/MSP se font par change de fichiers tem-
poraires ou par messages OSC (OpenSound Control ) [WFM03]. Dvelopp au CNMAT1 , OSC
est un protocole de communication entre ordinateurs, synthtiseurs et contrleurs multimdia,
bas sur la norme UDP2 et optimis pour les technologies organises en rseaux.

Nous avons insist au paragraphe 7.1.1 sur la ncessit de trouver une alternative lorches-
tration imitative, dans laquelle le timbre cible est donn par le compositeur sous forme dun
son enregistr. Nous avons propos pour cela le concept dorchestration gnrative : partir
dun matriau musical symbolique (un accord par exemple), le compositeur va gnrer un son
de synthse dont les caractristiques sont dtermines par des paramtres de haut niveau.
Modifiable souhait jusqu lobtention dun timbre satisfaisant, ce son est alors considr
comme la cible dun problme dorchestration imitative. Dun point de vue formel, il sagit
dune abstraction : lisse et froid, ce son de synthse est un portrait-robot qui cristallise les
proprits acoustiques du timbre recherch. Face la difficult de caractriser verbalement le
1
Center for New Music and Audio Technology, Universit de Californie, Berkeley.
2
User Datagram Protocol.
182 CHAPITRE 12. PROTOTYPE ACTUEL

Fig. 12.3 Construction dune cible dans OpenMusic laide de paramtres exclusivement
symboliques (orchestration gnrative).

timbre (voir chapitre 2 et section 7.1.1), cest encore le moyen de sentendre sur une ide de
timbre .
Cette piste de travail a t explore en parallle de nos travaux, en collaboration avec
Jean Bresson, chercheur lIRCAM dans lquipe Reprsentations musicales, et en charge
notamment du dveloppement dOpenMusic. OpenMusic (OM) est un environnement de
CAO bas sur la programmation visuelle et dot dun haut niveau dexpressivit. Il permet
la mise en relation dobjets musicaux (symboliques ou concrets) au travers dun ensemble de
botes interconnectes au sein dun patch , et formalisant un processus compositionnel
(voir la figure 14.2 pour un exemple de patch OM).
Un objet sound-target (voir figure 12.3) a donc t implment dans OM : il prend en
entre un accord (objet chord) et propose un ensemble doutils pour sa spectralisation :
chaque note est assortie dun spectre dont les caractristiques (enveloppe, inharmonicit, fr-
quences et amplitudes des partiels. . .) sont aisment ditables. Un spectre complexe peut ainsi
tre construit, puis affin par un filtre global avant dtre rendu par un moteur de synthse
additive dans CSound [Bou00]. Le compositeur peut ainsi construire le timbre recherch
travers un processus itratif. Une fois satisfait, le son cible est envoy au systme daide
lorchestration par un message OSC.

Lextraction des descripteurs du son cible se fait dune part grce au programme ircamdes-
criptor de Geoffroy Peeters [Pee04] (dvelopp en Matlab c
), dautre pat via la commande
pm2 [Rod97] qui sert en partie de noyau au logiciel AudioSculpt [BR05]. Dans ltat actuel
12.3. CONSIDRATIONS SUR LES LIMITES ACTUELLES 183

des choses, lutilisateur a donc galement besoin dune licence pour pm2. Les rsultats de cette
analyse sont imports dans Matlab c
sous forme dun fichier SDIF3 [SW00].

En dernier lieu, notons que si la connaissance instrumentale (voir section 7.1.2) est stocke
dans une structure de donnes dont la taille avoisine les 10 mgaoctets, en revanche lensemble
des chantillons instrumentaux ncessaires aux simulations dorchestration occupe aujourdhui
un espace mmoire de plusieurs gigaoctets, et ce pour une reprsentativit seulement partielle
des possibilits instrumentales (voir paragraphe 8.1.1).
Il est vident que la simulation par lecture de simples fichiers son nest pas extensible
linfini. Deux solutions soffrent alors nous :
1. Ne retenir quun chantillon par zone de hauteur et de dynamique o le timbre varie peu,
et recourir la vole des techniques de transposition et dajustement de volume.
Cest la stratgie adopte par la plupart des samplers.
2. Dvelopper un moteur de synthse instrumentale puissant et raliste, mais cela sort to-
talement de notre domaine de comptences. Il serait alors plus raisonnable de convenir
dun format standard de donnes (de type MIDI4 ) grce auquel les propositions dor-
chestrations pourraient tre interprts par un environnement de synthse existant,
quoique la gnricit dun tel format na rien dvident. Cette question reste aujourdhui
en suspens. . .

12.3 Considrations sur les limites actuelles


Notre outil daide lorchestration est encore loin de rpondre toutes les situations
d criture du timbre : dans sa version actuelle, il ne permet de traiter quune partie des
scnarii imagins par les compositeurs (voir section 4.2). Il convient toutefois de distinguer,
parmi ces limites, celles qui tiennent ltat de nos connaissances et lavancement de nos
recherches, de celles imposes par notre approche de lorchestration assiste par ordinateur.

12.3.1 Description du timbre


Nous ne pouvons nier que la description sonore utilise dans notre systme ignore de
nombreux aspects du timbre. En outre, la pertinence dune approche multicritre utilisant des
descripteurs essentiellement harmoniques ou spectraux donc potentiellement redondants
mrite dtre pose. Nous avons toutefois montr au chapitre 8 que lorsque la cible
orchestrer peut tre dcrite de manire uniquement spectrale5 , notre approche se justifie malgr
la potentielle corrlation entre les diffrentes dimensions. Quant aux aspects temporels ou
spectro-temporels du timbre, nous renvoyons le lecteur aux travaux de Damien Tardieu [TR07]
portant sur la caractrisation du timbre instrumental laide de modles statistiques, en
rappelant que notre systme devrait en bnficier dici peu. Pour lheure, nous ne pouvons que
nous restreindre une description du son accessible notre expertise.
3
Sound Description Interchange Format. Il sagit dun format standard pour la description des sons, dfini
par lIRCAM et le CNMAT.
4
Musical Instrument Digital Interface (voir [SF97]).
5
Les timbres utiliss comme cibles de test aux chapitres 8 et 11 sont des textures polyphoniques sans
variations temporelles, et dont le spectre est relativement stable dans le temps.
184 CHAPITRE 12. PROTOTYPE ACTUEL

12.3.2 Timbre et hauteur

Tous les sons de la base de donnes constituant la connaissance instrumentale sont harmo-
niques et monophoniques. Lextraction des principaux partiels rsolus de la cible permet de
dduire la contribution de chaque son de la base un spectre simplifi , et cette contribution
se fait actuellement par le prisme de la hauteur (voir section A en annexe). Dans notre sys-
tme daide lorchestration, la hauteur est donc implicitement considre comme un attribut
privilgi, alors quune part significative de la musique contemporaine prtend au contraire
sen affranchir.
Peut-il en tre autrement ? Le problme, lorsquil sagit dvaluer le rle du timbre en
soi, est que, pour la plupart des musiques occidentales dont limportance esthtique est avre,
lutilisation du timbre est largement subordonne aux structures de hauteurs et de rythmes.
(McAdams & Saariaho, Qualits et fonctions du timbre musical, in [Bar85]). Erickson [Eri75]
confirme ce point du vue, et va jusqu douter quon puisse se passer de la hauteur : La
hauteur complique normment la situation, et il nest pas sr que lon puisse envisager des
situations o elle nintervienne pas de faon significative.
En se tournant vers le timbre (voir chapitre 2), la pense musicale a certes tempr limpor-
tance de hauteur, mais ne la pas radique pour autant. Lcriture base sur une organisation
des hauteurs a perdur avec la musique spectrale, dans laquelle le timbre est majoritairement
considr comme une agrgation fusionne de hauteurs. Dautre part, lutilisation massive de
la transforme de Fourrier, qui permet de dcomposer le son en une somme de hauteurs l-
mentaires, a trs certainement contribu au maintien du primat de la hauteur. Notre outil
dorchestration, en partant de lanalyse dun son cible et en tentant de lapprocher laide
dune mixture de sons monophoniques ne cautionne-t-il pas cette supriorit de la hauteur, et
ne favorise-t-il pas une approche spectrale de lorchestration ?
Au dbut de notre thse, les techniques lies aux descripteurs spectro-harmoniques du si-
gnal taient dj suffisamment matures pour quun modle spectral du timbre instrumental,
la fois descriptif et prdictif, puisse tre rapidement dvelopp. Nos premiers travaux [CTA+ 06]
ont ainsi concern limitation dun instrument de lorchestre par un petit groupe de deux ou
trois instruments. Lanalyse spectrale et la dcomposition harmonique de la cible travers les
MRP (voir paragraphe 8.1.2 et annexe A) procdaient de cette dmarche initiale. Dans un
second temps seulement fut-il question de problmes plus gnraux, que nous avons dlibr-
ment choisi daborder avec la mme description. Les composantes transitoires ou bruites du
timbre tant beaucoup plus dlicates modliser, il tait normal que la recherche sur laide
lorchestration se concentre dans un premier temps sur des problmes spectraux, sans jamais
cependant les traiter comme une finalit, mais comme un moyen la fois dprouver notre
approche combinatoire de lorchestration et de valider nos stratgies doptimisation bases sur
une conception descriptive du timbre.
Cette vision de lorchestration, dans laquelle le timbre comme objet danalyse induit une
organisation des hauteurs, sapparente fort la dmarche du mouvement spectral. Bien que
nayant jamais affich la volont de privilgier une esthtique musicale particulire, il est
invitable que dans les premiers temps de son mergence une technologie favorise certaines
pratiques. L o certains pourraient donc dnoncer une drive ou une focalisation esthtique,
nous prfrons y voir un point dentre vers la complexit de lorchestration. Notre recherche
nest en rien confine dans le spectralisme, mais lapproche analytique de cette dmarche la
rendue plus permable une pense scientifique qui saventurait en terre inconnue.
12.3. CONSIDRATIONS SUR LES LIMITES ACTUELLES 185

12.3.3 Libert et contrle


Aussi bien dans le cas dune orchestration imitative que dune orchestration gnrative,
lanalyse dun son est une tape incontournable de notre approche. A partir de cette analyse,
notre systme va chercher des combinaisons instrumentales dont le timbre rsultant prsente
une certaine similarit avec le son initial. Les orchestrations proposes par loutil demeurent
donc dans un rapport indpassable de subordination au son premier. La synthse instru-
mentale du son vis, toujours conditionne par lanalyse du timbre premier , ne pourra
jamais prtendre la mme libert expressive que la dmarche smantique de Varse ou de
Lachenmann (voir section 2.1), o la mise en temps et en espace du vocabulaire sonore nest
pas gouverne par un systme prexistant luvre. En revanche, elle sera plus aisment
contrlable par un outil scientifique orient vers la cration tel que celui que nous propo-
sons.

12.3.4 Fusion instrumentale


Si les fonctions dagrgation dfinies en annexe A permettent de prdire avec une prcision
acceptable (cf. chapitre 8) les valeurs de descripteurs dune configuration, rien ne permet en
revanche destimer la qualit de la fusion instrumentale des solutions proposes. En dautres
termes, rien ne permet de prdire si les orchestrations dcouvertes par notre systme seront
perues comme un accord o comme un timbre unifi (sur ce point voir Erickson [Eri75]).
Les tudes menes sur les phnomnes de fusion acoustique ont montr quils taient aussi
dlicats dcrire qu prvoir. Hormis quelques cas triviaux on sait par exemple quun
violon vibr et un accord de cuivres sont perus comme deux plans sonores distincts la
fusion instrumentale dpend de nombreux paramtres, comme la synchronicit de lentre et
de lvolution des voix, les rapports de hauteurs et dintensit, les instruments utiliss et leur
disposition spatiale. . . A lheure actuelle, nous navons pas dautre choix que de laisser au
compositeur le soin de contrler et destimer par lui-mme le niveau de fusion instrumentale.
Aprs tout, on trouve dj chez Wagner, Debussy, Schoenberg, Webern et Stravinsky des
agrgats de hauteurs que lon peroit davantage comme des timbres que des accords. Cent ans
aprs, il est donc permis de supposer chez les compositeurs une bonne connaissance de ces
mcanismes, grce laquelle il pourront adapter les orchestrations proposes par le systme
au degr de fusion instrumentale souhaite.

12.3.5 Aspects temporels


Notre systme ne pouvant aujourdhui dcrire et orchestrer que des sons stationnaires,
lvolution temporelle du timbre nest pour linstant possible que via un dcoupage de la cible
en plusieurs segments statiques. Le compositeur est donc amen dfinir autant de cibles et
rechercher autant de solutions que de segments. Non seulement cette approche ne permet
dapprhender que des tranformations relativement lentes du timbre, mais elle noffre en outre
aucun contrle sur les transitions entre les segments. Les orchestrations tant recherches de
manire indpendante, la continuit timbrale et la jouabilit des transitions sont laisses
lapprciation du compositeur. Nous verrons toutefois au chapitre 14 un exemple de timbre
dynamique dont seul le dbut a t orchestr avec notre systme, et dont la fin est dduite
par modification continue de paramtres de jeu. Nous prsenterons galement deux exemples
dans lesquels le solveur de contraintes prsent au chapitre 10 est utilis pour transformer
186 CHAPITRE 12. PROTOTYPE ACTUEL

graduellement une orchestration par lajout de contraintes supplmentaires, offrant ainsi la


possibilit dun contrle temporel du timbre laide de variables symboliques.

12.3.6 Etendue de la connaissance instrumentale


Au cours de nos multiples collaborations et rencontres avec les compositeurs, ces derniers
nont pas manqu dmettre un certain nombre de critiques sur notre outil. La principale
concerne les limitations de linstrumentarium actuellement disponible. Notre caractrisation
exclusivement spectro-harmonique du timbre restreint en effet la connaissance instrumentale
des chantillons dinstruments sons harmoniques et entretenus. Les sons de percussions,
de piano, de harpe, de guitare ou encore de pizzicati de cordes ny figurent donc pas. Bien
quils possdent tous, lexception dune certaine classe de percussions, des composantes
harmoniques et une hauteur unique clairement identifiable, leur intgration dans notre systme
ncessite une comprhension de la faon dont ils se mlangent aux son entretenus, ce qui
dpasse aujourdhui le spectre de nos connaissances.
Au caractre entretenu des chantillons instrumentaux sajoute galement une condition
dharmonicit. Notre approche de lorchestration consiste en effet expliquer un spectre
complexe par un ensemble de spectres harmoniques. Au grand dam de nombreux compositeurs,
les instruments spectre complexe (tels que certaines percussions ou les vents en multipho-
nique ) ne peuvent donc intervenir dans nos propositions dorchestration. Leur incorporation
linstrumentarium ncessiterait de repenser notre critre harmonique : comment en effet
qualifier la contribution de ce type de sons aux principaux partiels rsolus de la cible en dehors
du prisme monophonique ? Cest une question qui reste pour linstant ouverte.
Nous ne devons cependant pas oublier que la connaissance instrumentale de notre systme
est encore bien loin de couvrir lensemble des sons harmoniques et entretenus. Tuba, accor-
don, saxophones, contrebasson, clarinette basse, trombone basse, flte picolo, flte basse
produisent des timbres accessibles nos descripteurs et leur utilisation est frquente dans les
grands orchestres comme dans les ensembles. La gnralisation du notre outil dorchestration
pourrait donc dj commencer par lajout de ces instruments, ainsi qu la possibilit pour
linstrumentarium complet de jouer en quarts de tons.

La possibilit pour les compositeurs de complter la connaissance instrumentale laide de


leurs propres banques de sons est galement apparue, au cours des divers changes et collabo-
rations avec ces derniers, comme un enjeu crucial. Nombreux sont en effet les compositeurs qui
travaillent partir desquisses enregistres par leurs futurs interprtes et qui prfrent utiliser
ces sons plutt que ceux du systme. Le cas dun compositeur/interprte ayant une connais-
sance plus approfondie que le systme sur la pratique de son instrument peut galement se
prsenter. Enfin, lapport de sons lectroniques doit galement permettre dutiliser loutil pour
des pices mixtes.
Toutes ces raisons justifient la possibilit de pouvoir personnaliser la connaissance
instrumentale de loutil daide lorchestration, via une interface dvolue la cration de
nouveaux instruments, couple un outil automatique dextraction de descripteurs. Cette
fonctionnalit requiert toutefois que les sons imports par lutilisateur soient cohrents en
termes de dynamiques avec les sons natifs du systme, sous peine dobtenir des orchestra-
tions aberrantes du point de vue des quilibres acoustiques entre les diffrentes sources. L
encore, il nexiste pas de rponse toute faite. On peut ventuellement envisager une procdure
bien calibre pour ajuster le gain des chantillons en fonction dune dynamique thorique don-
12.3. CONSIDRATIONS SUR LES LIMITES ACTUELLES 187

ne par lutilisateur. Une telle solution na rien dvident mettre en uvre, car lintensit
perceptive est une donne minemment subjective. En outre, elle ne rsout pas le problme
des sons lectroniques, pour lesquels la notion de dynamique au sens dune intention de
compositeur laisse lapprciation des interprtes nexiste pas vraiment.
188 CHAPITRE 12. PROTOTYPE ACTUEL
Chapitre 13

Scnario dutilisation

Un exemple dorchestration imitative


Relance de lalgorithme partir dune solution intermdiaire
Contrle de lvolution temporelle laide de contraintes
Ce chapitre est un exemple dorchestration imitative dont le processus complet, du son
cible initial la partition dfinitive, est dtaill tape par tape. La notion dinterface avec
lutilisateur est ici centrale. Les concepts utiliss ont tous t introduits dans les chapitres
prcdents, lexception toutefois de la notion de clustering par schmas (voir section
13.2), qui permet de regrouper les solutions efficientes en catgories distingues selon des
paramtres symboliques. Le lecteur est invit avoir en tte les schmas des figures 12.1 et
12.2.

13.1 Donnes dentre


Les lments permettant de contrler le systme en entre sont reports figure 13.1. La fe-
ntre de gauche permet de dfinir leffectif orchestral. Au centre, un patch Max/MSP contrle
lanalyse du son orchestrer ainsi que le mapping de fondamentales (voir infra). A droite,
les partiels de la cible sont projets sur un ensemble de spectres harmoniques.
Le patch central se dcompose lui-mme en deux blocs principaux. Dans la partie su-
prieure, une visualisation en forme donde permet de slectionner une partie stable du
timbre reproduire. Un certain nombre de paramtres contrlent galement lextraction des
principaux partiels rsolus (MRP voir paragraphe 8.1.2 et annexe A) par le programme
pm2. La partie infrieure est utilise pour relier les MRP un ensemble rduit de hauteurs
fondamentales sur ces partiels. Cet ensemble de hauteurs agit comme un filtre sur la base
de donnes constituant la connaissance instrumentale : les sons dont la hauteur nappartient
pas lensemble ne peuvent pas figurer dans les propositions dorchestration. Lhypothse
sous-jacente est quils ne possdent pas de partiels communs avec les MRP de la cible.
Dans le cas prsent, la cible est un son de trombone jou avec une anche de basson (ce
problme nous a t soumis par le compositeur Yan Maresz). Nous avons ici choisi dextraire 25
partiels principaux avec une rsolution frquentielle (f 0min ) de 50 Hz. Selon le type de cible,
les valeurs de ces paramtres peuvent tre capitales pour la pertinence de lanalyse. Vient
alors ensuite une autre tape cruciale pour la russite de lorchestration : la dtermination des
hauteurs parmi lesquelles lalgorithme de recherche pourra choisir les sons candidats. Plusieurs
possibilits soffrent lutilisateur :

189
190 CHAPITRE 13. SCNARIO DUTILISATION

Fig. 13.1 Choix dun orchestre et interface danalyse de la cible


13.2. VISUALISATION DES SOLUTIONS 191

1. Dfinir manuellement les hauteurs possibles. Un systme de claviers (le second est un
quart de ton plus haut que le premier) est prvu cet effet dans la partie infrieure du
patch Max/MSP.
2. Dduire automatiquement des frquences de partiels les hauteurs fondamentales sus-
ceptibles de les expliquer. Cette mthode t prsente dans [CTA+ 06] et donne de
bons rsultats lorsque le son cible est harmonique ou une mixture de sons harmoniques.
Elle prend toutefois en argument des paramtres dpendant du problme et en gnral
dlicats fixer.
3. Convertir les frquences des partiels en hauteurs de note par approximation au quart de
ton le plus proche : cest la technique habituelle des compositeurs spectraux , et la
mthode par dfaut dans notre systme.
Dans les deux derniers cas, lutilisateur a videmment la possibilit dditer manuellement les
hauteurs suggres par le systme. Cest dailleurs ce que nous avons fait en rajoutant la note
E2 (voir figure 13.1), trs prsente lcoute, mais dont la frquence nappartient pas aux
principaux partiels rsolus (MRP).
Suite cette tape, seuls les sons dont la hauteur appartient lensemble prcdemment
construit pourront figurer dans les propositions dorchestration. Avant de lancer la recherche,
la connaissance instrumentale est donc filtre selon lattribut hauteur , et la contribution
aux MRP de chacun des candidats est calcule selon la mthode expose en annexe A. Les
contributions sont calcules par groupes de mme hauteur : ce que nous avons appel en infra le
mapping des fondamentales consiste projeter chaque hauteur prcdemment slectionne
sur les MRP de la cible. En pratique, nous associons chaque hauteur un peigne harmonique
thorique (sans inharmonicit1 ) et nous identifions les harmoniques dont la frquence concide
( une erreur relative prs) avec un partiel de la cible. La fentre de droite de la figure 13.1
illustre cette mise en correspondance. Tous les sons de hauteur Mi2 (premire srie rouge)
contribuent aux MRP numros 2, 4, 6, 8, 9, 11, 12, 13, 16, 17, 20, 21, 24, 25 de la cible. Tous
les sons de hauteur Si2 (premire srie verte) contribuent aux MRP numros 1, 2, 3, 6, 11, 17,
19, 21, 24, 25 de la cible, etc. Un son de hauteur Sol#6 haut ne contribue quau 24e MRP, un
son de hauteur Mi7 au 25e . Il y a contribution si lerreur relative entre la frquence thorique
de lharmonique et la frquence dun MRP est infrieure un certain seuil, modifiable par
lutilisateur.

A la fin de ce processus, qui pour certaines cibles peut tre assez long, les descripteurs de
la cible ont t extraits, la banque de sons filtre selon les hauteurs et les contributions aux
MRP de la cible calcules pour chaque son candidat. La recherche dorchestrations peut alors
commencer. Cette tape, qui constitue lessentiel de notre travail, nest pas dcrite ici. Nous
renvoyons pour cela le lecteur au chapitre 9.

13.2 Visualisation des solutions


Lorsque lalgorithme de recherche se termine, les configurations efficientes sont retournes
lutilisateur et peuvent tre visualises selon plusieurs points du vue :
1
Ngliger linharmonicit, cest--dire le fait que les frquences des partiels ne soient pas exactement des
multiples de la frquence fondamentale, nest pas aberrant pour des instruments son entretenu (i.e. fonc-
tionnant en rgime forc). On sait en effet que les phnomnes de dviation harmonique sont beaucoup plus
marqus dans les instruments rgime libre, comme les percussions ou les cordes frappes ou pinces.
192 CHAPITRE 13. SCNARIO DUTILISATION

Fig. 13.2 Navigation dans lensemble des solutions


13.2. VISUALISATION DES SOLUTIONS 193

1. Description textuelle de la solution couramment explore : situe en haut droite de la fi-


gure 13.2, une fentre donne un accs aux composantes de la solution courante. Lorches-
tration peut tre simule globalement travers un sampler dvelopp dans Max/MSP
(voir section 12.2), et chaque composante peut tre entendue sparment.
2. Navigation dans lespace des critres : la fentre en bas gauche sur la figure 13.2
permet dexplorer lapproximation du front de Pareto dans lespace des critres. Le
dtail de la solution slectionne est envoy dans la fentre de solution courante et
lorchestration correspondante est simule dans le sampler. Lutilisateur peut choisir
de balayer les solutions individuellement ou par groupe ; dans ce dernier cas, un
algorithme de clustering hirarchique permet de diviser lapproximation en un nombre de
sous-ensembles dfini par lutilisateur. Un reprsentant est identifi pour chaque cluster
et envoy dans la fentre de solution courante lorsquun des lements du cluster est
slectionn.
3. Navigation par valeurs de descripteurs : Dans cette fentre (en bas droite sur la figure
13.2), lutilisateur a accs aux descripteurs des solutions. Lapproximation est projete
dans un espace bi-dimensionnel, permettant la navigation selon deux descripteurs sca-
laires (moments spectraux) ou un descripteur vectoriel (MRP), comme cest dailleurs
le cas sur la figure 13.2.
4. Navigation par valeurs dattributs : ce dernier mode de reprsentation (en haut gauche
sur la figure 13.2) offre la possibilit de parcourir lensemble des solutions selon un attri-
but particulier, cest--dire une caractristique symbolique en lien direct avec lcriture
musicale : hauteur, dynamique, mode de jeu, etc. Lapproximation est reprsente sous
forme dun arbre dont les solutions de chaque sous-arbre comportent des caractristiques
symboliques communes. Un sous-arbre peut donc tre reprsent par une abstraction
ou, pour rester dans le jargon des algorithmes gntiques, un schma . Le composi-
teur a ainsi une comprhension intuitive de la faon dont sont distribues les diffrentes
critures proposes pour orchester une mme cible. La construction de cet arbre fait
appel la notion de clustering par schmas , que nous dtaillons en infra dans cette
section.
Les diffrents lments de notre interface de navigation sont dpendants les uns des autres, de
telle manire que la slection dune solution ou dun groupe de solutions dans une fentre est
automatiquement propage aux autres vues. Sur la figure 13.2, le sous-arbre en rouge de
lespace des attributs a t slectionn ; les solutions correspondantes apparaissent galement
en rouge dans lespace des critres et dans lespace des descripteurs2 . Cette mise en relation
des diffrents points de vue illustre les correspondances entre espace des dcisions (monde du
compositeur), espace des descripteurs (monde psychoacoustique) et espace des critres (monde
de loptimisation)3 . Dun point de vue calculatoire, le passage du premier au dernier se fait
par application successive des fonctions dagrgation et fonctions de comparaison. Linterface
de navigation permet de dpasser cette unilatralit et dobserver la transmission, dun espace
lautre, des similitudes et des dissemblances.
2
Seuls les MRP du sous-ensemble sont reprsents dans ce mode de vue ; ceux de la cible y apparaissent en
violet.
3
Les caractristiques de ces espaces ont fait lobjet de la section 7.6. Nous y avons notamment vu que seul
le troisime pouvait supporter la notion doptimalit, au prix dune formalisation dont la pertinence a t
prouve au chapitre 8.
194 CHAPITRE 13. SCNARIO DUTILISATION

Clustering hirarchique par schmas


La construction de larbre symbolique reprsent sur la fentre suprieure gauche de la fi-
gure 13.2 fait appel la notion de clustering par schmas . Lide matresse est de construire
un arbre hirarchique dont chaque nud incorpore une information sur les proprits de son
sous-arbre. Le clustering par schmas sapparente un clustering hirarchique classique dans
lequel un nouvel lment est cr chaque regroupement, reprsentant les proprits com-
munes du groupe.
Nous avons vu au chapitre 9 que lespace des dcisions pouvait tre dfini comme un
produit de domaines finis, chaque domaine tant associ un instrument de lorchestre. Chaque
solution du probme dorchestration est donc reprsente par un N -uplet de D = D1 ... DN
(voir section 9.2). Nous commenons par tendre lespace de recherche D = D1 ... DN ,

avec Dn = Dn {}, o reprsente nimporte quel lment de Dn . Un N -upluet de D


comporte donc des lments dtermins (appartenant aux domaines Dn ) et des lments non
dtermins, marqus par le symbole . Il reprsente ainsi un ensemble de solutions qui peut
tre obtenu en instanciant les coordonnes marques par le symbole . Nous donnons cette
abstraction le nom de schma , par analogie avec les schmas gntiques. Plus le nombre
de symboles est lev, plus le schma correspond un niveau dabstraction lev. Nous
munissons alors D dune distance de hamming d , dfinie comme le nombre de coordonnes
diffrentes entre deux N -uplets, aux symboles prs.
Les lments initiaux du clustering hirarchique sont soit les configurations efficientes,
soit des abstractions de ces configurations selon un attribut particulier. Sur la figure 13.2
les configurations ont par exemple t remplaces par des abstractions selon la hauteur de
note : au lieu de dsigner une configuration par la liste prcise des attributs de chacune de ses
composantes, on sen tient la seule information de hauteur pour chaque instrument, les autres
paramtres de lcriture ntant pas considrs. Les coordonnes des configurations sont dans
ce cas des hauteurs (il existe donc plusieurs ralisations possibles dune mme configuration,
dfinie au mode de jeu, la dynamique, la sourdine et la corde prs), et le symbole
dsigne nimporte quelle hauteur jouable par linstrument en question.
Le processus du clustering hirarchique commence par calculer les distances d pour chaque
paire de configurations. Les configurations les plus proches sont regroupes au sein dun mme
cluster et leurs coordonnes communes permettent de construire un schma rprsentatif du
groupe (les coordonnes dont les valeurs changent au sein du groupe sont remplaces par
le symbole ). Les nouveaux schmas sont ensuite ajouts aux configurations qui nont pas
encore t regroupes et le processus se poursuit itrativement jusqu lobtention dun schma
unique. Plus on avance dans la construction de larbre, plus le niveau dabstraction des schmas
augmente. Lorsque deux schmas identiques naissent de sous-groupes diffrents, ceux-ci sont
fusionns en un groupe unique.

La fentre en haut gauche sur la figure 13.2 reprsente le rsultat dun clustering par
schmas sur les hauteurs de note. Les solutions sont reprsentes en bas de larbre par des
cercles. Les schmas apparaissent sous formes de petits carrs, et leur hauteur dans larbre
correspond leur niveau dabstraction : le schma slectionn (sous-arbre rouge) est situ deux
niveaux au dessus des solutions et comporte deux fois le symbole . Toutes les configurations
de ce cluster ont donc dix caractristiques communes : la clarinette joue toujours un La5#
haut, le basson un Fa#4, la trompette un Mi5, etc. Le second violon ne joue jamais. Ce qui
diffrencie les solutions au sein du groupe sont les hauteurs joues par le violoncelle et le
13.3. EDITION, AFFINAGE, TRANSFORMATION 195

Fig. 13.3 Edition manuelle dune solution

premier violon. Le schma associ au nud courant est reprsent dans la partie droite de la
fentre. Chaque cluster est reprsent par la solution qui minimise la somme des distances aux
autres membres du groupe dans lespace des critres normaliss. Cest ce reprsentant qui est
envoy dans la fentre de solution courante et jou dans le sampler.

Le clustering hirarchique par schmas permet au compositeur didentifier des grandes


catgories dcriture pour la cible orchestrer. Deux lments proches dans larbre sym-
bolique correspondent deux orchestrations similaires, deux lments lontains prsentent des
cararctristiques symboliques diffrentes. Par dfaut, lattribut utilis pour la catgorisation
est la hauteur, mais on peut trs bien construire larbre laide dune distance sur le mode de
jeu, la dynamique, ou encore, si cela a un sens, la sourdine.
La notion de schma symbolique est en lien direct avec celle de schma gntique (voir
section 9.2) : de faon vidente, deux lments dun mme cluster engendrent par crossover
(change alatoire des coordonnes) deux rejetons qui partagent toujours le mme schma
symbolique. Les clusters symboliques sont donc stables par application du crossover. Cette
remarque nous permet peut-tre de concevoir une application moins aveugle du crossover au
cours de la recherche gntique. Si nous voulons intensifier la recherche dans une zone particu-
lure de lespace de recherche, on peut alors restreindre le crossover aux lments dun mme
cluster de faible niveau dabstraction. A linverse, appliquer le crossover des lments trs
loigns dans larbre symbolique encourage lexploration de lespace de recherche. A mditer
pour une recherche future. . .
196 CHAPITRE 13. SCNARIO DUTILISATION

13.3 Edition, affinage, transformation


Lors de lexploration des configurations efficientes, une option permet darchiver une so-
lution courante juge intressante par le compositeur dans un magasin au sein duquel
plusieurs oprations ddition et de transformation sont possibles.
La commande edit ouvre la solution courante dans une interface ddition dveloppe
en Max/MSP et reprsente sur la figure 13.3. Cet environnement se prsente comme une
table de mixage dont chaque piste est attribue un instrument. Lutilisateur a ainsi la
possibilit de modifier manuellement les chantillons de lorchestration suggre par le systme,
ainsi que dajuster les niveaux et les panoramiques (position dans lespace strophonique) de
chaque piste, afin de parfaire le ralisme de la simulation. En ce qui nous concerne nous avons
simplement modifi la dynamique de la clarinette par rapport la solution de la figure 13.2 :
en diminuant simplement la dynamique de mf pp, nous amliorons le niveau de fusion dans
la mixture.
Lorsque le compositeur est satisfait avec une proposition dorchestration, une commande
redraw permet de relancer lalgorithme de recherche afin damliorer cette dernire. Les prf-
rences dcoute (i.e. les poids relatifs associs aux critres) sont dduites des valeurs de critres
de la solution intermdiaire (voir paragraphes 7.2.4 et 9.3) par la mthode dcrite en annexe B.
Une population initiale est alors forme, constitue pour moiti de clones de la solution inter-
mdiaire, pour moiti de configurations instancies alatoirement. Lalgorithme 4 est relanc
avec pour fonction de fitness la norme induite (voir section 8.5.1) par la solution intermdiaire.
La recherche est donc favorise vers la zone de lespace des critres domine par cette solution.
Les poids relatifs des critres tant dsormais fixs, le problme devient mono-critre.
Lorsque lalgorithme se termine, la population finale peut tre totalement ordonne
laide de la norme induite par la solution intermdiaire. Sous lhypothse que les prfrences
dcoute du compositeur peuvent tre dduites de cette solution, toutes les configurations de
norme infrieure sont en thorie plus proches perceptivement de la cible. Dans le cas prsent,
nous choisissons de remplacer la solution intermdiaire par la meilleure solution obtenue aprs
relance de lalgorithme, comme le montre la figure 13.4. La mention (D) indique que la solution
domine la solution intermdiaire au sens de Pareto. Une comparaison avec la figure 13.2 fait
apparatre un noyau invariant entre les deux orchestrations : la clarinette (dont la dynamique
avait t manuellement modifie), la flte, le cor, le hautbois et le trombone nont pas t
changs.

La solution ainsi obtenue va alors pouvoir tre insre dans un mouvement orchestral
dvelopp et contrl laide de contraintes supplmentaires. Lalgorithme CDCSolver pr-
sent au chapitre 10 possde la particularit de ne modifier quune seule coordonne la fois
au cours de la rsolution. Il est donc possible, en partant dune solution initiale et dun rseau
de contraintes, de transformer continument cette solution pour parvenir un autre timbre.
L enregistrement de lvolution se fait en conservant la trace de lalgorithme de rsolution.
Celle-ci se prsente alors comme une suite de configurations dans laquelle un seul instrument
est modifi chaque tape. Rappelons que lalgorithme de rsolution de contraintes utilis dans
ce cas par opposition la procdure de rparation des configuration initiales (voir chapitre
10) incorpore des notions doptimisation. Lors du mouvement vers une configuration voi-
sine, le niveau de violation des contraintes ainsi que la fitness selon la fonction scalarisante
en cours (voir section 5.7) sont simultanment considrs travers la notion de dominance
au sens de Deb (voir dfinition 6.1). Lvolution se fait donc de manire certes amliorer
13.3. EDITION, AFFINAGE, TRANSFORMATION 197

Fig. 13.4 Intensification de la recherche partir dune solution intermdiaire

le niveau de consistance mais galement pnaliser le moins possible (voire diminuer) la


fonction de fitness, garantissant une certaine continuit de timbre entre deux configurations
voisines.
La figure 13.5 illustre ce processus. Partant de la solution de la figure 13.4, nous avons
impos les contraintes suivantes :
1. Dans lorchestration finale, tous les instruments jouent lunisson.
2. Lorchestration finale doit mobiliser au minimum trois instruments.
3. Lorchestration finale doit mobiliser au maximum trois instruments.
4. Dans lorchestration finale, tous les instruments doivent jouer avec dynamique pp.
Ces quatre contraintes apparaissent dans la partie suprieure de la figure 13.5. Dans la partie
infrieure, une rsolution trace en onze tapes aboutit une solution consistante.
Une fonction dexport de partition via le format libre de notation musicale abc permet
alors dobtenir la partition du mouvement complet (voir figure 13.6). La progression a t ici
transcrite dans lordre inverse de la rsolution : elle commence avec trois instruments lunisson
et finit avec limitation du son original. Chaque mesure reprsente une tape intermdiaire
du calcul, et le passage dune mesure la suivante se fait par modification dun seul lment.
Remarquons que la note conserve pour lorchestration initiale est un Do5, partiel damplitude
maximale dans la cible (voir figure 13.1). Au cours de la rsolution, le mouvement vers une
configuration voisine est en effet gouvern par la notion de dominance au sens de Deb (voir
dfinition 6.1) : lalgorithme cherche dabord satisfaire les contraintes, mais au prix dune
dgradation minimale de la fonction de fitness.
198 CHAPITRE 13. SCNARIO DUTILISATION

Fig. 13.5 Transformation progressive du timbre laide de contraintes


13.3. EDITION, AFFINAGE, TRANSFORMATION 199

Fig. 13.6 Partition finale dune lorchestration imitative et volutive. A chaque mesure, seul
un lment est modifi. Partition en Ut.
200 CHAPITRE 13. SCNARIO DUTILISATION
Chapitre 14

Exemples et productions

Exemples dorchestrations (imitatives et gnratives)


Contraintes et contrle temporel du timbre
Ecriture pour bande et production sonore

Nous reportons dans ce chapitre des exemples probants dorchestration obtenus laide
de notre systme. Dans le premier, la cible est un son concret pr-enregistr ; dans le second
lenvironnement de CAO OpenMusic a t utilis pour gnrer un son cible partir dun
accord crit. Le troisime est une requte du compositeur Oscar Bianchi. Il sagit dun timbre
dynamique dont seule la premire partie est orchestre avec notre systme, en spcifiant des
contraintes qui permettent de dduire la seconde partie. Le quatrime exemple rsulte
dune collaboration avec le compositeur Jonathan Harvey. La encore, des contraintes sont
utilises pour le contrle temporel du timbre, mais lensemble du mouvement est gouvern
par une fonction objectif globale traduisant une intention prcise du compositeur. Enfin, le
dernier exemple est tir dun travail rcent avec le compositeur Grard Buquet, dans lequel
loutil dorchestration est utilis comme un environnement de production sonore. Tous ces
exemples peuvent tre couts en ligne sur le site : http://recherche.ircam.fr/equipes/repmus/
carpentier/phdsounds/.

14.1 Deux orchestrations de klaxon


La cible orchestrer est ici un son de klaxon de voiture, enregistr dans la rue. Il sagit
dun timbre polyphonique dans lequel deux hauteurs sont clairement identifiables, G#4 et
C5 (C4 correspondant au Do central). Lespace de recherche a donc t limit aux sons de
hauteurs G#4 et C5, plus leurs harmoniques respectives : G#5, C6, D#6, G6, etc.
La figure 14.1 reporte la transcription de deux orchestrations de ce mme son de klaxon,
la premire laide dun petit ensemble de vents, la seconde avec un petit ensemble de cordes.
La partition est en hauteurs relles, y compris lharmonique artificielle de contrebasse dont la
notation ne correspond pas lusage mais est plus lisible dans une partition en Ut.
De faon surprenante, limitation semble moins convaincante avec les vents quavec les
cordes. Cela est sans doute d une plus grande homognit des familles et des dynamiques
dans le second cas, favorisant davantage la fusion des timbres. De plus, mme si lorchestration
des vents est plus proche du son cible du point de vue de la brillance, le grain des cuivres dans
le fortissimo engendre une rugosit quon ne retrouve pas dans le klaxon original.

201
202 CHAPITRE 14. EXEMPLES ET PRODUCTIONS

Fig. 14.1 Deux orchestrations dun mme son de klaxon (en haut avec un ensemble de
cuivres, en bas avec un ensemble de cordes). Partition un Ut.
14.2. UNE CIBLE CONSTRUITE DANS OPENMUSIC (TRISTAN MURAIL) 203

Fig. 14.2 Un patch dans OpenMusic gnrant une cible partir dun accord

14.2 Une cible construite dans OpenMusic (Tristan Murail)


Cet exemple a t propos par le compositeur Tristan Murail. A dfaut dun son enregistr
(orchestration imitative), le point de dpart est ici un accord crit (G2, C#3, A#3, G#4,
B4+1 ), partir duquel il sagit de gnrer un timbre. Le compositeur a ici eu recours au
programme OpenMusic [Ago98] pour transformer laccord initial en un son de synthse. Ce
processus illustre le concept dorchestration gnrative introduit dans les paragraphes 7.1.1 et
12.1.
OpenMusic (OM) est un environnement de programmation visuelle pour la Composition
assiste par ordinateur (CAO), dvelopp lIRCAM par Grard Assayag, Carlos Agon et
Jean Bresson. Dans OM, il y a une parfaite quivalence entre un programme et son expression
visuelle sous frome de patch . Un patch est une fentre comportant des botes connectes
entre elles, reprsentant des objets musicaux, des fonctions,. . .ou des patches. Des connexions
relient les entres et sorties des fonctions, ainsi que les divers champs des objets. Lvaluation
se fait du haut vers le bas : lvaluation dune fonction ou dun objet dclenche le calcul
de tous les lments situs en amont.
La figure 14.2 est un patch OM prenant en entre laccord (G2, C#3, A#3, G#4, B4+).
Celui-ci est tout dabord complt par lajout dharmoniques naturelles grce la fonction
harm-series, puis les dynamiques sont ajustes grce un profil denveloppe spectrale. Lac-
cord rsultant est alors transform en un ensemble de couples frquence/amplitude engendrant
un son cible via une mthode de synthse additive.
Lorchestration du son synthtis est reporte figure 14.3. Toutes les hauteurs de laccord
1
La signe + renvoie la notation en quarts de tons : B4+ signifie donc un quart de ton au dessus
de Si4 , ou encore Si4 haut .
204 CHAPITRE 14. EXEMPLES ET PRODUCTIONS

G#4

D4

B4+

D4

A#3

C#3

G2

Fig. 14.3 Orchestration dun son de synthse gnr partir dun accord dans OpenMusic
(les notes en rouge font partie de laccord initial). Partition en Ut.

initial sont prsentes, compltes par deux sons de hauteur R4, troisime harmonique de
Sol2. Lorchestration rsultante possde les mmes caractristiques harmoniques que le son de
synthse, auxquelles sajoutent la richesse des petites variations du timbre instrumental.

14.3 Une cible dynamique (Oscar Bianchi)


Lenthousiasme dont le compositeur Oscar Bianchi a fait preuve lgard de nos travaux
la rcemment amen travailler avec nous en vue dune future pice pour orchestre. Lune
des cibles alors donnes par le compositeur est particulirement intressante : elle illustre de
quelle manire lorchestration dun timbre qui varie dans le temps peut, dans certains cas,
tre obtenue en travaillant dans un premier temps sur une partie statique du son, puis en
propageant lorchestration obtenue aux autres parties. De faon vidente, rien nest ici
possible sans le savoir et lintuition du compositeur. Mais noublions pas que notre systme
nest pas un orchestrateur artificiel , mais un outil daide lorchestration : il ne donne pas
de solutions toutes faites, mais suggre des pistes de travail.
Le son propos dans cet exemple est une succession de deux phonmes chants : le premier
est une voyelle OU dans le grave, fortement harmonique et relativement longue ; le second
est une voyelle AH courte et majoritairement bruite (elle comporte peu de composantes
sinusodales). Ce son est reprsent sous forme de sonagramme2 sur la figure 14.4.
La premire voyelle tant de plus grandes dure et harmonicit que la seconde, nous com-
menons par chercher une orchestration sur ce segment. Anticipant sur la propagation de
ce timbre au phonme suivant, nous imposons, laide du formalisme introduit au chapitre
10 les deux contraintes suivantes :
1. Lorchestration doit contenir au moins un cuivre pdale de hauteur G#1 : cette
contrainte permet dobtenir la fois la hauteur fondamentale du son cible ansi que
2
Le temps est en abscisse, les frquences en ordonnes. La valeur de gris est proportionnelle lintensit du
spectre.
14.4. SPEAKINGS (JONATHAN HARVEY) 205

Fig. 14.4 Une cible constitue de deux phonmes chants.

le caractre rugueux (pdale3 ) de la voix chante cette hauteur (trs grave).


2. Lorchestration doit contenir au moins trois cuivres avec une sourdine wah-wah en po-
sition ferme : lorsquon passe rapidement de la position ferme la position dune
wah-wah sur un cuivre, on obtient un son qui sapparente un OU-AH (do le nom
de la sourdine). En faisant jouer la syllable OU avec une sourdine en position ferme,
on prpare ainsi la transition vers la syllabe AH , qui pourra tre obtenue, en autres,
laide dune ouverture rapide.
Sur la partie gauche de la figure 14.5 a t reproduite une proposition retourne par le
systme pour la premire syllabe. Le signe + sur les cuivres indique la position ferme de
la sourdine. La figure de droite illustre le mouvement de OU vers AH , obtenu laide
de crescendos et dune ouverture brusque des sourdines (signe o ). Notons en outre que
certaines dynamiques ont t ajustes manuellement.

14.4 Speakings (Jonathan Harvey)


Cet exemple rsulte dune collaboration avec le compositeur britanique Jonathan Harvey
pour sa pice pour orchestre et lectronique Speakings, commande commune de lIRCAM, de
la BBC et de Radio-France. Comme le suggre le titre de la pice, le compositeur sest attach
lide dun orchestre imitant les timbres de la voix humaine. Nous avons rencontr le com-
positeur dans un studio de lIRCAM aprs quil a eu vent du projet sur laide lorchestration
et manifest son dsir dutiliser cette technologie pour lcriture de Speakings.
Au dbut de la troisime partie de cette pice, une partie de lorchestre excute un ostinato
(i.e. un motif longuement rpt) qui sert de trame harmonique sur laquelle les autres
instruments, notamment le trombone, voluent en solistes. Cette texture orchestrale a
3
Les notes pdales sur les cuivres correspondent au registre le plus grave et se caractrisent par la prsence
de battements (forte modulation damplitude).
206 CHAPITRE 14. EXEMPLES ET PRODUCTIONS

aeol+ord aeol+ord

Fl & c #w #w

Cl &c

#w #w
harm-fngr harm-fngr

Bn
?c
p p

Hn & c #w #w
F F
+ + o
wah-wah wah-wah

Tp & c #w #w
F
+ + o
wah-wah wah-wah

Tb
? c #w #w
F

?c
pdl-tone pdl-tone

Tb

#w #w
f F
o
?c + +
wah-wah wah-wah

Tb
#w #w
F

& c #w
sordina sordina

Vn #w

#w #w
sordina sordina

Va Bc

?c
Vc
#w #w
F F
Cb
?c
#w #w
F
Solution initiale (statique) Solution rcrite (dynamique)

Fig. 14.5 Orchestration dun timbre dynamique par propagation dun timbre statique.
Partition en Ut.
14.4. SPEAKINGS (JONATHAN HARVEY) 207

Fig. 14.6 Mantra chant par le compositeur Jonathan Harvey

t entirement crite laide de loutil dorchestration partir dun mantra chant par le
compositeur (voir figure 14.6).
Jonathan Harvey souhaitait que le motif de la figure 14.6 soit rpt 22 fois, non pas
lidentique, mais en respectant les directions dvolution suivantes :
1. La dynamique de lostinato doit aller crescendo au cours des 22 rptitions.
2. Le son de lorchestre doit devenir de plus en plus brillant, et se rapprocher de plus en
plus du timbre des voyelles chantes.
3. Les orchestrations doivent utiliser des hauteurs de plus en plus leves (harmoniques des
notes fondamentales chantes), et composer des accords de densit harmonique (nombre
de hauteurs diffrentes) croissante.
Loutil dorchestration ntant pas directement utilisable pour traiter ce problme, nous avons
donc procd de la manire suivante :
1. Le sous-orchestre mobilis pour jouer lostinato tant compos de 13 musiciens, au
plus 13 notes sont jouables simultanment. Pour chaque voyelle chante, nous avons donc
gnr 13 ensembles de 10 solutions chacun, avec pour le k-ime ensemble, la contrainte
davoir au moins k hauteurs diffrentes dans les propositions dorchestration.
2. Pour chaque voyelle chante, nous avons donc obtenu 130 solutions de timbres varies,
pour lesquelles nous avons calcul plusieurs descripteurs : Intensit perceptive, centrode
spectral, MRP (voir section 8.1.2 et annexe A), nombre de sons utiliss, densit harmo-
nique, hauteur maximale.
3. Pour chaque voyelle, nous avons enfin utilis un algorithme de recherche locale pour
trouver un chemin reliant 22 solutions parmi 130, de telle manire que les valeurs
des descripteurs ci-dessus soient des fonctions croissantes du temps.
Un extrait de la solution totale calcule par cette procdure est reproduit sur la figure
14.7, et la partition finale de ce passage est donne figure 14.8 (les parties crites laide du
systme dorchestration sont surlignes en rose). Dans lensemble, lorchestration suggre par
le systme t conserve par le compositeur, quelques modifications prs. Ces dernires
concernent essentiellement la conduite des voix, cest--dire la cohrence interne de chaque
partie, dans son dveloppement horizontal, mlodique . Notre outil dorchestration na en
effet pour linstant quune vision verticale, harmonique , de la texture. En outre, labsence
de contraintes dexcution dans notre modlisation engendre immanquablement des enchane-
ments irralisables. Par exemple, le trompettiste qui veut scrupuleusement suivre la partition
de la figure 14.7 doit changer de sourdine au milieu de la 13e mesure, lenlever sur le premier
temps de la 14e , puis en changer encore deux fois sur les deux temps suivants. Cest videm-
ment parfaitement impossible, et le compositeur a choisi de garder la mme sourdine pour le
passage entier.
Une autre diffrence remarquable est la disparition aux cordes des legno-tratto , mode
de jeu contemporain qui consiste jouer avec le bois de larchet au lieu de la mche. Le son
208 CHAPITRE 14. EXEMPLES ET PRODUCTIONS

13 14
!
Fl
)&"1!"#$ )&"1!"#$ )&"1!"#$ )&"1!"#$ )&"1!"#$
pp mf pp mf ff ff

Ob
*)#,!9'2# *)#,!9'2# *)#,!9'2#
pp p pp p p
!
Cl

)&"1!"#$
)&"1!"#$
mf mf pp mf pp pp

Hn
:+"%%&$
mf ff mf ff mf mf

Tp

"#$!"%&' "#$!01":&$ <)#,"' "#$!"%&' <)#,"'


()* ()* ()*
mf mf mf pp mf mf

Vn
)#+!*)#,-.-/0 1&2'"!+#)++"-.-30 1&2'"!+#)++"-.-30 )#+!*)#,-.-40
1&2'"!+#)++"-.-/0
1&2'"!+#)++"-.-40
mf mf mf mf mf mf

Vn
1&2'"!+#)++"-.-30 1&2'"!+#)++"-.-30 '"'567-.-30 1&2'"!+#)++"-.-30 1&2'"!+#)++"-.-30 '"'567-.-/0
8"#$6')!%6",7" 8"#$6')
mf mf mf mf mf pp

Vn
1&2'"!+#)++"-.-30
mf

Va
)#+!*)#,-.-;0 1&2'"!+#)++"-.-30 )#+!*)#,-.-30 )#+!*)#,-.-/0
1&2'"!+#)++"-.-40 +):+"-.-;0
mf mf mf mf mf mf

Va

'"'567-.-30 1&2'"!+#)++"-.-30 '"'567-.-;0


'"'567-.-40 8"#$6') '"'567-.-/0 8"#$6')
8"#$6') 8"#$6')
mf mf ff mf ff

Vc
'"'567-.-40 '"'567-.-40 '"'567-.-40 )#+!*)#,-.-30 )#+!*)#,-.-30 +):+"-.-40
mf mf ff mf mf mf
Vc
'"'567-.-/0 '"'567-.-/0 '"'567-.-40 '"'567-.-/0 '"'567-.-/0 '"'567-.-40
8"#$6') 8"#$6')!%6",7" 8"#$6') 8"#$6') 8"#$6') 8"#$6')
mf mf ff ff ff ff
Cb
'"'567-.-/0 '"'567-.-;0
'"'567-.-40 '"'567-.-40 '"'567-.-40 '"'567-.-40
ff mf mf ff ff ff

Fig. 14.7 Mesures 11 et 12 dune orchestration de mantra (ostinato) pour la pice Speakings
de Jonathan Harvey. Partition en Ut.
14.4. SPEAKINGS (JONATHAN HARVEY) 209

Fig. 14.8 Mesures 11 14 de lostinato dans la partition de Speakings (Jonathan Harvey).


Les parties crites laide du systme dorchestration sont surlignes en rose.
210 CHAPITRE 14. EXEMPLES ET PRODUCTIONS

qui en rsulte est de trs faible intensit, avec une forte composante bruite. Si les tratto
sont frquents dans le jeu en solo ou en petit ensemble, ils sont plus difficiles utiliser dans
un contexte orchestral o ils risquent dtre masqus par dautres instruments.
En revanche, les changements de dynamique (qui surviennent presque chaque note)
ont t majoritairement conservs par le compositeur avec, en dbut de passage, une note
lattention du chef dorchestre : Great care to respect the dynamics. Loutil dorchestration
a donc ici t dun grand secours pour parvenir un ajustement prcis des intensits.

Cet exemple est pour nous le signe dune double russite. Tout dabord, il prouve que
loutil dorchestration, bien quayant dans un premier temps t conu pour produire des
timbres statiques, peut, laide dun systme de contraintes adquat, tre utilis pour contrler
lvolution temporelle du timbre. En second lieu, il a suscit lintrt et lenthousiasme dun
compositeur mrite, peu familier des outils technologiques, et dont les talents dorchestrateur
sont avrs et reconnus depuis longtemps. Cette collaboration aura permis de parcourir toutes
les tapes de la cration musicale, de lide du compositeur lexcution en concert : Speakings
a t cr le 19 aot 2008 au Royal Albert Hall de Londres, interprt par le BBC Scottish
Symphony Orchestra, dirig par Ilan Volkov.

14.5 Un exemple de production sonore (Grard Buquet)


Au cours dentretiens avec le compositeur Grard Buquet lors de sa dernire visite lIR-
CAM, a germ la possibilit inattendue dutiliser le systme dorchestration non pas comme
une aide lcriture, mais comme un environnement de production sonore. Lide de Grard
Buquet consiste rcuprer les flux audio sortant de notre systme et les utiliser comme
une matire concrte pour lcriture des parties lectroniques. Travaillant alors sur une
pice pour saxophone soprano et lectronique, le compositeur a expriment le systme avec
pour cible un son de multiphonique de saxophone baryton. Linterface ddition des solutions
en Max/MSP permet de facilement rajouter des chantillons et de les mixer (cest--dire
dajuster leurs niveaux sonores et leurs positions dans lespace strophonique) jusqu par-
venir au timbre souhait. En ce sens, loutil daide lorchestration permet donc de fournir
une matire sonore issue du monde instrumental. Mais ce nest pas tout. Si les chan-
tillons instrumentaux ont jusquici t conus comme les composantes dun timbre unifi, rien
nempche de les utiliser pour leurs caractristiques sonores propres. Considrs isolment, ils
peuvent se prter tous types de transformations et de mlanges, dont le timbre obtenu
laide de loutil nest quun exemple parmi dautres.
La figure 14.9 montre de quelle manire une proposition dorchestration imitative (ici le
multiphonique de saxophone baryton utilis par Grard Buquet) peut tre utilis pour gnrer
un matriau lectronique. Notre outil dorchestration dispose en effet dune interface ddition
manuelle des solutions, qui se prsente comme une table de mixage traditionnelle dont chaque
piste correspond un instrument. La fentre infrieure permet de rajouter facilement des sons
extrieurs lorchestre (y compris lectroniques). La modularit de Max/MSP intervient ici
de manire essentielle. Plutt que de diriger les flux audio sortant de chaque piste vers la
sortie son de lordinateur, on peut trs facilement les envoyer vers des modules de traitement
sonore. Le timbre initial devient alors le gnrateur dun matriau concret riche et vari,
travers un processus quon pourrait appler synthse par transformation de composantes .
Dans lexemple de la figure 14.9, les composantes de lorchestration sont invididuellement
14.5. UN EXEMPLE DE PRODUCTION SONORE (GRARD BUQUET) 211

Fig. 14.9 Utilisation de loutil comme environnement de production sonore

transposes au cours du temps, avec un rapport diffrent pour chaque son. On obtient ainsi
une texture qui s tire peu peu, la frontires des mondes acoustique et lectronique.
212 CHAPITRE 14. EXEMPLES ET PRODUCTIONS
Rsum de la troisime partie

Un prototype exprimental daide lorchestration permet aujourdhui aux compositeurs


de raliser des orchestrations imitatives, cest--dire danalyser un son pr-enregistr et de
le reproduire avec lorchestre de leur choix. Autour dun noyau central en Matlab c
, ce
prototype comprend un certain nombre de modules en Max/MSP pour la simulation des
propositions dorchestration. Lorsque le compositeur ne dispose pas du timbre reproduire,
une interface de synthse permet den construire un avatar de synthse dans OpenMusic
partir dun accord crit (orchestration gnrative).
Lexploration des solutions retournes par le systme est favorise par une interface multi-
points de vue dans laquelle diffrentes lectures du timbre sont mises en relation. Espace
symbolique de lcriture musicale, espace des descripteurs perceptifs et espace des critres
dopimisation communiquent en rpercutant les actions effectues dans un espace sur les deux
autres. Au sein de chaque reprsentation, un algorithme de clustering permet de considrer des
catgories de solutions plutt que des solutions individuelles. Dans lespace des dcisions,
cette opration est rendue possible grce un clustering hirarchique par schmas qui
construit une reprsentation arborescente des solutions selon un attribut symbolique de lcri-
ture. Chaque solution dorchestration peut tre dite manuellement par lutilisateur, ainsi
que servir de point de dpart pour une nouvelle recherche. Dans ce dernier cas, les prfrences
implicites du compositeur sont infres partir des valeurs de critres de la solution choisie,
puis injectes dans lalgorithme dorchestration. La recherche sintensifie alors autour de la
solution intermdiaire.
La connaissance instrumentale rduite dont dispose aujourdhui loutil dorchestration,
ainsi que sa vision essentiellement spectro-harmonique du timbre le destinent pour linstant
avant tout la cration de textures harmoniques complexes dans lesquelles la hauteur est un
lment essentiel de la structure. Une srie dexemples concrets tirs de collaborations avec
les compositeurs montrent toutefois que ce cadre restrictif peut souvent tre dpass grce au
savoir et lexprience de ces derniers. En outre, lheuristique CDCSolver offre la possibilit
dun contrle temporel du timbre laide de contraintes globales.

213
214
Conclusion

215
Synthse
En abordant le problme de laide lorchestration, nous nous sommes pos la question
de la complexit de cette pratique. Comment penser cette complexit ? Comment concevoir
des formalismes qui la traduisent et lexpriment au mieux, sans la rduire un modle sim-
plificateur ? En quoi un outil informatique peut-il aider les compositeurs faire face cette
complexit ? Telles sont les questions qui ont anim ce travail de thse.
Nous avons montr que la complexit de lorchestration tait multiple, quelle se situait la
rencontre de plusieurs axes, plusieurs faisceaux de complexit : complexit de la perception
du timbre, complexit combinatoire des mlanges instrumentaux, complexit de nos rapports
aux structures temporelles en musique. Pour chacun dentre eux, nous avons propos des
formalismes et des mthodes adapts.
Le caractre multidimensionnel du timbre a t trait travers une approche descriptive.
Lextraction automatique de descripteurs perceptifs dans de grandes banques dchantillons
sonores a permis daboutir un modle robuste du timbre instrumental, capable de prdire les
proprits acoustiques des mlanges. Nous avons ensuite propos un algorithme de recherche
dorchestrations fond sur des mtaheuristiques doptimisation multicritre. Une recherche
interactive et supervise permet la dcouverte simultane dorchestrations pertinentes et des
dimensions privilgies de lcoute pour un problme donn. Nous avons enfin montr que
la contextualisation des orchestrations dans un processus compositionnel plus gnral tait
possible laide de contraintes sur les variables symboliques de lcriture, et que cette approche
permettait en outre daborder le problme du temps.
Notre travail va donc bien au del des potentialits des quelques outils actuels daide
lorchestration. Il permet linformatique musicale daborder pleinement une discipline de
lcriture qui jusqualors stait toujours soustraite la formalisation, et laisse entrevoir la
possibilit dune comprhension plus fine des rapports entre deux mondes htrognes, celui
de la partition comme systme symbolique et celui du timbre comme ralit sonore.
Nous disposons donc aujourdhui dun prototype daide lorchestration capable de propo-
ser rapidement au compositeur un ensemble diversifi dorchestrations pour un timbre statique
donn en entre, et den contrler lvolution temporelle laide dun systme de contraintes.
Que cet outil fut plusieurs reprises utilis avec enthousiasme et succs par des composi-
teurs renomms dans leurs crations rcentes constitue, au del de notre apport scientifique,
la preuve tangible dune avance significative.

En rsum, la contribution de notre travail la littrature se rsume en sept points :


une formalisation gnrique et extensible du problme de laide lorchestration comme
une tche doptimisation multicritre sous contraintes ;
une validation exprimentale de la pertinence de descripteurs spectro-harmoniques pour
la caractrisation perceptive du timbre dans le cadre de sons complexes ;

217
un algorithme volutionnaire doptimisation combinatoire multicritre adapt au pro-
blme de lorchestration, respectant lquilibre entre intensification et diversification de
la recherche et pouvant tenir compte des prfrences de lutilisateur.
une gnralisation des notions dinstanciation partielle et de consistance locale dans les
problmes de satisfaction de contraintes, travers les concepts de contraintes de design
et contraintes de conflit ;
une mtaheuristique de recherche locale pour la satisfaction de contraintes globales,
sappuyant sur la distinction entre contraintes de design et contraintes de conflit.
une validation exprimentale, sur des instances de petite taille, de lefficacit des deux
mthodes prcdentes ;
un prototype exprimental daide lorchestration facilitant lexploration du timbre
orchestral via une reprsentation multi-points de vue des solutions et favorisant la d-
couverte des prfrences implicites du compositeur.

Extensibilit court terme de loutil dorchestration


Au terme de ce travail, nous devons distinguer deux horizons de recherches futures. Avant
dentamer de nouveaux chantiers, il est un certain nombre de points sur lesquels nous pouvons
avancer dans un relatif court terme, afin de proposer rapidement aux compositeurs un outil
plus complet.

Extension de linstrumentarium

Pour de multiples raisons que nous ne rappellerons pas ici, nous nous sommes restreints
dans notre travail une description spectro-harmonique du timbre, limitant ainsi la connais-
sance instrumentale aux sons harmoniques, entretenus et sans variations temporelles. Or cette
large classe de sons nest pas intgralement reprsente par linstrumentrium actuel au sein de
notre systme. Manquent en particulier les sons de tuba, accordon, saxophones, contrebas-
son, clarinette basse, trombone basse, flte picolo, flte basse. Ces instruments produisent des
timbres accessibles nos descripteurs et leur utilisation est frquente dans les grands orchestres
comme dans les ensembles. La gnralisation de notre outil dorchestration pourrait donc com-
mencer par lajout de ces instruments, ainsi qu la possibilit pour linstrumentarium complet
de jouer en quarts de tons.

Intgration des modles dinstruments

Notre vision exclusivement spectrale du timbre est aujourdhui sur le point dtre tendue
par les rsultats des travaux mens en parallle des ntres lIRCAM sur les modles dinstru-
ments. De nouvelles composantes du timbre, telles que le bruit ou la modulation damplitude,
pourront tre prises en compte. Il conviendra alors dvaluer lintrt de ces modles proba-
bilistes, en comparant leurs performances celles de notre approche descriptive actuelle. Si
les rsultats sont concluants, la connaissance instrumentale de notre outil pourra alors tre
tendue aux sons bruits et moduls.

218
Perspectives de recherche plus long terme
A plus long terme, la pluridisciplinarit de laide lorchestration laisse entrevoir de mul-
tiples directions de recherche. Nous bauchons ici quelques pistes de travail.

Modlisation des unissons


Dans notre systme, les chantillons de la connaissance instrumentale proviennent tous
dinstruments enregistrs en solo. Notre outil a donc tendance considrer lorchestre comme
un ensemble de solistes, et ne peut tenir compte des effets dorchestration que lon tire des
unissons, cest--dire plusieurs mmes instruments jouant exactement la mme partie (violons
par huit, violoncelles par six, clarinettes par trois, etc.). Si une modlisation des unissons est
donc ncessaire, elle ne se rduit pas pour autant lenregistrement et lanalyse de ces sons.
Se pose notamment un problme majeur dallocation des ressources instrumentales. Dans un
orchestre comprenant huit violons, ces derniers peuvent jouer tous lunisson, par groupe
de quatre, par groupe de six avec deux violons solo, etc. Notre reprsentation actuelle des
orchestrations, base sur le maintien implicite de la consistance de capacit, ne peut exprimer
ces multiples possibilits. Une procdure de rparation des solutions violant les contraintes de
capacit devra donc tre envisage.

Contraintes semi-globales explicites


Lles contraintes exprimables par le langage dfini au chapitre 10 ne peuvent pas concer-
ner plusieurs attributs simultanment. On peut dpasser cette limitation en remarquant que
ces contraintes sont de deux types. Les Contraintes globales concernent lensemble des va-
riables dune configuration. Typiquement, les contraintes all-diff, at-least-diff et at-most-diff
sur lattribut note sont des contraintes globales. A loppos Contraintes semi-globales im-
plicites concernent un sous-ensemble prcis de variables, implicitement dsign par la valeur
de lattribut intervenant dans la contrainte. Par exemple, la contrainte au moins trois instru-
ments doivent jouer sul ponticello ne sapplique videmment quaux instruments cordes.
Il est alors possible dimaginer, sans remettre en cause le formalisme de ce langage lmen-
taire, des contraintes semi-globales explicites, en rajoutant un cinquime champ valeur dans la
syntaxe. En prsisant dans ce cinquime champ les variables sur lesquelles la contrainte doit
tre calcule, on peut ainsi facilement exprimer des contraintes plus labores, o peuvent
intervenir plusieurs attributs, telles que : tous les trombones jouent la mme dynamique ,
le groupe de hauteurs (C3,G3,D4) est au moins prsent une fois aux cordes , le groupe
violon/flte/clarinette joue lunisson , etc.

Le problme des bicordes


Comme leur nom lindique, les bicordes dsignent une technique de jeu des instruments
cordes qui consiste jouer deux cordes simultanment. Ce procd est particulirement
intressant dans le cas dorchestrations pour petits ensembles, o il sagit souvent de produire
leffet maximal avec leffectif minimal. Au sein de notre reprsentation, les bicordes pouront
tre modliss par deux instruments identiques lies par une contrainte binaire. La difficult
sera alors de faire coexister contraintes binaires et contraintes globales au sein dune heuristique
de rparation. Si les contraintes binaires sont dfinies explicitement, un filtrage par rduction
de domaines avant lexploration du voisinage courant sera peut-tre envisageable.

219
Infrence automatique des critres pertinents
Si les progrs venir sur la caractrisation du timbre instrumental permettront den consi-
drer de nombreuses dimensions supplmentaires, ils augmenteront aussi considrablement le
nombre de critres dans le processus doptimisation. Or, plus le nombre de critres est en
effet lev, plus une configuration alatoire a une probabilit forte dtre non-domine. Luti-
lisateur risque alors dtre confront des ensembles de solutions gigantesques dans lesquels
lidentification dune configuration pertinente peut savrer longue et fastidieuse.
Dans un contexte daide la dcision mutli-critres comme lorchestration assiste par or-
dinateur, la singularit dune solution tient moins un jeu de valeurs prcises pour un grand
nombre de critres qu lidentification de descripteurs adquats pour le problme considr.
Il est inutile daccumuler les critres de dcision si ceux-ci ne permettent pas de distinguer
perceptivement les solutions. Une description approfondie et multidimensionnelle du timbre
instrumental est donc certes un pr-requis indispensable pour laide lorchestration, condi-
tion toutefois de pouvoir proposer lutilisateur un nombre rduit de critres pertinents pour
un problme particulier. A terme, il conviendrait donc dimaginer un moyen de dduire de
lanalyse de la cible les meilleurs critres pour une optimisation dans un espace de dimension
acceptable.

Infrence automatique de contraintes


Une autre piste de recherche est la dduction automatique de contraintes partir de
lanalyse de la cible sonore. Si le timbre reproduire comporte par exemple une modulation
damplitude, on peut alors imposer que lorchestration contienne au moins un son tremolo.
Dun point de vue thorique, il sagirait donc de dduire, partir des valeurs de descripteurs de
la cible, un certain nombre de caractristiques dun niveau dabstraction plus lev, sous formes
de prdicats. Dans un second temps, les valeurs de ces prdicats devraient tre interprtes,
laide dun systme de rgles prdfinies, en contraintes symboliques.

Fusion attaque/rsonnance
Du ct de la psychoacoustique et de la perception du timbre, les phnomnes de fusion
entre attaque et rsonnances sont galement investiguer. En orchestration, les sons non
entretenus sont frquemment employs pour leurs attaques rapides. Ds le dbut de XXe
sicle, les compositeurs ont cr des timbres nouveaux en les associant aux vents ou aux
cordes joues larchet. Le caractre inou de ces sonorits rsulte de leur aspect la fois
percussif et soutenu : ne sapparentant aucun instrument connu, elles sont trs droutantes
pour lcoute qui les peroit comme un timbre unifi . Lintgration des instruments sons
non entretenus au sein de notre systme passe donc par une comprhension des phnomnes de
couplage entre une attaque rapide produite par une catgorie dinstruments et une rsonnance
assure par une autre.

Ecriture de llectronique
Nous avons vu en dernire partie de cette thse que loutil dorchestration pouvait non
seulement aider lcriture instrumentale, mais galement servir denvironnement de cration
sonore pour des parties lectroniques dans le cadre de musiques mixtes. En admettant que du
point de vue de la modlisation du timbre les sons lectroniques peuvent tre reprsents par les

220
mmes descripteurs que les sons instrumentaux, lorchestration avec parties lectroniques ne se
rsume pas lajout dinstruments supplmentaires. Dans notre modle actuel dorchestration,
chaque son de la connaissance instrumentale est soumis des contraintes dintgrit (soit il
est utilis dans lorchestration, soit il ne lest pas) et de capacit (le nombre total de sons
provenant dun mme instrument est limit par leffectif orchestral). Ces contraintes nont
plus cours pour lcriture des parties lectroniques : les sons sont mlangeables volont, et
dans toutes les proportions de volume possibles. Autrement dit, la reprsentation mme des
orchestrations est dans ce cas repenser. Quant lalgorithme doptimisation, il devra pouvoir
traiter simultanment variables binaires et variables continues.

Le problme du temps
Au commencement de nos recherches sur laide lorchestration, nous avons fait le choix de
laisser de ct, dans un premier temps, les aspects temporels du timbre. Nous avons dfini une
cible orchestrer comme un ensemble de descripteurs spectro-harmoniques statiques, calculs
sur une partie suppose stable du son. En consquence, notre outil est capable dassister
les compositeurs dans la cration de textures complexes, dune grande richesse spectrale, mais
ne peut pas gnrer de mouvements .
Malgr cela, la question dun timbre voluant dans le temps, na jamais cess, au cours de
nos recherches, dtre pose. Peut-on considrer lorchestration dynamique comme une simple
extension du modle statique, o lvolution au cours du temps ne serait rien dautre quune
succession de segments ? Ou cela ncessite-t-il au contraire une modlisation temporelle
des possibilits instrumentales ? Il nest pas dit que nous disposions lheure actuelle des
outils et du recul ncessaire pour dcider de la pertinence et de la faisabilit de chacune des
approches, mais nous pouvons dj apporter un clairage sur cette question en distinguant
deux approches du temps.
Dun point de vue formel, si lvolution du timbre dans le temps est considre comme un
ensemble de relations dantriorit, de postrit ou de simultanit, on peut alors dcider que
tel timbre est suivi de tel autre, se superpose tel troisime, se fond dans tel quatrime,
etc. Il sagit videmment dune vision segmente de lorchestation, dans laquelle les couleurs
se succdent comme des panneaux dtachs les uns des autres. A priori, cette approche
du temps ne remet pas en cause notre modle combinatoire, car lhorizontalit de lcriture y
est pense comme une succession de segments verticaux, dont le contrle est possible laide
dun ensemble de contraintes sur les variables de lcriture musicale.
Nous devons toutefois reconnatre que cette approche ne permet de traiter que des va-
riations de timbre relativement lentes, et rien ne nous laisse aujourdhui prvoir la finesse
temporelle que nous pourrons atteindre par ce biais. Une autre vision du temps, horizontale et
continue, semble donc ncessaire, et implique llaboration dun modle temporel du timbre.
Vaste problme, qui reporte la complexit de lorchestration sur celle du jeu instrumental. Si
une recherche future sengage dans cette voie, il lui faudra sans doute abandonner, ne serait-ce
que temporairement, lapproche combinatoire, verticale, de lorchestration pour se concentrer
sur une modlisation des enchanements de timbres au cours du temps.

221
222
Quatrime partie

Annexes

223
Annexe A

Descripteurs : extraction, agrgation,


comparaison

Nous explicitons dans cette annexe les mthodes dextraction des descripteurs introduits
en 8.1.2. Nous dfinissons galement les fonctions dagrgation et fonctions de comparaison
pour chacun dentre eux.

Principaux partiels rsolus (MRP)

Extraction Lextraction des MRP se fait en plusieurs tapes rsumes par la figure A.1.
Dans un premier temps, les partiels du signal sont calculs fentre par fentre grce une FFT
et une extraction de pics spectraux. Ensuite, une procdure de suivi de partiels permet de ne
retenir que les partiels prsents sur lintgralit du son. Ces deux premires tapes sont ralises
par le programe pm2 [Rod97] qui sert en partie de noyau au logiciel AudioSculpt [BR05].
Dans un troisime temps, un modle perceptif est utilis pour slectionner les partiels rso-
lus par le systme auditif, ainsi quen estimer la correction damplitude et de frquence opre
par lensemble de la chane perceptive. Notre modle auditif utilise une mesure ERB (Equiva-
lent Rectangular Bandwidth [GM00]) pour simuler les bandes critiques de loreille interne et
identifier les partiels rsolus.
Le nombre de MRP varie selon le type de cible. Pour les cibles harmoniques, une quinzaine
de partiels suffisent en gnral. Les cibles plus complexes en ncessitent souvent davantage
(entre 20 et 30).

FFT +
Fentrage Suivi de Modle
Signal Extraction MRP
temporel partiels perceptif
des pics

Fig. A.1 Processus dextraction des principaux partiels rsolus (MRP)

225
226 ANNEXE A. DESCRIPTEURS : EXTRACTION, AGRGATION, COMPARAISON

Fig. A.2 Enveloppes spectrales moyennes des les sons entretenus de SOL

Agrgation Les MRP ne sont calculs que pour la cible. Les sons de la base dchantillons
instrumentaux tant harmoniques (voir section 8.1.1) et leur enveloppe spectrale lexcep-
tion du registre grave gnralement dcroissante (voir figure A.2), leurs MRP se rsument la
plupart du temps aux premiers partiels. Tirant parti de ce constat, nous introduisons une m-
thode dagrgation efficace en complexit, permettant de calculer la contribution des partiels
dun mlange instrumental aux MRP de la cible, mais ncessitant un prtraitement pralable
des sons de la base.
Pour chaque son nous identifions les partiels quil partage avec la cible. Le critre diden-
tification est un seuil de tolrance sur les frquences et correspond environ un huitime de
ton, soit un cart maximal de frquence infrieur 1.5%. Par exemple, si la cible possde son
3me MRP 500 Hz, tous les sons de la base ayant un partiel entre 493 Hz et 507 Hz verront
ce partiel identifi avec le 3me MRP de la cible. (On notera par la suite f1 f2 pour dsigner
deux frquences dans un rapport infrieur au seuil de tolrance.)
Soit T la cible orchestrer et {fkT } et {aTk } les vecteurs de frquences et amplitudes des
MRP de T . Soit S un son de la base de donnes dont les partiels ont respectivement pour
frquences et amplitudes {fkS } et {aSk }. La contributiton de S aux j me MRP de T sera alors :
 i
ak0 si k0 , fkS0 fjT
0 sinon

Plus simplement,
 on retiendra quon associe chaque son Si de la base de donnes un vecteur
damplitudes M RPST (j) de mme taille que {aTk } exprimant la contribution de S chaque

MRP de T , cette contribution dpendant de lidentification des frquences des partiels de S


et des MRP de T .
Lagragation des contributions aux MRP est alors une opration trs simple. Soit (Si )iI
un ensemble de sons de la base de donnes et K la mixture rsultant de leur mlange. On a
227

alors :  
T
max M RPSTi (1) , max M RPSTi (2) , . . .
 
M
\ RP K = (A.1)
iI iI

Une fonction de maximum est prfr une addition des amplitudes en raison des phnomnes
de phase voqus en 4.3 et responsables de la non-additivit des spectres.

La figure A.3 illustre les processus de calcul de contributions des MRP ainsi que de lagr-
gation des contributions. Sur le diagramme suprieur, on a report le spectre dun son cible
orchestrer (en pointills) ainsi que les principaux partiels rsolus (MRP, en trait plein). Le
diagramme mdian est un exemple de contribution aux MRP de deux sons de hauteurs res-
pectives C2 et D2. Il y apparat par exemple que le 4me partiel du C2 a t identifi au 3me
MRP, que les 9me partiel de C2 et 8me partiel de D2 ont t identifis au 13me MRP. Les
contributions de chaque son se ramnent par ce procd des vecteurs damplitude de mme
taille que les MRP et dont les valeurs ne dpendent ques des amplitudes des partiels de ces
sons. Enfin, le diagramme infrieur illustre lagrgation des contributions.

Comparaison Soit DTM RP la fonction de comparaison associe aux MRP pour la cible T ,
cest--dire une mesure de distance entre une mixture K de sons instrumentaux et T dans le
sous-espace associ aux MRP. Nous la dfinissons par :
 
M RP T T
DT (K) = 1 cos M RP K , M RPT
\ (A.2)

La distance sera donc nulle si les deux vecteurs damplitudes sont dans un rapport de proporti-
nalit. Ce degr de libert est ncessaire pour viter toute influence du niveau denregistrement
du son donn en entre du systme. Avec cette mthode, les sons sont donc compars sur la
forme de leurs enveloppes spectrales.

N.B. Si la contribution dun son aux MRP augmente avec le nombre de partiels identifis
ceux de la cible, en revanche aucune mesure ne pnalise les partiels non identifis. La raison
principale est quil ny a pas de conduite particulire tenir en pareil cas. Dans lexemple
de la figure A.3, les 5me et 8me partiels de C2 sont bien prsents dans la cible mais
damplitude trop faible pour tre rsolus. Il ny a donc aucune raison pnaliser leur prsence.
Dautres cas peuvent ce prsenter, pour lesquels lajout dun son dans une mixture introduit
des partiels absents dans la cible et que la fonction de comparaison A.2 ne peut pas voir .
Cest l une limite inhrente la modlisation en MRP de la partie basse frquence du spectre.
Mais ce que nous perdons en prcision destimation, nous le gagnons en rapidit de calcul :
Les contributions des sons de la base de donnes aux MRP sont calculs une seule fois pour
une cible donne, et lvaluation des mixtures selon ce critre nimplique que des oprations
lmentaires sur des vecteurs damplitudes. Une comparaison ayant recours aux informations
de damplitude et de frquence aurait t beaucoup plus coteuse en temps de calcul.

Intensit perceptive instantane (loudness)


Lintensit perceptive (ou sonie, ou loudness) nest pas un descripteur explicitement utilis
par notre systme dans ses jugements de similarit entre la cible et les propositions dorches-
tration. Nanmoins, il intervient dans les fonctions dagrgation des descripteurs spectraux
228 ANNEXE A. DESCRIPTEURS : EXTRACTION, AGRGATION, COMPARAISON

Fig. A.3 Exemple dextraction et dagrgation des MRP


229

Fentrage Modle Loudness


Signal FFT
temporel perceptif instantane

Fig. A.4 Processus dextraction de lintensit perceptive (loudness)

dcrits en infra. Nous ne dcrivons donc dans ce paragraphe que sa mthode dextraction. Il
est calcul pour tous les sons de la base de donnes mais nest pas extrait de la cible, puisque
nous considrons lintensit de cette dernire comme non significative.
Lextraction de lintensit perceptive est schmatise figure A.4. Pour chaque fentre tem-
porelle le spectre instantan du signal est extrait par FFT. Un modle perceptif calcule ensuite
lintensit perceptive instantane pour chaque fentre. Ce modle applique dabord un premier
filtre simulant la fonction de transfert de loreille moyenne [MGB97], puis utilise une mesure
ERB [GM00]) pour simuler les bandes critiques de loreille interne et calculer lintensit dans
chaque bande. Lintensit totale instantane est obtenue par sommation de linstensit dans
les bandes critiques. Cette extraction est ralise par le programme ircamdescriptor [Pee04].
Le lecteur trouvera davantage de prcision sur la dfinition et le calcul de lintensit perceptive
dans [MGB97].

Centrode spectral
Le centrode spectral est communment dfini comme le barycentre spectral du son. Dun
point de vue perceptif, il est corrl la brillance.

Extraction Le calcul du centrode (ou premier moment spectral) se fait un deux tapes.
Dans un premier temps, le centrode instantan du signal (dfini comme le barycentre du
spectre damplitude) est extrait pour chaque fentre temporelle. La moyenne des centrodes
instantans pondre par lintensit perceptive instantane dfinit alors le centrode global. La
figure A.5 rsume ce processus.

Agrgation Lestimation du centrode dun mlange ncessite la connaissance non seule-


ment des centrodes de chaque lment du mlange mais aussi de leur intensits. Soit (si )i les
sons de la base de donnes, dcrits par leurs centrodes (sci )i et leurs intensits perceptives
(Li )i . Soit K = (si1 , . . . , siK ) une configuration, on a alors :
PiK 1/0.6
i1 Li sci
sc
bK = P iK 1/0.6
(A.3)
i1 Li

Lexposant 1/0.6 rsulte dune approximation de la relation entre lintensit perceptive et le


spectre damplitude (fi , ai )i du signal, quon peut exprimer ainsi :
!0.6
X
L' ai
i
230 ANNEXE A. DESCRIPTEURS : EXTRACTION, AGRGATION, COMPARAISON

Intensit
instantane

Fentrage Moments Moments


Signal FFT
temporel instantans globaux

Fig. A.5 Processus dextraction des moments spectraux

O est un facteur de proportionalit dont la valeur nintervient pas dans lquation A.3.

Comparaison Soient T la cible orchestrer, scT son centrode et K une proposition dor-
chestration. Nous choisissons comme fonction de comparaison relative au centrode spectral
une simple distance relative :
|sc
b K scT |
DTsc (K) = (A.4)
scT

Etendue spectrale (spread )


Ltendue spectrale (ou second moment spectral) est lcart-type du spectre damplitude.
Dun point de vue perceptif, il traduit la largeur (ou lpaisseur ) spectrale du son.
Mme si on constate en pratique une corrlation significative entre le centrode et ltendue,
ces deux descripteurs conservent toutefois une certaine indpendance. Ainsi, une flte piccolo
dans le registre aigu peut avoir un son trs brillant et trs pinc, alors quun cor dans le grave
a un son sourd et large (par comparaison un orgue par exemple).

Extraction Le processus dextraction du spread est similaire celui du centrode (voir


section A et figure A.5).

Agrgation Soit K une proposition dorchestration de centrode sc


b K . on a alors :
v
u P 1/0.6
u L (sc2i + ss2i )
b K = t i iP 1/0.6
ss b 2K
sc (A.5)
L
i i

Comparaison Soit T la cible orchestrer dtendue spectrale ssT . Soit K une proposition
dorchestration dtendue ss
b K . La fonction de comparaison scrit :

|ss
b K ssT |
DTss (K) = (A.6)
ssT
Annexe B

Norme induite par une configuration

Etant donn un point x = (x1 , . . . , xN ) C de lespace des critres, nous avons dfini au
paragraphe 8.5.1 la norme induite par x (note kkx ) comme la norme pondre de Tchebycheff
vrifiant :
(i, j) {1; N }2 , i xi = j xj (B.1)

La proprit 8.2 garantit que la valeur de la norme induite par une configuration x est infrieure
toutes les autres normes pondres de Tchebycheff pour x. Cest la norme qui optimise le
classement x sur lespace de recherche. La figure illustre cette proprit. Lespace des critres
y est ordonn jusqu x (reprsente par un carr noir) selon trois normes pondres de
Tchebycheff. Les solutions en rouge ont un rang infrieur x, elles sont donc prfres x pour
la norme considre. De faon vidente, seule la norme plaant la solution x sur le sommet
dun hyper-rectangle correspondant une surface isomtrique permet de minimiser le nombre
de solutions de meilleur rang que x. Cette position correspond lquation B.1 de la norme
induite.
La proprit 8.2 assure en outre que si une solution x minimise k kx , alors x est non-
domine et vice-versa. La figure B.2 permet de sen convaincre aisment. Seule la norme
induite par une configuration efficiente permet de classer cette dernire en premier lorsque
lespace de recherche est ordonn selon cette norme. Cest cette proprit qui a permis Chen
& Liu [CL94] et Steuer [Ste86] dtablir lquivalence entre un problme multicritre et un
ensemble de problmes mono-critre scalariss (voir sections 5.7 et 8.5.1).

Fig. B.1 Classement dune configuration domine selon trois normes de Tchebycheff

231
232 ANNEXE B. NORME INDUITE PAR UNE CONFIGURATION

Fig. B.2 Classement dune configuration efficiente selon trois normes de Tchebycheff

Calcul des poids


Lorsque lalgorithme de recherche dorchestrations se termine, le choix par le compositeur
dune solution efficiente permet de deviner les prfrences implicites de ce dernier en termes
dcoute du timbre. Le calcul de la norme induite par la solution choisie rvle les poids associs
chaque critre, traduisant leur importance relative dans le jugement de similarit entre la
cible et la solution.
Soit un point x situ sur un sommet de la boule de rayon dx (au sens dune norme de
Tchebycheff pondre). La somme des poids devant tre gale 1, on a en deux dimensions :

1 x1 = dx
2 x2 = dx (B.2)
1 + 2 = 1

Trivialement, les solutions scrivent :



1 = x2 /S
avec S = x1 + x2 (B.3)
2 = x1 /S
De mme, en trois dimensions, le problme scrit :


1 x1 = dx
2 x2 = dx

(B.4)
3 x3 = dx

1 + 2 + 3 = 1

Et les solutions sont :



1 = x2 x3 /S
2 = x1 x3 /S avec S = x1 x2 + x1 x3 + x2 x3 (B.5)
3 = x1 x2 /S

Le calcul se gnralise aisment aux dimensions suprieures :


Y
xj
j6=k
k = K Y
, k = 1, ..., K (B.6)
X
xj
i=1 j6=i
Table des figures

5.1 Solutions efficientes et solutions domines dun problme de minimisation


deux critres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.2 Relations de dominance dans un espace deux critres pour un problme de
minimisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.3 Classification des mthodes doptimisation combinatoire multicritre . . . . . . 54
5.4 Solutions supportes et non-supportes dans un problme de minimisation . . . 55
5.5 Oprateurs gntiques usuels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.6 Schma gnrique dun algorithme gntique . . . . . . . . . . . . . . . . . . . . 58
5.7 Trois solutions efficientes obtenues par optimisation unicritre dans un problme
de minimisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.8 Estimation de la densit locale par la mthode PADE . . . . . . . . . . . . . . 66

7.1 Donnes dentre en fonction du type dorchestration (imitative ou gnrative) . 87


7.2 Zones de prdominance dans un espace deux critres . . . . . . . . . . . . . . 93
7.3 Les trois mondes de lorchestration assiste par ordinateur . . . . . . . . . . 97

8.1 Processus de cration dune instance de test . . . . . . . . . . . . . . . . . . . . 110


8.2 Estimation des moments spectraux des cibles polyphoniques 4 sons . . . . . . 111
8.3 Distribution des fonctions de comparaison pour les cibles polyphoniques 4 sons112
8.4 Trois heuristiques pour trouver des solutions efficientes pertinentes . . . . . . . 120

9.1 Oprateurs gntiques pour lorchestration . . . . . . . . . . . . . . . . . . . . . 133

10.1 Passage continu dun accord de cordes vers un accord de vents . . . . . . . . . . 157

11.1 Deux approximations incomparables du point de vue de la dominance de Pareto 160


11.2 Ambiguit de la mtrique T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
11.3 Hypervolume : portion de lespace domine par lapproximation . . . . . . . . . 162
11.4 Deux approximations obtenant les mmes valeurs de diversit pour la mesure
de Grosan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
11.5 Diversit contre dominance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

12.1 Schma gnral de loutil dorchestration . . . . . . . . . . . . . . . . . . . . . . 178


12.2 Espace disque et outils existants ncessaires . . . . . . . . . . . . . . . . . . . . 180
12.3 Construction dune cible dans OpenMusic . . . . . . . . . . . . . . . . . . . . 182

13.1 Choix dun orchestre et interface danalyse de la cible . . . . . . . . . . . . . . . 190


13.2 Navigation dans lensemble des solutions . . . . . . . . . . . . . . . . . . . . . . 192

233
234 TABLE DES FIGURES

13.3 Edition manuelle dune solution . . . . . . . . . . . . . . . . . . . . . . . . . . . 195


13.4 Intensification de la recherche partir dune solution intermdiaire . . . . . . . 197
13.5 Transformation progressive du timbre laide de contraintes . . . . . . . . . . . 198
13.6 Partition finale dune lorchestration imitative et volutive . . . . . . . . . . . . 199

14.1 Deux orchestrations dun mme son de klaxon . . . . . . . . . . . . . . . . . . . 202


14.2 Un patch dans OpenMusic gnrant une cible partir dun accord . . . . . . . 203
14.3 Orchestration dun son de synthse . . . . . . . . . . . . . . . . . . . . . . . . . 204
14.4 Une cible constitue de deux phonmes chants. . . . . . . . . . . . . . . . . . . 205
14.5 Exemple dorchestration dun timbre dynamique . . . . . . . . . . . . . . . . . 206
14.6 Mantra chant par le compositeur Jonathan Harvey . . . . . . . . . . . . . . . . 207
14.7 Mesures 13 et 14 dune orchestration de mantra . . . . . . . . . . . . . . . . . . 208
14.8 Mesures 11 14 de lostinato dans la partition de Speakings . . . . . . . . . . . 209
14.9 Utilisation de loutil comme environnement de production sonore . . . . . . . . 211

A.1 Processus dextraction des principaux partiels rsolus (MRP) . . . . . . . . . . 225


A.2 Enveloppes spectrales moyennes des les sons entretenus de SOL . . . . . . . . . 226
A.3 Exemple dextraction et dagrgation des MRP . . . . . . . . . . . . . . . . . . 228
A.4 Processus dextraction de lintensit perceptive (loudness) . . . . . . . . . . . . 229
A.5 Processus dextraction des moments spectraux . . . . . . . . . . . . . . . . . . . 229

B.1 Classement dune configuration domine selon trois normes de Tchebycheff . . . 231
B.2 Classement dune configuration efficiente selon trois normes de Tchebycheff . . . 232
Liste des tableaux

8.1 Tailles moyennes des espaces de recherche pour des problmes de petite taille . 107
8.2 Diffrentes combinaisons de critres testes . . . . . . . . . . . . . . . . . . . . . 107
8.3 Tailles moyennes des fronts de Pareto . . . . . . . . . . . . . . . . . . . . . . . . 109
8.4 Erreurs moyennes destimation des descripteurs . . . . . . . . . . . . . . . . . . 112
8.5 Frquence laquelle la solution thorique appartient au front de Pareto . . . . 114
8.6 Rangs mdians de la solution thorique dans lespace des critres . . . . . . . . 116
8.7 Statistiques M AD, P F M , M F M , P IM , M IM pour les mixtures monopho-
niques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
8.8 Statistiques M AD, P F M , M F M , P IM , M IM pour les mixtures polyphoniques123
8.9 Test dcoute 1 : validation de lapproche multicritre . . . . . . . . . . . . . . . 124
8.10 Test dcoute 2 : valuation des heuristiques H , He et Hs . . . . . . . . . . . . 125
8.11 Information approte par les critres . . . . . . . . . . . . . . . . . . . . . . . . 127

10.1 Oprateurs de contrainte darit variable . . . . . . . . . . . . . . . . . . . . . . 141


10.2 Contraintes de cardinalit globale . . . . . . . . . . . . . . . . . . . . . . . . . . 142
10.3 Classification des oprateurs par type de contrainte . . . . . . . . . . . . . . . . 146
10.4 Contraintes utilises pour lvaluation de CDCSolver . . . . . . . . . . . . . . . 151
10.5 Evaluation de CDCSolver : taille des ensembles de solutions . . . . . . . . . . . 151
10.6 Performances de CDCSolver (contraintes seules) . . . . . . . . . . . . . . . . . 152
10.7 Performances de CDCSolver (contraintes et optimisation) . . . . . . . . . . . . 153
10.8 Amlioration de fitness avec CDCSolver . . . . . . . . . . . . . . . . . . . . . . 153

11.1 Grille de lecture pour la comparaison multi-expert de deux approximations . . . 165


11.2 Performances dun algorithme gntique lmentaire par rapport une re-
cherche alatoire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
11.3 Pertinence de la mutation gntique . . . . . . . . . . . . . . . . . . . . . . . . 169
11.4 Pertinence de la mutation alatoire pour les problmes contraints . . . . . . . . 169
11.5 Effets de lintroduction priodique de solutions alatoires . . . . . . . . . . . . . 170
11.6 Pertinence de la rparation des solutions initiales pour les problmes contraints 170
11.7 Intrt de la prservation de la densit selon la mthode PADE . . . . . . . . . 171

235
236 LISTE DES TABLEAUX
Liste des algorithmes

1 Extraction du front de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107


2 Mise jour du front de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3 Rduction de population par prservation de la diversit . . . . . . . . . . . . . 135
4 Algorithme dorchestration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
5 Modification de la pire variable conflictuelle . . . . . . . . . . . . . . . . . . . . 147
6 Instanciation de la meilleure variable libre . . . . . . . . . . . . . . . . . . . . . 148
7 Rparation des configurations inconsistantes . . . . . . . . . . . . . . . . . . . . 149
8 Algorithme dorchestration sous contraintes . . . . . . . . . . . . . . . . . . . . 156
9 Algorithme naf dorchestration (recherche alatoire) . . . . . . . . . . . . . . . 166

237
238 LISTE DES ALGORITHMES
Glossaire

approximation Ensemble des configurations efficientes au sein dune population donne.


attribut Donne symbolique dcrivant un paramtre musical dmission du son (hauteur,
dynamique, sourdine. . .). Par opposition aux descripteurs, les attributs sont obtenus par
indexation pour les chantillons sonores constituant la connaissance instrumentale de
loutil dorchestration.

cible Ensemble des descripteurs audio caractrisant le timbre recherch.


configuration Sous-ensemble de la base dchantillons sonores, constituant une proposition
dorchestration. Ensemble dchantillons jous simultanment pour produire un timbre.
Ensemble de couples variable/valeur dont chaque variable reprsente un instrument de
lorchestre, valeurs prises dans un sous-ensemble de la base dchantillons sonores
propre linstrument considr et au problme dorchestration courant.
configuration efficiente Configuration telle quil nexiste, au sein dune population donne,
aucune configuration la surpassant sur lensemble des criteres.
contrainte Condition devant tre vrifie par les attributs dune configuration.
critre Distance la cible selon un descripteur audio unique.

descripteur Donne numrique (scalaire, vectorielle ou matricielle) dcrivant une caractris-


tique prcise du timbre. Elle est calcule directement sur le signal.

fonction dagrgation Estimateur dune valeur de descripteur dune configuration, partir


des valeurs de descripteur de ces composantes.
fonction de comparaison Pour une cible donne, fonction transformant une valeur de des-
cripteur dune configuration en une valeur de critre.
fonction de cot Fonction valeurs relles mesurant le niveau de violation de contrainte
dune configuration donne.
front de Pareto Ensemble des configurations efficientes parmi toutes les configurations
consistantes de lespace de recherche.

mode de jeu Technique de jeu enrichissant le vocabulaire sonore des instruments de musique.
modle dinstrument Modle probabiliste caractrisant les possibilits sonores dun instru-
ment, dont les paramtres sont estims partir de bases de donnes dchantillons.
mthode dextraction Fonction associe un descripteur permettant den calcuer la valeur
partir du signal audio.

239
240 Glossaire

orchestration gnrative Mixture instrumentale dont les paramtres de timbre ont t d-


finis partir de donnes symboliques (par oppostion une orchestration imitative).
orchestration imitative Mixture instrumentale dont le timbre sapparente celui dun son
donn par le compositeur et quil cherche reproduire avec lorchestre.
Bibliographie

[AADC08] G. Assayag A. Allombert and M. Desainte-Catherine, De Boxes Iscore : vers


une criture de linteraction, Proceedings of the 13th Journes dInformatique
Musicale (JIM2008), Albi, France, Mars 2008.
[AD05] Jean-Marc Amiot and Nicolas Durand, Algorithmes Gntiques, mars 2005.
[Adl89] Samul Adler (ed.), The Study of Orchestration, Norton Company, New York, 1989.
[Ago98] Carlos Agon, OpenMusic : Un langage visuel pour la composition musicale as-
siste par ordinateur, Ph.D. thesis, Universit Pierre et Marie Curie (Paris 6),
Paris, France, 1998.
[AHA02] Carlos Agon, Karim Haddad, and Grard Assayag, Representation and Rende-
ring of Rythmic Structures, International Conference of Web Delivering of Music
(Darmstadt, Allemagne), IEEE Computer Press, 2002.
[BAKC99] F. Ben Abdelaziz, S. Krichen, and J. Chaouachi, Metaheuristics : Advances and
Trends in Local Search Paradigms for Optimization, ch. A Hybrid Heuristic for
Multiobjective Knapsack Problems, pp. 205212, Kluwer Academic Publishers,
1999.
[Bar85] Jean-Baptiste Barrire (ed.), Le timbre, mtaphore pour la composition, Christian
Bourgois, Paris, 1985.
[BBBK07] Alexander M. Bronstein, Michael M. Bronstein, Alfred M. Bruckstein, and Ron
Kimmel, Paretian Similarity for Partial Comparison of Non-rigid Objects, SSVM,
2007, pp. 264275.
[BBHL99] Guillaume Ballet, Riccardo Borghesi, Peter Hoffmann, and Fabien Lvy, Stu-
dio Online 3.0 : An Internet "Killer Application" for Remote Access to IRCAM
Sounds and Processing tools, Actes des Journes dinformatique musicale (Paris),
1999.
[Bel01] Alan Belkin, Lart orchestral, 2001, http://www.musique.umontreal.ca/personnel/
belkin/bk.o.fr/of3.html.
[Ber55] Hector Berlioz, Trait dinstrumentation et dorchestration, Henri Lemoine (2e
ed., Paris, 1855.
[Beu00] Anthony Beuriv, Un logiciel de composition musicale combinant un modle spec-
tral, des structures hirarchiques et des containtes, Actes des Journes dinforma-
tique musicale (JIM2000) (Bordeaux), 2000, pp. 2130.
[Bou00] Richard Boulanger, The CSound Book, MIT Press, 2000.
[BR05] Niels Bogaards and Axel Roebel, An Interface for Analysis-Driven Sound Proces-
sing, AES 119th Convention (New York, Etats-Unis), Octobre 2005.

241
242 BIBLIOGRAPHIE

[Cas58] Alfredo Casella, Technique de lorchestre contemporain, Ricordi, Paris, 1958.


[CD01] Philippe Codognet and Daniel Diaz, Yet Another Local Search Method for
Constraint Solving, AAAI Fall Symposium on Using Uncertainty within Com-
putation, Cape Cod, 2001.
[CDT02] Philippe Codognet, Daniel Diaz, and Charlotte Truchet, The Adaptive Search
Method for Constraint Solving and its Application to musical CSPs, Proceedings
of the 1st International Workshop on Heuristics, 2002.
[Cer94] R. Cerf, Une thorie asymptotique des algorithmes gntiques, Ph.D. thesis, Uni-
versit Montpellier II, France, 1994.
[CL94] Y.L Che and C.C. Liu, Multiobjective VAR planning Using the Goal Attainment
Method, IEEE Proc. on Generation, Transmission and Distribution, mai 1994,
pp. 227232.
[CTA+ 06] Grgoire Carpentier, Damien Tardieu, Grard Assayag, Xavier Rodet, and Em-
manuel Saint-James, Imitative and Generative Orchestrations Using Pre-Analyzed
Sound Databases, Proceedings of Sound and Music Computing Conference (SMC)
(Marseille, France), mai 2006, pp. 115122.
[CTA+ 07] , An Evolutionary Approach to Computer-Aided Orchestration, EvoMU-
SART (Valence, Espagne), vol. LNCS4448, Avril 2007, pp. 488497.
[Deb00] Kalyanmoy Deb, An Efficient Constraint Handling Method for Genetic Algo-
rithms, Computer Methods in Applied Mechanics and Engineering (2000), no. 186,
311338.
[Del04] Olivier Delerue, Spatialisation du son et programmation par contraintes : le sys-
tme MusicSpace, Ph.D. thesis, Universit Pierre et Marie Curie (UPMC)
Paris 6, 2004.
[DJ98] R. Dorne and J.K.Hao, A New Genetic Local-Search Algorithm for Graph Colo-
ring, Lecture Notes in Computer Science LNCS 1498 (1998), 745754.
[DJ02] Kalyanmoy Deb and Sachin Jain, Running Performance Metrics for Evolutionary
Multi-Objective Optimization, Tech. Report 2002004, Kanpur Genetic Algorithm
Laboratory (KanGAL), Indian Institue of Technology, Kanpur, PIN 208 016,
Inde, 2002.
[DP91] P. Depalle and G. Poirrot, SVP : A Modualr System for Analysis, Processing and
Synthesis of Sound Signals, Proceedings of the International Computer Music
Conference (ICMC), 1991.
[DPAM00] K. Deb, A. Pratap, S. Agarwal, and T Meyarivan, A Fast and Elistist Multi-
Objective Genetic Algorihm : NSGA-II, Tech. Report 200001, Kanpur Genetic
Algorithm Laboratory (KanGAL), Indian Institue of Technology, Kanpur, PIN
208 016, Inde, 2000.
[Ebc88] Kemal Ebcioglu, An Expert System for harmonizong Four-part Chorals, Computer
Music Journal 12 (1988), no. 3, 4351.
[EG00] Matthias Ehrgott and Xavier Gandibleux, A Survey and Annotated Bibliography
of Multioblective Combinatorial Optimization, OR Spektrum 22 (2000), 425460.
[Ehr05] Matthias Ehrgott, Multicriteria Optimization (2nd ed.), Springer, 2005.
BIBLIOGRAPHIE 243

[Eib01] A.E. Eiben, Evolutionary Algorithms and Constraint Satisfaction : Definitions,


Survey, Methodology, and Research Directions, Theoretical Aspects of Evolutio-
nary Computing, Springer-Verlag, 2001, pp. 1358.
[ELT07] Semya Elaoud, Taicir Loukil, and Jacques Teghem, The Pareto Fitness Gene-
tic Algorithm : Test Function Study, European Journal of Operational Research
(2007), no. 177, 17031719.
[Eri75] Robert Erickson, Sound structure in music, University of California Press, 1975.
[EvdH96] A.E. Eiben and J.K. van der Hauw, Graph Coloring with Adaptive Evolutionnary
Algorithms, Tech. Report TR-96-11, Leiden University, 1996.
[FF93] C.M. Fonseca and P.J. Flemming, Genetic Algorithm for Multiobjective Otimiza-
tion : Formulation, Discussion and Generalization, Proceedings of the 5th Inter-
national Conference on Genetic Algorithms (San Mateo, CA, USA) (Stephanie
Forest, ed.), Morgan Kaufman, 1993, pp. 416423.
[FF95] , An Overview of Evolutionnary Algorithms in Multiobjective Optimization,
Journal of Evolutionary Computation 3 (1995), no. 1, 116.
[GHNO03] Masataka Goto, Hiroki Hashiguchi, Takuichi Nishimur, and Ryuichi Oka, RWC
Music Database : Music Genre Database and Musical Instrument Sound Database,
Proceedings of the 4th International Conference on Music Information Retrieval
(ISMIR 2003), 2003, pp. 229230.
[GL97] F. Glover and H. Laguna, Tabu Search, Kluwer Academic Publishers, 1997.
[GM00] Brian R. Glasberg and Brian C.J. Moore, A Model for Prediction of Thresholds
Loudness and Partial Loudness, Hearing Research 47 (2000), 103138.
[Gol89] D.E. Goldberg, Genetic Algorithms in Search, optimization and Machine Lear-
ning, Addison-Wesley, 1989.
[Got04] Masataka Goto, Development of the RWC Music Database, Proceedings of the
18th International Congress on Acoustics (ICA 2004), vol. 1, avril 2004, pp. 553
556.
[Gro05] C. Grosan, Evolutionary optimization : Algorithms and applications, Tech. report,
Dept. Of Computer Science, Babes-Bolyai University of Cluj-Napoca, Roumanie,
2005.
[Gro06] C. Grosan, Multiobjective Adaptive Representation Evolutionary Algorithm (MA-
REA) A New Evolutionary Algorithm for Multiobjective Optimization, Pro-
ceedings of 9th World on-line Conference on Soft Computing in Industrial Ap-
plication, Applied Soft Computing Technologies : The Challenge of Complexity,
Advances in Soft Computing (Allemagne), Springer-Verlag, 2006, pp. 113121.
[HGH98] Jin-Kao Hao, Philippe Galinier, and Michel Habib, Mtaheuristiques pour lop-
timisation combinatoire et laffectation sous contraintes, Journal of Heuristics
(1998).
[HJ97] P.H. Hansen and A. Jaszkiewicz, Evaluating Quality of Approximations to the
Non-dominated Set, Tech. Report IMM-REP-1998-7, Dept. Of Mathematical Mo-
delling, Technical University of Denmark, 1997.
[HNG94] J. Horn, N. Nafpliotis, and D.E. Goldberg, A Niched Pareto Genetic Algorithm
for Multiobjective Optimization, Proceedings of the First IEEE Conference on
244 BIBLIOGRAPHIE

Evolutionary Computation, IEEE World Congress on Computational Intelligence


(Piscataway, New Jersey), IEEE Service Center, 1994, pp. 8287.
[Hol75] J.H. Holland, Adaptation in natural and Artificial Systems, Ph.D. thesis, 1975.
[Hum05] Thomas A. Hummel, Simulation of Human Voice Timbre by Orchestration of
Acoustic Music Instruments, Proceedings of International Computer Music Confe-
rence (ICMC), 2005.
[IK03] H. Ishibuchi and S. Kaige, Effects of Repair Procedures on the Performance of
EMO Algorithms for Multiobjective 0/1 Knapsack Problems, Evolutionary Com-
putation 4 (2003), 22542261.
[IM96] H. Ishibuchi and T. Murata, Multi-Objective Genetic local Search Algorithm,
Proc. of 3rd IEEE International Conference on Evolutionary Computation, 1996,
pp. 119124.
[IY02] H. Ishibuchi and T. Yoshida, T. Murata, Balance between Genetic Search and
Local Search in Hybrid Evolutionary Multi-Criterion Optimization Algorithms
(2002).
[Jas01] Andrzej Jaszkiewicz, Comparison of Local Search-Based Metaheuristics on the
Multiple Objective Knapsack Problem, Foundations of Computing and Design
Sciences 26 (2001), no. 1, 99120.
[Jas02] , Genetic Local Search for Multiple Objective Combinatorial Optimization,
European Journal of Operational Research 137 (2002), no. 1, 5071.
[Jot97] Jean-Marc Jot, Efficient Models for Reverberation and Distance Rendering in
Computer Music and Virtual Audio Reality, International Computer Music Confe-
rence (ICMC) (Thessaloniki, Greece), Septembre 1997, pp. 236243.
[KC99] J.D. Knowles and D.W. Corne, The Pareto Archived Evolution Strategy : A
New Baseline Algorithm for Multiobjective Optimization, Proceedings of the 1999
Congree on Evolutionary Computation (Piscataway, New Jersey), IEEE Service
Center, 1999, pp. 98105.
[KC00] , A Comparison of Diverse Approaches to Memetic Multiobjective Combi-
natorial Optimisation, Proceedings of the 2000 Genetic and Evolutionary Compu-
tation Conference Workshop Program (Las Vegas, Nevada, USA), 2000, pp. 103
108.
[KFTZ05] Jochua D. Knowles, Carlos M. Fonseca, Lothar Thiele, and Eckart Zitzler, A
Tutorial on the Performance Assessment of Stochastic Multiobjective Optimizers,
Evolutionary Multi-Criterion Optimization Conference (EMO), 2005.
[Koe43] Charles Koechlin, Trait de lOrchestration, Max Eschig, Paris, 1943, 4 volumes.
[Lau93] M. Laurson, PWConstraints, 10imo Colloquio di Informatica Musicale (Associa-
zione di Informatica Musicale, Milano, Italie) (G. Haus and I. Pighi, eds.), 1993,
pp. 332335.
[LD89] M. Laurson and J. Duthen, PatchWork, a Graphic Language in PreForm, Pro-
ceedings of the International Computer Music Conference (ICMC) (Ohio State
University, Etats-Unis), 1989, pp. 172175.
[LT06] Thibaut Lust and Jacques Teghem, MEMOX : a Memetic Algorithm Scheme for
Multiobjective Optimization, Proceedings of the 7th International Conference on
Multi-Objective Programming and Goal Programming, 2006.
BIBLIOGRAPHIE 245

[MGB97] Brian C.J. Moore, Brian R. Glasberg, and Thomas Baer, A Model for Prediction
of Thresholds, Loudness, and Partial Loudness, Journal of Audio Engeneering
Society (1997), 224240.
[Mic96] Z. Michalewicz, Denetic Algorithms + Data Structures + Evolution Programs (3rd
Ed.), Springer, berlin, 1996.
[Mie99] Kaisa Miettinen, Nonlinear Multiobjective Optimization, International Series in
Operations Research and Management Science, vol. 12, Kluwer Academic Publi-
shers, Dordrecht, 1999.
[MS98] Kim Mariott and Peter Stuckey, Programming with Constraints : An Introducion,
MIT Press, 1998.
[MT90] S. Martello and P. Toth, Knapsack Problems : Algorithms and Computer Imple-
mentations, John Wiley & Sons, Chichester, 1990.
[MWD+ 95] S. McAdamcs, S. Winnsberg, S. Donnadieu, G. De Soete, and J. Krimphoff, Per-
ceptual Scaling of Synthesized Musical Timbres : Common Dimensions, Specifici-
ties, and Latent Subject Classes, Psychological Research (1995), no. 58, 177192.
[OFL97] Y. Orlarey, D. Fober, and S. Letz, Lenvironnement de composition musicale
Elody, Actes des Journes dinformatique musicale (JIM97) (Lyon, France),
1997.
[OGAK05] M. Oltean, C. Grosan, A. Abraham, and M. Koppen, Multiobjective Optimiza-
tion Using Adaptive Pareto Archived Evolution Strategy, Proceedings of the 5th
International Conference on Intelligent Systems Design and Applications (ISDA),
2005, pp. 558563.
[Pee04] Geoffroy Peeters, A Large Set of Audio Features for Sound Description (Similarity
and Classification) in the CUIDADO Project, Tech. report, IRCAM, 2004.
[Pis55] Walter Piston, Orchestration, Norton Company, New York, 1955.
[PMH00] Geoffroy Peeters, Stephen McAdams, and Perfecto Herrera, Instrument Sound
Description in the Context of MPEG-7, International Computer Music Conference
(ICMC) (Berlin, Allemagne), Septembre 2000, pp. 166169.
[Pop91] S.T. Pope (ed.), The Well-Tempered Object (Musical Application of Object-
Oriented Technology), MIT Press, 1991.
[PR01] Franois Pachet and Pierre Roy, Musical Harmonization with Constraints : A
Survey, Constraints Journal 6 (2001), no. 1, 719.
[Pse03] David Psenicka, Sporch : An Algorithm for Orchestration Based on Spectral Ana-
lyses of Recorded Sounds, Proceedings of International Computer Music Confe-
rence (ICMC), 2003.
[Puc91] Miller Puckette, Combining Event and Signal Processing in the Max Graphical
Programming Environment, Computer Music Journal 15 (1991), no. 3.
[RAQ+ 01] C. Rueda, G. Alvarez, L.O. Quesada, G. Tamura, Valencia F.D, J.F. Diaz, and
G. Assayag, Integrating Constraints and Concurrent Objects in Musical Applica-
tions : A Calculus ans its Visual Language, Constraints 6 (2001), no. 1.
[RH05] Franois Rose and James Hetrick, Spectral Analysis as a Ressource for Contem-
porary Orchestration Technique, Proceedings of Conference on Interdisciplinary
Musicology, 2005.
246 BIBLIOGRAPHIE

[Ris86] Jean-Clause Risset, Son musical et perception auditive, Pour la Science (1986),
no. 109.
[RK64] Nicola Andre Rimski-Korsakov, Principles of Orchestration, with Musical
Examples Drawn from his own Works, Maximilian Steinberg, New York, 1964.
[RLBA98] Camilo Rueda, Mikael Laurson, Georges Bloch, and Grard Assayag, Integrating
Constraints Programming in Visual Musical Composition Languages, Proceedings
of the European Conference on Artificial Intelligence, 1998.
[Rod97] Xavier Rodet, Musical Sound Signal Analyis/Synthesis : Sinusoidal+Residual and
Elementary Waveform Models, Proceedings of the IEEE Time-Frequency and
Time-Scale Workshop (Coventry, Grande Bretagne), 1997.
[Sal79] M.E. Salukwadze, Vector-Valued Optimization Problems in Control Theory, Aca-
demic Press, 1979.
[Sch11] Arnold Schoenberg, Harmonielehre, Universal Edition, Vienne, 1911.
[Sch66] Pierre Schaeffer, Trait des objets musicaux, Seuil, Paris, 1966.
[Sch68] J.F. Schouten, The Perception of Timbre, Reports of the 6th Internation Cangress
on Acoustics (Tokyo, Japon), no. GP-6-2, 1968, pp. 3544, 90.
[SD94] N. Srinivas and K. Deb, Multiobjective Optimization Using Nondominated Sorting
in Genetic Algorithms, Evolutionary Computation 2 (1994), no. 3, 221248.
[SF97] Eleanor Selfridge-Field (ed.), Beyond MIDI : The Handbook of Musical Codes,
MIT Press, Cambridge, 1997.
[Sol02] Christine Solnon, Ants Can Solve Constraint Satisfaction Problems, IEEE Tran-
sactions on Evolutionary Computation 6 (2002), 347357.
[Ste86] R.E. Steuer, Multiple Critera Optimization - Theory, Computation and Applica-
tion, Wiley, New York, 1986.
[Ste90] G.L. Steele (ed.), Common Lisp, the Language (2nd Ed.), Digital Press, 1990.
[SW00] D. Schwartz and M. Wright, Extensions and Applications of the SDIF Sound Des-
cription Interchange Format, Proceedings of the International Computer Music
Conference (Berlin, Allemagne), 2000.
[Tal99] E.G. Talbi, Mtaheuristiques pour loptimisation combinatoire multi-objectif : Etat
de lart, Tech. report, C.N.E.T. (France Telecom), octobre 1999.
[TR07] Damien Tardieu and Xavier Rodet, An Instrument Timbre Model For Computer
Aided Orchestration, WASPAA (New Paltz, NY, USA), Octobre 2007.
[Tru04] Charlotte Truchet, Contraintes, recherche locale et composition assiste par ordi-
nateur, Ph.D. thesis, Univerit Paris 7 Denis Diderot, Paris, 2004.
[Tsa93] E.P. Tsang, Fondations of Constraint Satisfaction, Academic Press, 1993.
[UT94] E.L. Ulungu and J. Teghem, Multi-Objective Combinatorial Optimization : A
Survey, Foundations of Computing and Decision Sciences 20 (1994), no. 2, 149
165.
[VHD03] Michel Vasquez, Djamal Habet, and Audrey Dupont, Neighborhood Design by
Consistency Checking, Actes du 5e congrs de la socit franaise de recherche
oprationnelle et daide la dcision (ROADEF2003) (Avignon, France), 2003.
[VSL] Vienna Symphonic Library, http://www.vsl.co.at.
BIBLIOGRAPHIE 247

[vV99] D. A. van Veldhuizen, Multiobjective Evolutionary Algorithms : Classifications,


Analyses and New Innovations, Ph.D. thesis, Department of Electrical and Com-
puter Engineering, Graduate School of Engineering, Air Force Institute of Tech-
nology, 1999.
[WFM03] Matthew Wright, Adrian Freed, and Ali Momeni, OpenSound Control : State of
the Art 2003, Proceedings of the 2003 Conference on New Interfaces for Musical
Expression (NIME-03) (Montral, Canada), 2003.
[WHBH06] L. While, P. Hingston, L. Barone, and S. Huband, A Faster Algorithm for Calcu-
lating Hypervolume, IEEE Transactions on Evolutionary Computation 10 (2006),
no. 1, 2938.
[Whi93] Darrell Whitley, A Genetic Algorithm Tutorial, Tech. Report CS-93-103, Colorado
State university, mars 1993.
[YP02] Collette Y. and Siarry P., Optimisation multiobjectif, Eyrolles, 2002.
[Zit99] E. Zitzler, Evolutionary Algorithms for Multiobjective Optimization : Methods and
Applications, Ph.D. thesis, Swiss Federal Institute of Technology (ETH), Zurich,
1999.
[ZLT02] E. Zitzler, M. Laumanns, and L. Thiele, SPEA2 : Improving the Strength Pareto
Evolutionary Algorithm for Multiobjective Optimization, Evolutionary Methods
for Design, Optimisation and Control with Application to Industrial Problems
(K.C. Giannakoglou et al., eds.), International Center for Numerical Methods in
Engineering (CIMNE), 2002, pp. 95100.
[ZT98a] E. Zitzler and L. Thiele, An Evolutionary Algorithm for Multiobjective Optimi-
zation : The Strength Pareto Approach, Tech. Report 43, Computer Engineering
and Communication Networks Lab (TIK) Swiss Federal Institute of Technology
(ETH), Gloriastrasse 35, CH-8092 Zurich, Switzerland, 1998.
[ZT98b] , Multiobjective Optimization Using Evolutionary Algorithms A Com-
parative Case Study, Lecture Notes in Computer Science 1498 (1998), 292302.
[ZT99] , Multiobjective Evolutionary Algorithms : A Comparative Case Study and
the Strength Pareto Approach, IEEE Transactions on Evolutionary Computation
3 (1999), no. 4, 257271.
[ZTL+ 03] E. Zitzler, L. Thiele, M. Laumanns, C. M. Foneseca, and V. Grunert da Fonseca,
Performance Assessment of Multiobjective Optimizers : An Analysis and Review,
IEEE Transactions on Evolutionary Computation 7 (2003), no. 2, 117132.
[Zwi61] E. Zwicker, Subdivision of the Audible Frequency Range into Critical Bands, Jour-
nal of the Acoustical Society of America (1961), no. 33.

Vous aimerez peut-être aussi