Le signal musical : une superposition d’objets sonores

Tรฉlรฉcharger le fichier pdf d’un mรฉmoire de fin d’รฉtudes

ร‰conomie de la reprรฉsentation

On examine les diverses possibilitรฉs de mesurer le coรปt correspondant ร  la description, notรฉ , des donnรฉes nรฉcessaires ร  la reprรฉsentation d’un signal par un modรจle granulaire.
Cas des reprรฉsentations linรฉaires
Dans le cas oรน la reprรฉsentation est linรฉaire (bases, frames …), la notion de parcimonie renvoie au nombre de composantes eectivement utilisรฉes pour reprรฉsenter le signal.
La parcimonie est un indicateur de la dispersion des valeurs des coecients d’une reprรฉsentation d’un signal sur une famille vectorielle (base, dictionnaire …). La norme L0 des coecients ou le rapport des normes L1=L2 sont communรฉment utilisรฉes.
Notons de plus que la parcimonie peut รชtre reliรฉe [KDRE+99] ร  la capacitรฉ d’un signal ร  รชtre codรฉ de faรงon ecace. Par exemple dans le cas de la norme L0, plus la reprรฉsentation du signal comporte de coecients nuls et plus petit sera le nombre de ces mรชme coecients ร  transmettre.
Cas de la reprรฉsentation granulaire
Du fait que la fonction de synthรจse F n’est en gรฉnรฉral pas linรฉaire par rapport aux param รจtre , un critรจre de parcimonie n’est cependant pas susant pour mesurer le caractรจre รฉconomique d’une reprรฉsentation granulaire. Une raison pour ne pas utiliser la parcimonie* est que les diรฉrentes composantes 1 : : : d de ne sont ni de mรชme nature, ni du mรชme ordre de grandeur ; il n’y aurait donc aucun sens ร  additionner des puissances de celles-ci.
Une deuxiรจme raison, plus profonde, est que la parcimonie n’est pas รฉquivalente ร  l’รฉconomie, au sens ou la parcimonie ne mesure pas la rรฉgularitรฉ des coecients. Les techniques telles que le codage entropique permettent de diminuer la quantitรฉ de donner nรฉcessaires ร  la description quantitative des coecients en exploitant les rรฉgularitรฉs dans la suite des coecients. Autrement dit, il est aussi รฉconomique de coder un vecteur de coecient que le vecteur + c, oรน c 6= 0 est un vecteur constant, bien que L0 ( + c) > L0 ().
La troisiรจme raison, et ร  nos yeux la plus importante, est que la connaissance de la base, du dictionnaire ou autre est, en plus des coecients, nรฉcessaire ร  la reconstruction du signal. Ainsi, quand on transmet une suite de coecients de Fourier, la base est connue implicitement par l’inclusion du terme ‘Fourier’, et il est facile de construire une base de Fourier ร  partir de la seule donnรฉe de la taille de la base. A contrario, le dictionnaire utilisรฉ pour la reprรฉsentation granulaire dรฉpend lui-mรชme du signal, et il faut donc le transmettre tel quel (ensemble de vecteurs) ou codรฉ sous une forme ou une autre.
Le critรจre d’รฉconomie ou de complexitรฉ
Dans l’idรฉal, le critรจre que l’on voudrait rรฉellement mesurer est la quantitรฉ d’information strictement nรฉcessaire ร  la description complรจte des diรฉrents รฉlรฉments de la reprรฉsentation, qui est formalisรฉe par les notions de Complexitรฉ de Kolmogorov [GV99, LV93, M02] et de Minimum Description Length, dans sa version dite idรฉale 5 [GV03]. La dรฉfinition de la complexitรฉ proposรฉe par Kolmogorov est particuliรจrement รฉlรฉgante, en ce sens que celle-ci ne requiert ni ne prรฉsuppose aucune autre connaissance que celle des observations elle-mรชmes, et en particulier d’aucun a priori ou modรจle des donnรฉes observรฉes, comme c’est par exemple le cas avec la thรฉorie dรฉbit-distorsion.
Malheureusement, s’il a รฉtรฉ dรฉmontrรฉ l’existence et l’universalitรฉ de cette mesure de complexitรฉ, il a รฉgalement รฉtรฉ dรฉmontrรฉ qu’on ne peut pas concevoir de programme pour la calculer de maniรจre systรฉmatique. On peut toutefois employer certaines stratรฉgies pour essayer en pratique de contourner le problรจme, comme de chercher des majorants de la complexitรฉ de Kolmogorov, typiquement en utilisant un algorithme de compression exploitant les redondances statistiques des donnรฉes. Par exemple, le systรจme de classification automatique de morceaux de musique par genres, prรฉsentรฉ dans Algorithmic Clustering of Music [CVdW03], utilise une mesure d’information mutuelle dรฉrivรฉ de la complexitรฉ de Kolmogorov, qui est approximรฉe en mesurant le taux de compression d’un algorithme standard type Lempel-Ziv. Ce systรจme exploite en l’occurrence la reprรฉsentation MIDI, reprรฉsentation qui peut dรฉjร  elle-mรชme รชtre considรฉrรฉe comme une forme du signal trรจs compressรฉe (avec pertes).
Sachant que l’on travaille directement ร  partir de fragments de signaux et non ร  partir d’une reprรฉsentation symbolique, qui est naturellement beaucoup plus compacte et structurรฉe, l’approche consistant ร  relier la complexitรฉ de Kolmogorov du dictionnaire au taux de compression par un algorithme standard ne nous a pas semblรฉ rรฉaliste. Le problรจme est en eet que la mesure rรฉsultante serait excessivement dรฉpendante du choix de l’algorithme de compression utilisรฉ, par exemple selon que l’on utilise un codeur sans pertes (type zip) ou psychoacoustique (type mp3), auquel viennent se rajouter des problรจmes purement calculatoires rรฉsultant de la masse consรฉquente de donnรฉes ร  traiter.
Le choix a donc รฉtรฉ fait de dรฉnir le coรปt simplement comme le nombre de variables scalaires indรฉpendantes nรฉcessaires ร  la description de la reprรฉsentation.
Dรฉni de cette maniรจre, peut รชtre qualiรฉ de coรปt structurel de description, au sens 5Le terme MDL recouvre plusieurs dรฉnitions selon les diรฉrents auteurs et ouvrages considรฉrรฉs. ou celui-ci n’intรจgre que les relations entre les objets et fait entiรจrement abstraction de la partie bas-niveau de la reprรฉsentation, c’est-ร -dire des donnรฉes du dictionnaire. Avant de dรฉtailler les diรฉrents termes intervenant dans l’expression du calcul de , on insiste sur les points suivants :
I est un coรปt associรฉ ร  une description de la reprรฉsentation, ce n’est donc en aucune sorte un coรปt minimal.
I n’intรจgre pas le coรปt de description du signal d’erreur es.
I est rapportรฉ au coรปt de description des donnรฉes brutes du signal, i.e. N , oรน N est la longueur du signal en รฉchantillons, conduisant ainsi ร  une quantitรฉ sans dimension. Cette normalisation par rapport ร  la taille du signal prendra tout son sens au moment de comparer la parcimonie de deux reprรฉsentations pour deux signaux diรฉrents.
Expression dรฉtaillรฉeย 
Pour dรฉcrire une reprรฉsentation d’un signal, il est a priori nรฉcessaire de disposer des donnรฉes correspondant aux valeurs prises par les variables ci-dessous.
Le coรปt de description d’une variable scalaire est choisi รฉgal ร  1. Ce choix permet d’รฉviter ร  ce stade le problรจme de la quantication des variables. Logiquement, on considรจre รฉgalement qu’une variable vectorielle de dimension n a un coรปt n, รฉquivalent ร  n scalaires.
Les diรฉrents termes intervenant dans le calcul du coรปt total sont :
0 donnรฉes indรฉpendantes du signal :
I donnรฉes du programme de calcul numรฉrique des valeurs prises par la fonction
I donnรฉes correspondant aux valeurs des constantes d, , q, K et M
t donnรฉes des instants tm
D donnรฉes nรฉcessaires ร  la description du dictionnaire D = f kmgm=1:::M
I donnรฉes des index km des objets dans le dictionnaire
donnรฉes contenant les valeurs des paramรจtres m
L’expression des coรปts individuels est dรฉtaillรฉe ci-dessous, puis simpliรฉe quand cela s’avรจre possible, :
0 Les donnรฉes de la fonction F, les dimensions d des objets et des prototypes sont xรฉes ร  l’avance. Les valeurs de M et de K peuvent en outre รชtre dรฉduites des donnรฉes de km et de D respectivement : il sut de compter leur nombre.
Le coรปt 0 ne sera par consรฉquent pas pris en compte dans le coรปt global .
t Les instants tm รฉtant xรฉs ร  l’avance, ร  moins que le contraire ne soit spรฉciรฉ explicitement, ce coรปt est nul.
D Le coรปt D dรฉpend de la nature des prototypes, il sera par consรฉquent explicitรฉ au moment de fournir des exemples concrets de modรจles granulaires, au chapitre 5, p.101. Dans tous les cas, ce coรปt est infรฉrieur ou รฉgal ร  K .
I Ce coรปt est simplement le nombre d’objets, M.
est รฉgal au nombre M d’objets multipliรฉ par la dimension q du vecteur .
1. Identication des objets sonores (Section 4.1)
Comment dรฉcomposer un signal sur un dictionnaire donnรฉ ?
Si l’on suppose les objets sonores et le dictionnaire connus, ce problรจme revient alors ร  trouver pour chacun de ces objets le prototype et les paramรจtres minimisant l’erreur d’approximation
2. Choix du dictionnaire (Section 4.2)
Comment choisir le dictionnaire optimal รฉtant donnรฉ un signal s ?
Ce problรจme inclut les questions liรฉes au
I calcul du dictionnaire proprement-dit, sa taille K รฉtant connue et xรฉe.
I choix du nombre K de prototypes dans le dictionnaire
3. Spรฉcication de la forme gรฉnรฉrale des objets (Chapitre 5)

Quelle forme adopter pour la fonction F ?

Les chapitres suivants sont consacrรฉs ร  l’รฉtude de ces problรจmes, moyennant certaines restrictions : les objets sonores sont xรฉs comme รฉtant les trames du signal aprรจs fenรชtrage, le domaine de recherche du dictionnaire est restreint et la fonction F est la mรชme pour tous les prototypes.

Le rapport de stage ou le pfe est un document dโ€™analyse, de synthรจse et dโ€™รฉvaluation de votre apprentissage, cโ€™est pour cela chatpfe.com propose le tรฉlรฉchargement des modรจles complet de projet de fin dโ€™รฉtude, rapport de stage, mรฉmoire, pfe, thรจse, pour connaรฎtre la mรฉthodologie ร  avoir et savoir comment construire les parties dโ€™un projet de fin dโ€™รฉtude.

Table des matiรจres

Introductionย 
I Prรฉsentationย 
1 Structure d’un signal musicalย 
1.1 Le signal musical : une superposition d’objets sonores
1.1.1 Structure gรฉnรฉrale d’un signal musical
1.1.2 La norme MIDI
1.1.3 MPEG4 – Structured Audio
1.2 Mรฉthodes de synthรจse musicale
1.2.1 Concepts de base
1.2.2 Synthรจses soustractive, additive et dรฉrivรฉes
1.2.3 Synthรจse granulaire et ses variantes
1.2.4 Autres mรฉthodes
1.3 Conclusion
2 Analyse et synthรจse de signaux musicauxย 
2.1 L’approche analyse-synthรจse
2.1.1 Deux opรฉrations duales
2.1.2 L’analyse par la synthรจse
2.1.3 Le Matching Pursuit
2.1.4 Codeurs CELP
2.2 Applications de l’analyse-synthรจse
2.2.1 Le Vocodeur
2.2.2 PSOLA
2.2.3 Codage et Compression
2.2.4 Sรฉparation de sources
2.2.5 Traitements sonores
2.3 Conclusion
II Modรฉlisation granulaire du signal sonoreย 
3 Introduction du modรจleย 
3.1 Prรฉsentation du modรจle
3.1.1 Le signal sonore : une superposition d’objets รฉlรฉmentaires
3.1.2 Principe gรฉnรฉral d’un modรจle granulaire
3.1.3 Le modรจle granulaire en dรฉtail
3.1.4 Dรฉnitions et Notations
3.1.5 Interprรฉtation probabiliste
3.1.6 Mesure de similaritรฉ
3.1.7 Exemple de modรจle : Synthรจse ร  Table d’ondes
3.2 Discussion autour du modรจle
3.2.1 Caractรฉristiques des objets sonores
3.2.2 Localisation temporelle des objets
3.2.3 Diรฉrents types de redondances
3.2.4 Mesurer la similaritรฉ entre objets
3.2.5 Exemples de mesures
3.3 Reprรฉsentation par un modรจle granulaire
3.3.1 Formulation gรฉnรฉrale du problรจme
3.3.2 Qualitรฉ de l’approximation
3.3.3 ร‰conomie de la reprรฉsentation
3.3.4 Le problรจme sous contraintes
3.4 Conclusion
4 Calcul du modรจleย 
4.1 Caractรฉrisation des objets sonores
4.1.1 Localisation temporelle des objets
4.1.2 Estimation des paramรจtres
4.1.3 Matching Pursuit et modรจle granulaire
4.2 Calcul du dictionnaire
4.2.1 Position du problรจme
4.2.2 Calcul du dictionnaire par apprentissage
4.2.3 Un exemple d’algorithme classique , le K-Mรฉdians
4.2.4 Algorithmes ร  seuil(s)
4.2.5 Algorithmes gloutons
4.2.6 Considรฉrations en rapport avec l’aspect calculatoire
4.3 Conclusion
5 ร‰tude spรฉcique de modรจlesย 
5.1 Modรจles type Table d’ondes
5.1.1 Table d’ondes simple
5.1.2 Modรจle table d’ondes avec dรฉcalage (TO)
5.1.3 Coรปt de description du dictionnaire
5.1.4 Conclusion : vers une gรฉnรฉralisation du modรจle TO
5.2 Modรจles type tables de spectres
5.2.1 La hantise du Spectre de phase
5.2.2 Structure gรฉnรฉrale du modรจle
5.2.3 Modรฉlisation du spectre de phase
5.2.4 Discussion autour du problรจme de l’estimation de la phase
5.2.5 Un embryon de modรจle perceptif
5.2.6 Observations ร  partir d’expรฉriences prรฉliminaires
5.3 Conclusion
III Expรฉrimentation et รฉvaluationย 
6 Critรจres d’รฉvaluationย 
6.1 Protocole expรฉrimental
6.2 Critรจres d’รฉvaluation
6.3 Conditions de mise en รทuvre des expรฉriences
6.3.1 A propos de la base de test
6.3.2 Observations ร  partir des matrices de similaritรฉ
6.3.3 Un modรจle de la distribution des valeurs de ?
6.3.4 Implรฉmentation logicielle
7 ร‰valuations sur des signaux monophoniquesย 
7.1 Comparaison des algorithmes de classication
7.2 Comparaisons entre modรจles
7.2.1 Modรจles type table d’ondes
7.2.2 Inuence de la taille de la fenรชtre
7.2.3 Similaritรฉ moyenne
7.3 Comparaisons entre diรฉrents signaux
7.4 A propos de l’erreur
7.4.1 Critรจre mesurรฉ vs. critรจre optimisรฉ
7.4.2 Commentaire
7.5 Reprรฉsentation Temps-Prototype et applications musicales
7.6 Perspective d’application : compression avec pertes
7.7 Conclusion
IV Conclusion et perspectives
Problรจmes ร  rรฉsoudre
Conclusionย 
Bibliographie

Tรฉlรฉcharger le rapport complet

Tรฉlรฉcharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiรฉe. Les champs obligatoires sont indiquรฉs avec *