Ecole Doctorale

SCIENCES POUR L'INGENIEUR : Mécanique, Physique, Micro et Nanoélectronique

Spécialité

Sciences pour l'ingénieur : spécialité Acoustique

Etablissement

Aix-Marseille Université

Mots Clés

Acoustique vocale,Résonances du conduit vocal,Voix chantée,Analyse modale expérimentale,Séparation de sources,Transformée en chirplet,

Keywords

Voice acoustics,Vocal tract resonances,Singing voice,Experimental modal analysis,Source separation,Chirplet transform,

Titre de thèse

Vers la caractérisation de résonateurs dynamiques : mesurer les résonances du conduit vocal pendant le chant
Towards the characterization of dynamical resonators: measuring vocal tract resonances in singing

Date

Wednesday 5 July 2023 à 9:00

Adresse

Laboratoire de Mécanique et d’Acoustique LMA - UMR 7031 AMU - CNRS - Centrale Marseille 4 impasse Nikola Tesla CS 40006 13453 Marseille Cedex 13 Amphithéâtre Canac du LMA

Jury

Directeur de these M. Philippe GUILLEMAIN Aix Marseille Université
Rapporteur M. Peter BIRKHOLZ Technische Universität Dresden
Rapporteur M. Laurent SIMON Université du Mans
Examinateur M. Joe WOLFE Université de New South Wales
Président M. Christophe D'ALESSANDRO Sorbonne Université
CoDirecteur de these M. Fabrice SILVA Aix Marseille Université
Co-encadrant de these Mme Nathalie HENRICH BERNARDONI Université Grenoble Alpes

Résumé de la thèse

Le conduit vocal en tant que résonateur acoustique est responsable d’une grande partie de la variété des sons à la base du langage. Il joue ainsi un rôle essentiel dans la communication orale humaine et son utilisation performative est une des clés de la technique vocale pour le chant. Cette thèse porte sur la caractérisation in vivo des résonances du conduit vocal en développant une instrumentation spécifique à destination de la recherche en parole, voix, acoustique musicale, voire médicale. Dans la continuité de travaux basés sur l’émission et réception acoustiques aux lèvres, cette thèse se donne pour objectif d’améliorer le dispositif non-invasif existant et de le rendre robuste à la présence d’autres signaux — en premier lieu la voix elle-même afin de caractériser le conduit vocal en cours de phonation. Le modèle de mesure associé à la réponse en fréquence du conduit vocal à une excitation acoustique aux lèvres est justifié en étudiant le couplage des rayonnements de la source d'excitation et du conduit vocal. Le positionnement optimal de la source et du microphone est discuté en montrant qu'une prise de pression à quelques centimètres des lèvres est plus robuste qu'aux lèvres. L'utilisation d'un signal d'excitation de type chirp permet une mesure à fort niveau en séparant les non-linéarités de la chaîne d'excitation. La méthodologie de mesure et l’analyse modale associée, estimant fréquence et facteur de qualité des résonances, sont validées par comparaison entre des modèles numériques et différentes mesures d’impédances, tout d’abord sur un simple tube métallique puis sur des maquettes simplifiées de voyelles pour montrer les limites de la méthode sur certaines configurations vocaliques. Dans le contexte de mesures sur l’humain, nous abordons dans un deuxième temps la séparation entre le signal de caractérisation (chirp) et le signal de voix mesurés par le microphone. Grâce à la connaissance a priori de la trajectoire du chirp dans le plan temps-fréquence et des hypothèses sur le signal voisé, le calcul de la transformée dite en chirplets, généralisation de la transformée de Fourier à court-terme intégrant la variation de fréquence instantanée, permet une séparation relative. Nous montrons que l’utilisation d’une famille de chirplets, basé sur les polynômes d'Hermite pour assurer la stabilité numérique, rend la séparation plus efficace et la reconstruction du chirp plus fidèle sur des signaux de synthèse. Enfin, la méthodologie complète avec séparation est appliquée pour constituer et analyser une base de données de mesures sur des chanteurs de musique actuelle. Nous montrons qu'une condition de glotte fermée (apnée) induit des changements résonantiels significatifs par rapport au geste phonatoire. Les différences d'ajustements résonantiels sont étudiées en fonction des émissions des chanteurs. Cette méthode de caractérisation non-invasive permet d'estimer fréquence et largeur de bande des résonances du conduit vocal pendant le geste phonatoire sans contrainte articulatoire.

Thesis resume

The vocal tract as an acoustic resonator is responsible for much of the sounds variety in language. It thus has an essential role in human oral communication and its performative use is one of the keys to vocal technique for singing. This thesis focuses on the in vivo characterization of vocal tract resonances by developing specific instrumentation for research in speech, voice, music acoustics, and even medicine. In the framework of acoustic emission and reception at the lips, this thesis aims to improve the existing non-invasive device and to make it robust to the presence of other signals - first of all the voice itself - in order to characterize the vocal tract during phonation. The measurement model associated with vocal tract frequency response to an acoustic excitation at the lips is justified by studying the radiation coupling between the excitation source and vocal tract. Optimal positioning of source and microphone is discussed by showing that a pressure record a few centimeters away from the lips is more robust than at the lips. Use of a chirp excitation signal allows for high-level measurement by separating out non-linear effects coming from excitation chain. The measurement methodology and associated modal analysis, estimating frequency and quality factor of resonances, are validated by comparison between numerical models and different impedance measurements, first on a simple metal tube and then on simplified vowel replicas to show method limits for some vowel configurations. In the context of human measurements, we then discuss the separation between the characterization signal (chirp) and voice signal recorded by the microphone. Thanks to a priori knowledge of chirp's trajectory in the time-frequency plane and to hypotheses about voiced signal, the so-called chirplet transform, a generalization of the short-term Fourier transform integrating the instantaneous frequency variation, allows a relative separation. We show that use of a chirplets family, based on Hermite's polynomials to ensure numerical stability, makes separation more efficient and reconstruction of the chirp more faithful on synthetic signals. Finally, complete methodology with signal separation is applied to build and analyze a database of measurements on modern singing. We show that a closed glottis condition (apnea) induces significant resonance changes with respect to the phonation gesture. Differences in resonance adjustments are studied relatively to singers' emissions. This non-invasive characterization method allows to estimate frequency and bandwidth of vocal tract resonances during singing gesture without any articulation constraint.