Ecole Doctorale

SCIENCES POUR L'INGENIEUR : Mécanique, Physique, Micro et Nanoélectronique

Spécialité

Sciences pour l'ingénieur : spécialité Acoustique

Etablissement

Aix-Marseille Université

Mots Clés

Invariants perceptif,Forme d’objet,Sons d’impacts,Analyse par synthèse,

Keywords

Perceptual Invariants,Object shape,Impact Sounds,Analysis- Synthesis,

Titre de thèse

Perception sonore des objets pour un contrôle intuitif de la synthèse : vers un langage des sons
Sound perception of objects for intuitive control of synthesis : towards a language of sounds

Date

Mercredi 28 Avril 2021 à 10:00

Adresse

31 Chemin Joseph Aiguier 13009 Marseille Amphithéâtre Pierre Desnuelle

Jury

Rapporteur Mme Stefania SERAFIN Aalborg University
Rapporteur M. Nicolas MISDARIIS IRCAM - UMR STMS
Examinateur M. Sylvain MARCHAND Laboratoire Informatique, Image et Interaction L3i
Directeur de these M. Richard KRONLAND-MARTINET Laboratoire PRISM
CoDirecteur de these Mme Mitsuko ARAMAKI laboratoire PRISM

Résumé de la thèse

Le domaine des sciences du son a pris une ampleur remarquable grâce au traitement du signal numérique. Nous disposons aujourd'hui d'outils, de modèles et de méthodes de synthèse sonore aptes à engendrer des sons au réalisme impressionnant ou à créer des sons inouïs. Cependant le contrôle de ces outils de synthèse reste une problématique d'actualité. En effet, même si les modèles sont très performants, les paramètres de synthèse de bas-niveau sont difficiles à contrôler d'un point de vue perceptif par un utilisateur non expert. En se basant sur l'approche écologique de la perception, un paradigme de contrôle de la synthèse, appelé paradigme action-objet, permettant de créer des sons à partir des évocations relatives à l'action et à l'objet via une description sémantique des attributs perceptifs de ces derniers, a été proposé par des chercheurs du laboratoire PRISM. Ces travaux ont conduit au développement d'un synthétiseur de sons de l'environnement. Cependant, ce dernier présente encore des limitations, en particulier, au niveau des stratégies de contrôle relatives à la forme perçue des objets. Ce travail de thèse vise à définir une nouvelle stratégie de contrôle perceptif d'un l'objet virtuel à partir de l'étude de la perception sonore des objets du quotidien. Cette étude aborde deux questions principales : Quels sont les attributs perceptifs majeurs liés à la forme d'un objet ? Quelles sont les morphologies sonores associées à ces attributs perceptifs ? Au cours de ce travail nous avons, dans un premier temps, évalué l'interface de contrôle actuelle du synthétiseur afin de préciser ses limites liées à la manipulation de la forme de l'objet. Ces observations nous ont conduit à̀ rechercher les structures sonores invariantes associées à la perception de la forme des objets en adoptant une approche d'analyse par synthèse. Pour cela, des méthodes de simulation physique ont été mises en œuvre afin de modéliser des transitions continues entre catégories de formes, liées en particulier à l'élargissement, l'épaississement et la courbure d'un objet virtuel. Les résultats obtenus ont permis de définir des modèles de signaux reproduisant les morphologies sonores observées dans le cadre des simulations physiques. Ces modèles ont par la suite été évalués et calibrés perceptivement. Enfin, l'ensemble de ces données a été discuté dans le cadre de la synthèse sonore afin de proposer une nouvelle stratégie de contrôle basée sur les principaux attributs perceptifs de l'objet. Ce travail de thèse a ainsi contribué à mieux définir les briques sémiotiques élémentaires pour la construction d'un véritable langage des sons. Il ouvre par ailleurs de nombreuses perspectives dans des domaines d'applications tels que la réalité virtuelle ou la création sonore.

Thesis resume

The field of sound science has grown remarkably thanks to digital signal processing. Today we have tools, models and methods of sound synthesis able to generate sounds with impressive realism or to create unheard of sounds. However, the control of these synthesis tools remains a current issue. Indeed, even if the models are very powerful, the low-level synthesis parameters are difficult to control from a perceptual point of view by a non-expert user. Based on the ecological approach of perception, a paradigm of synthesis control, called action-object paradigm, allowing to create sounds from the evocations relative to the action and the object via a semantic description of their perceptive attributes, has been proposed by researchers of the PRISM laboratory. This work led to the development of an environmental sound synthesizer. However, the synthesizer still has limitations, particularly in terms of control strategies relating to the perceived shape of objects. This thesis work aims at defining a new strategy of perceptive control of a virtual object based on the study of the sound perception of everyday objects. This study addresses two main questions : What are the major perceptive attributes related to the shape of an object? What are the sound morphologies associated with these perceptive attributes ? In the course of this work we first evaluated the current control interface of the synthesizer in order to specify its limits linked to the manipulation of the object’s shape. These observations led us to search for the invariant sound structures associa- ted with the perception of the shape of objects by adopting an analysis-by-synthesis approach. For this purpose, physical simulation methods were implemented in order to model continuous transitions between categories of shapes, linked in particular to the widening, thickening and curvature of a virtual object. The results obtained made it possible to define signal models reproducing the sound morphologies observed in the physical simulations. These models were then evaluated and perceptually calibrated. Finally, all these data were discussed in the context of sound synthesis in order to suggest a new control strategy based on the main perceptual attributes of the object. This thesis work has thus contributed to better define the elementary semiotic bricks for the construction of a true sound language. It also opens up numerous perspectives in application domains such as virtual reality or sound creation.