Synthesis of V-V sequences with a 2D biomechanical tongue model controlled by the Equilibrium Point Hypothesis

An assessment of a target-based control model of speech production using Feldman's Equilibrium Point Hypothesis is presented. It consists of simulations of articulatory movements during Vowel-to-Vowel sequences with a 2D biomechanical tongue model. In the model the main muscles responsible for...

Full description

Saved in:
Bibliographic Details
Published inSpeech communication Vol. 22; no. 2-3; pp. 185 - 205
Main Authors Payan, Yohan, Perrier, Pascal
Format Journal Article
LanguageEnglish
Published Elsevier B.V 01.08.1997
Elsevier : North-Holland
Subjects
Online AccessGet full text
ISSN0167-6393
1872-7182
DOI10.1016/S0167-6393(97)00019-8

Cover

Loading…
More Information
Summary:An assessment of a target-based control model of speech production using Feldman's Equilibrium Point Hypothesis is presented. It consists of simulations of articulatory movements during Vowel-to-Vowel sequences with a 2D biomechanical tongue model. In the model the main muscles responsible for tongue movements and tongue shaping in the mid-sagittal plane are represented. The elastic properties are accounted through a Finite-Element modeling, while force generation principles are implemented according to the non-linear force-length Invariant Characteristics proposed by Feldman. Movement is produced through control variable shifts at rates that are constant throughout each transition. The external contours of the model are adjusted to approximate X-ray data collected on a native speaker of French, and it is inserted in the vocal tract contours of the speaker. Thus, from tongue shapes generated with the model, it was possible to produce formant trajectories compatible with the speaker's acoustic space. It permitted a comparison of simulations with real data collected on the speaker in the kinematic and acoustic domains. Emphasis is put on the realism of synthesized formant trajectories, and on the potential influence of biomechanical tongue properties on to measurable kinematic features. Wir stellen eine Bewertung eines Sprachproduktionsmodells vor, das das Konzept von phonetischem Ziel einschliesst, und auf der Equilibrium Point Hypothesis von Feldman beruht. Dafür wurden artikulatorische Bewegungen in vokalischen Reihenfolgen mit einem zweidimensionalen Zungenmodell simuliert. In diesem Modell wurden die Muskeln eingeschlossen, deren Wirkungen auf die Zungengestalt in der sagitalen Ebene die wichtigsten sind. Durch die Methode der endlichen Elemente wurden die elastischen Eigenschaften der Zunge modellisiert, und die muskuläre Kraft entspricht Feldmans unlinearen “Kraft-Länge unveränderlichen Kurven”. Die Bewegung wurde durch die Veränderung der Kontrollparameter mit einer in jeder vokalischen Reihenfolge gleichbleibenden Geschwindigkeit produziert. Die Auβenränder des Zungen-modells wurden Röentgenstrahldaten angepasst, die bei einem französischen Sprecher erworben wurden; das Modell wurde innerhalb der Vokaltraktränder dieses Sprechers integriert. Dadurch wurde es möglich Formantbahnen aus den zeitlichen Reihenfolgen von Zungengestalten zu synthetisieren, die den akustischen Eigenschaften des Sprechers entsprechen. Simulationen und Daten wurden danach vergleichbar. Dieser Vergleich betont den Realismus der synthetisierten Formantbahnen, und zeigt inwiefern die biomekanischen Eigenschaften einer Sprache potentiell die auswertbaren kinematischen Charakteristika beeinflussen können. Nous présentons une évaluation d'un modèle de contrôle de la production de la parole exploitant la notion de cible, fondé sur l'Hypothèse du Point d'Équilibre de Feldman. Elle consiste en des simulations, avec un modèle biomécanique bi-dimensionnel de la langue, de mouvements articulatoires lors de transitions vocaliques. Dans le modèle, les principaux muscles agissant sur la forme de la langue dans le plan sagittal sont représentés. La méthode des éléments finis modélise les propriétes élastiques de l'articulateur, et les principes de génération de force sont conformes aux Caractéristiques Invariantes Force-Longueur non linéaires de Feldman. Le mouvement est produit en déplaçant les variables de contrôle à vitesse constante pour chacune des transitions. Les contours externes de la langue sont ajustés pour correspondre aux données radiographiques acquises sur un locuteur français, et le modèle est placé à l'intérieur des contours fixes du conduit vocal de ce locuteur. Ainsi, il a été possible de synthétiser, à partir des contours du modèle, des trajectoires formantiques adaptées à l'espace acoustique du locuteur, afin de comparer simulations et données. Nous insistons sur le caractère réaliste des trajectoires formantiques synthétisées, et sur le rôle potentiel des propriétés biomécaniques de la langue sur les caractéristiques cinématiques mesurables.
Bibliography:ObjectType-Article-2
SourceType-Scholarly Journals-1
ObjectType-Feature-1
content type line 23
ObjectType-Article-1
ObjectType-Feature-2
ISSN:0167-6393
1872-7182
DOI:10.1016/S0167-6393(97)00019-8