Synthesis of V-V sequences with a 2D biomechanical tongue model controlled by the Equilibrium Point Hypothesis
An assessment of a target-based control model of speech production using Feldman's Equilibrium Point Hypothesis is presented. It consists of simulations of articulatory movements during Vowel-to-Vowel sequences with a 2D biomechanical tongue model. In the model the main muscles responsible for...
Saved in:
Published in | Speech communication Vol. 22; no. 2-3; pp. 185 - 205 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | English |
Published |
Elsevier B.V
01.08.1997
Elsevier : North-Holland |
Subjects | |
Online Access | Get full text |
ISSN | 0167-6393 1872-7182 |
DOI | 10.1016/S0167-6393(97)00019-8 |
Cover
Loading…
Summary: | An assessment of a target-based control model of speech production using Feldman's Equilibrium Point Hypothesis is presented. It consists of simulations of articulatory movements during Vowel-to-Vowel sequences with a 2D biomechanical tongue model. In the model the main muscles responsible for tongue movements and tongue shaping in the mid-sagittal plane are represented. The elastic properties are accounted through a Finite-Element modeling, while force generation principles are implemented according to the non-linear force-length Invariant Characteristics proposed by Feldman. Movement is produced through control variable shifts at rates that are constant throughout each transition. The external contours of the model are adjusted to approximate X-ray data collected on a native speaker of French, and it is inserted in the vocal tract contours of the speaker. Thus, from tongue shapes generated with the model, it was possible to produce formant trajectories compatible with the speaker's acoustic space. It permitted a comparison of simulations with real data collected on the speaker in the kinematic and acoustic domains. Emphasis is put on the realism of synthesized formant trajectories, and on the potential influence of biomechanical tongue properties on to measurable kinematic features.
Wir stellen eine Bewertung eines Sprachproduktionsmodells vor, das das Konzept von phonetischem Ziel einschliesst, und auf der Equilibrium Point Hypothesis von Feldman beruht. Dafür wurden artikulatorische Bewegungen in vokalischen Reihenfolgen mit einem zweidimensionalen Zungenmodell simuliert. In diesem Modell wurden die Muskeln eingeschlossen, deren Wirkungen auf die Zungengestalt in der sagitalen Ebene die wichtigsten sind. Durch die Methode der endlichen Elemente wurden die elastischen Eigenschaften der Zunge modellisiert, und die muskuläre Kraft entspricht Feldmans unlinearen “Kraft-Länge unveränderlichen Kurven”. Die Bewegung wurde durch die Veränderung der Kontrollparameter mit einer in jeder vokalischen Reihenfolge gleichbleibenden Geschwindigkeit produziert. Die Auβenränder des Zungen-modells wurden Röentgenstrahldaten angepasst, die bei einem französischen Sprecher erworben wurden; das Modell wurde innerhalb der Vokaltraktränder dieses Sprechers integriert. Dadurch wurde es möglich Formantbahnen aus den zeitlichen Reihenfolgen von Zungengestalten zu synthetisieren, die den akustischen Eigenschaften des Sprechers entsprechen. Simulationen und Daten wurden danach vergleichbar. Dieser Vergleich betont den Realismus der synthetisierten Formantbahnen, und zeigt inwiefern die biomekanischen Eigenschaften einer Sprache potentiell die auswertbaren kinematischen Charakteristika beeinflussen können.
Nous présentons une évaluation d'un modèle de contrôle de la production de la parole exploitant la notion de cible, fondé sur l'Hypothèse du Point d'Équilibre de Feldman. Elle consiste en des simulations, avec un modèle biomécanique bi-dimensionnel de la langue, de mouvements articulatoires lors de transitions vocaliques. Dans le modèle, les principaux muscles agissant sur la forme de la langue dans le plan sagittal sont représentés. La méthode des éléments finis modélise les propriétes élastiques de l'articulateur, et les principes de génération de force sont conformes aux Caractéristiques Invariantes Force-Longueur non linéaires de Feldman. Le mouvement est produit en déplaçant les variables de contrôle à vitesse constante pour chacune des transitions. Les contours externes de la langue sont ajustés pour correspondre aux données radiographiques acquises sur un locuteur français, et le modèle est placé à l'intérieur des contours fixes du conduit vocal de ce locuteur. Ainsi, il a été possible de synthétiser, à partir des contours du modèle, des trajectoires formantiques adaptées à l'espace acoustique du locuteur, afin de comparer simulations et données. Nous insistons sur le caractère réaliste des trajectoires formantiques synthétisées, et sur le rôle potentiel des propriétés biomécaniques de la langue sur les caractéristiques cinématiques mesurables. |
---|---|
Bibliography: | ObjectType-Article-2 SourceType-Scholarly Journals-1 ObjectType-Feature-1 content type line 23 ObjectType-Article-1 ObjectType-Feature-2 |
ISSN: | 0167-6393 1872-7182 |
DOI: | 10.1016/S0167-6393(97)00019-8 |