TECHNIQUES FOR DISAMBIGUATING SPEECH INPUT USING MULTIMODAL INTERFACES
A technique is disclosed for disambiguating speech input (202) for multimodal systems by using a combination of speech and visual I/O interfaces. When the user's speech input is not recognized with sufficiently high confidence, a the user is presented with a set of possible matches (210) using...
Saved in:
Main Authors | , , , |
---|---|
Format | Patent |
Language | English French |
Published |
24.06.2004
|
Edition | 7 |
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | A technique is disclosed for disambiguating speech input (202) for multimodal systems by using a combination of speech and visual I/O interfaces. When the user's speech input is not recognized with sufficiently high confidence, a the user is presented with a set of possible matches (210) using a visual display and/or speech output. The user then selects (212) the intended input from the list of matches via one or more available input mechanisms (e.g., stylus, buttons, keyboard, mouse, or speech input). These techniques involve the combined use of speech and visual interfaces to correctly identify user's speech input. The techniques disclosed herein may be utilized in computer devices such as PDAs, cellphones, desktop and laptop computers, tablet PCs, etc.
L'invention concerne une technique de désambiguïsation d'entrée vocale (202) pour systèmes multimodaux, reposant sur la combinaison d'interface entrée/sortie vocale et d'interface entrée/sortie visuelle. Lorsque l'entrée vocale de l'utilisateur n'est pas reconnue avec une confiance suffisamment élevée, l'utilisateur reçoit une série de correspondances possibles (210) au moyen d'un afficheur visuel et/ou d'une sortie vocale. Ensuite, l'utilisateur sélectionne (212) l'entrée souhaitée sur la liste de correspondances, via un ou plusieurs mécanismes d'entrée disponibles (par exemple, stylet, boutons, clavier, souris, ou entrée vocale). Ce type de technique fait appel à une combinaison d'interface vocale et d'interface visuelle pour l'identification correcte d'une entrée vocale d'utilisateur. Les techniques considérées peuvent être utilisées sur des dispositifs informatiques du type assistant numérique, téléphone cellulaire, ordinateur de bureau, ordinateur portable, PC tablette, etc. |
---|---|
Bibliography: | Application Number: WO2003US39602 |