FUNDAMENTAL FREQUENCY EXTRACTING DEVICE AND FUNDAMENTAL FREQUENCY EXTRACTING METHOD
Provided is a fundamental frequency extracting device that can extract fundamental frequencies in input speech with high precision in a noisy environment with a smaller amount of calculations and less memory. A cepstrum values are calculated (S1) in frame units for input speech data, and candidate c...
Saved in:
Main Authors | , , |
---|---|
Format | Patent |
Language | English French Japanese |
Published |
04.04.2013
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | Provided is a fundamental frequency extracting device that can extract fundamental frequencies in input speech with high precision in a noisy environment with a smaller amount of calculations and less memory. A cepstrum values are calculated (S1) in frame units for input speech data, and candidate cepstrum values are selected (S2) from this plurality of cepstrum values. Furthermore, a cepstrum plane that has an axis of the number of cepstrum dimensions as the vertical axis and an axis of cepstrum values as the horizontal axis is generated (S3) using the frame candidate points and adjacent frame candidate points. Furthermore, a plurality of straight lines through two points among the various candidate points in this cepstrum plane is generated, and an optimal straight line that forms a basis for determining the fundamental frequency is determined (S4) from the plurality of straight lines that have been generated. The number of cepstrum dimensions at the intersection of this frame and optimal straight line is acquired, and a fundamental frequency (F0) of the frame is calculated (S5) from this number of cepstrum dimensions.
L'invention porte sur un dispositif d'extraction de fréquence fondamentale qui peut extraire des fréquences fondamentales dans de la parole d'entrée avec une précision élevée dans un environnement bruité en utilisant une plus petite quantité de calcul et moins de mémoire. Des valeurs cepstrales sont calculées (S1) en unités de trame pour des données de parole d'entrée, et des valeurs cepstrales candidates sont sélectionnées (S2) parmi cette pluralité de valeurs cepstrales. En outre, un plan cepstral qui a un axe du nombre de dimensions cepstrales en tant qu'accès vertical et un axe de valeurs cepstrales en tant qu'accès horizontal est généré (S3) à l'aide des points candidats de trame et de points candidats de trame adjacents. En outre, une pluralité de lignes droites passant par deux points parmi les divers points candidats dans ce plan cepstral sont générées, et une ligne droite optimale qui forme une base pour déterminer la fréquence fondamentale est déterminée (S4) parmi la pluralité de lignes droites qui ont été générées. Le nombre de dimensions cepstrales à l'intersection de cette trame et de la ligne droite optimale est acquis, et une fréquence fondamentale (F0) de la trame est calculée (S5) à partir de ce nombre de dimensions cepstrales. |
---|---|
Bibliography: | Application Number: WO2012JP06061 |