AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR

There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator (10) may generate an audio signal (16) from an input signal (14) and target data (12) representing the audio signal (16). The target data (12) is derived from text. The audio generator c...

Full description

Saved in:
Bibliographic Details
Main Authors KORSE, Srikanth, BÜTHE, Jan, MULTRUS, Markus, FUCHS, Guillaume, AHMED, Ahmed Mustafa Mahmoud, PIA, Nicola, GUPTA, Kishan
Format Patent
LanguageEnglish
French
Published 21.04.2022
Subjects
Online AccessGet full text

Cover

Loading…
Abstract There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator (10) may generate an audio signal (16) from an input signal (14) and target data (12) representing the audio signal (16). The target data (12) is derived from text. The audio generator comprises: a first processing block (40, 50, 50a-50h), receiving first data (15, 59a) derived from the input signal (14) and outputting first output data (69); a second processing block (45), receiving, as second data, the first output data (69) or data derived from the first output data (69). The first processing block (50) comprises: a conditioning set of learnable layers (71, 72, 73) configured to process the target data (12) to obtain conditioning features parameters (74, 75); and a styling element (77), configured to apply the conditioning feature parameters (74, 75) to the first data (15, 59a) or normalized first data (59, 76'). La divulgation concerne des techniques de génération d'un signal audio et d'entraînement d'un générateur audio. Un générateur audio (10) peut générer un signal audio (16) à partir d'un signal d'entrée (14) et des données cibles (12) représentant le signal audio (16). Les données cibles (12) sont dérivées de texte. Le générateur audio comprend : un premier bloc de traitement (40, 50, 50a-50h), recevant de premières données (15, 59a) dérivées du signal d'entrée (14) et délivrant de premières données de sortie (69) ; un second bloc de traitement (45), recevant, en tant que secondes données, les premières données de sortie (69) ou des données dérivées des premières données de sortie (69). Le premier bloc de traitement (50) comprend : un ensemble de conditionnement de couches pouvant être apprises (71, 72, 73) configuré pour traiter les données cibles (12) pour obtenir des paramètres de caractéristiques de conditionnement (74, 75) ; et un élément de mise en forme (77), configuré pour appliquer les paramètres de caractéristiques de conditionnement (74, 75) aux premières données (15, 59a) ou à de premières données normalisées (59, 76').
AbstractList There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator (10) may generate an audio signal (16) from an input signal (14) and target data (12) representing the audio signal (16). The target data (12) is derived from text. The audio generator comprises: a first processing block (40, 50, 50a-50h), receiving first data (15, 59a) derived from the input signal (14) and outputting first output data (69); a second processing block (45), receiving, as second data, the first output data (69) or data derived from the first output data (69). The first processing block (50) comprises: a conditioning set of learnable layers (71, 72, 73) configured to process the target data (12) to obtain conditioning features parameters (74, 75); and a styling element (77), configured to apply the conditioning feature parameters (74, 75) to the first data (15, 59a) or normalized first data (59, 76'). La divulgation concerne des techniques de génération d'un signal audio et d'entraînement d'un générateur audio. Un générateur audio (10) peut générer un signal audio (16) à partir d'un signal d'entrée (14) et des données cibles (12) représentant le signal audio (16). Les données cibles (12) sont dérivées de texte. Le générateur audio comprend : un premier bloc de traitement (40, 50, 50a-50h), recevant de premières données (15, 59a) dérivées du signal d'entrée (14) et délivrant de premières données de sortie (69) ; un second bloc de traitement (45), recevant, en tant que secondes données, les premières données de sortie (69) ou des données dérivées des premières données de sortie (69). Le premier bloc de traitement (50) comprend : un ensemble de conditionnement de couches pouvant être apprises (71, 72, 73) configuré pour traiter les données cibles (12) pour obtenir des paramètres de caractéristiques de conditionnement (74, 75) ; et un élément de mise en forme (77), configuré pour appliquer les paramètres de caractéristiques de conditionnement (74, 75) aux premières données (15, 59a) ou à de premières données normalisées (59, 76').
Author BÜTHE, Jan
FUCHS, Guillaume
AHMED, Ahmed Mustafa Mahmoud
GUPTA, Kishan
KORSE, Srikanth
PIA, Nicola
MULTRUS, Markus
Author_xml – fullname: KORSE, Srikanth
– fullname: BÜTHE, Jan
– fullname: MULTRUS, Markus
– fullname: FUCHS, Guillaume
– fullname: AHMED, Ahmed Mustafa Mahmoud
– fullname: PIA, Nicola
– fullname: GUPTA, Kishan
BookMark eNrjYmDJy89L5WSIcgx18fRXcHf1cw1yDPEPUnD0c1HwdQ3x8HcJVnAD8qEynn7uQCkFiOpgT3c_Rx-w0pAgR08_FEm4UTwMrGmJOcWpvFCam0HZzTXE2UM3tSA_PrW4IDE5NS-1JD7c38jAyMjA3NLQyNLR0Jg4VQAbWjP0
ContentType Patent
DBID EVB
DatabaseName esp@cenet
DatabaseTitleList
Database_xml – sequence: 1
  dbid: EVB
  name: esp@cenet
  url: http://worldwide.espacenet.com/singleLineSearch?locale=en_EP
  sourceTypes: Open Access Repository
DeliveryMethod fulltext_linktorsrc
Discipline Medicine
Chemistry
Sciences
Physics
DocumentTitleAlternate GÉNÉRATEUR AUDIO ET PROCÉDÉS DE GÉNÉRATION D'UN SIGNAL AUDIO ET D'ENTRAÎNEMENT D'UN GÉNÉRATEUR AUDIO
ExternalDocumentID WO2022079129A1
GroupedDBID EVB
ID FETCH-epo_espacenet_WO2022079129A13
IEDL.DBID EVB
IngestDate Fri Jul 19 13:15:14 EDT 2024
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Language English
French
LinkModel DirectLink
MergedId FETCHMERGED-epo_espacenet_WO2022079129A13
Notes Application Number: WO2021EP78371
OpenAccessLink https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20220421&DB=EPODOC&CC=WO&NR=2022079129A1
ParticipantIDs epo_espacenet_WO2022079129A1
PublicationCentury 2000
PublicationDate 20220421
PublicationDateYYYYMMDD 2022-04-21
PublicationDate_xml – month: 04
  year: 2022
  text: 20220421
  day: 21
PublicationDecade 2020
PublicationYear 2022
RelatedCompanies FRAUNHOFER-GESELLSCHAFT ZUR FÖRDERUNG DER ANGEWANDTEN FORSCHUNG E.V
RelatedCompanies_xml – name: FRAUNHOFER-GESELLSCHAFT ZUR FÖRDERUNG DER ANGEWANDTEN FORSCHUNG E.V
Score 3.3848472
Snippet There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator (10) may generate an audio signal (16) from...
SourceID epo
SourceType Open Access Repository
SubjectTerms ACOUSTICS
CALCULATING
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
COMPUTING
COUNTING
MUSICAL INSTRUMENTS
PHYSICS
SPEECH ANALYSIS OR SYNTHESIS
SPEECH OR AUDIO CODING OR DECODING
SPEECH OR VOICE PROCESSING
SPEECH RECOGNITION
Title AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR
URI https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20220421&DB=EPODOC&locale=&CC=WO&NR=2022079129A1
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfV1LT8JAEJ4QfN4UNahommh6a6TbB_RATOkDMNISqEq8kN1SEhNTiK3x7zu7pYgXjrvfZtLd7HTm6zwKcE_nVEsMZijUsExFZ-ZCoeh4KDFtxu04MXWT8ALnYWD2X_SnqTGtwGdZCyP6hP6I5oioUTHqey7e16u_j1iuyK3MHtgHTi0f_ajjymt2TAjeQVV2ux1vFLqhIzsO8jY5GBdYy0LrZiNX2uOONO-07712eV3Katuo-CewP0J5aX4KlSStwZFT_nutBofDdci7BgciRzPOcHKth9kZvNvox4VSkXcWhWPJDlxp6EX90J1IyOtKZBD0EJKK1ZNBL7CfxdJobA-Cf-BG1Dnc-V7k9BV83NnmdGZv4fbetAuopss0qYOktSmhC6Iy3gIwQR5naqwda5o-N5rEYq1LaOySdLUbvoZjPuSBFaI2oJp_fSc3aJ9zdiuO9RdOL4rE
link.rule.ids 230,309,786,891,25594,76906
linkProvider European Patent Office
linkToHtml http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfV3dT8IwEL8Q_MA3RY0fqEs0e1uE7gN4IGZswKasIzCV8ELaMRITM4jM-O97LR_iC6_9NZe26fXu195dAR7YhOmJyU2NmXVLM7g11Rg6HlrMynEtTizDIiLBOaCW92o8D81hDj7XuTCyTuiPLI6IGhWjvmfyvJ7_XWK5MrZy8cg_sGn21I4arrpix4TgHqyobrPR6oVu6KiOg7xNpf0lVq2jdbORK-1VRX1e4Ty9NUVeynzbqLSPYb-H8tLsBHJJWoSCs_57rQiHwerJuwgHMkYzXmDjSg8XpzCy0Y8LlWXcWRT2FZu6StCKvNAdKMjr1ohPOwgpy94Dv0Ptruwa9W2f_gM3os7gvt2KHE_D4Y43qzN-D7fnpp9DPp2lyQUoeo0RNiUVLkoAJsjjLJ3XYl03JmaZ1Hn1Ekq7JF3thu-g4EVBd9z16cs1HAlIPLKQSgny2dd3coO2OuO3col_AfT3jbE
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Apatent&rft.title=AUDIO+GENERATOR+AND+METHODS+FOR+GENERATING+AN+AUDIO+SIGNAL+AND+TRAINING+AN+AUDIO+GENERATOR&rft.inventor=KORSE%2C+Srikanth&rft.inventor=B%C3%9CTHE%2C+Jan&rft.inventor=MULTRUS%2C+Markus&rft.inventor=FUCHS%2C+Guillaume&rft.inventor=AHMED%2C+Ahmed+Mustafa+Mahmoud&rft.inventor=PIA%2C+Nicola&rft.inventor=GUPTA%2C+Kishan&rft.date=2022-04-21&rft.externalDBID=A1&rft.externalDocID=WO2022079129A1