AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR

There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator (10) may generate an audio signal (16) from an input signal (14) and target data (12) representing the audio signal (16). The target data (12) is derived from text. The audio generator c...

Full description

Saved in:

Bibliographic Details
Main Authors	KORSE, Srikanth, BÜTHE, Jan, MULTRUS, Markus, FUCHS, Guillaume, AHMED, Ahmed Mustafa Mahmoud, PIA, Nicola, GUPTA, Kishan
Format	Patent
Language	English French
Published	21.04.2022
Subjects	ACOUSTICS CALCULATING COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS COMPUTING COUNTING MUSICAL INSTRUMENTS PHYSICS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Online Access	Get full text

Cover

Loading…

Abstract	There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator (10) may generate an audio signal (16) from an input signal (14) and target data (12) representing the audio signal (16). The target data (12) is derived from text. The audio generator comprises: a first processing block (40, 50, 50a-50h), receiving first data (15, 59a) derived from the input signal (14) and outputting first output data (69); a second processing block (45), receiving, as second data, the first output data (69) or data derived from the first output data (69). The first processing block (50) comprises: a conditioning set of learnable layers (71, 72, 73) configured to process the target data (12) to obtain conditioning features parameters (74, 75); and a styling element (77), configured to apply the conditioning feature parameters (74, 75) to the first data (15, 59a) or normalized first data (59, 76'). La divulgation concerne des techniques de génération d'un signal audio et d'entraînement d'un générateur audio. Un générateur audio (10) peut générer un signal audio (16) à partir d'un signal d'entrée (14) et des données cibles (12) représentant le signal audio (16). Les données cibles (12) sont dérivées de texte. Le générateur audio comprend : un premier bloc de traitement (40, 50, 50a-50h), recevant de premières données (15, 59a) dérivées du signal d'entrée (14) et délivrant de premières données de sortie (69) ; un second bloc de traitement (45), recevant, en tant que secondes données, les premières données de sortie (69) ou des données dérivées des premières données de sortie (69). Le premier bloc de traitement (50) comprend : un ensemble de conditionnement de couches pouvant être apprises (71, 72, 73) configuré pour traiter les données cibles (12) pour obtenir des paramètres de caractéristiques de conditionnement (74, 75) ; et un élément de mise en forme (77), configuré pour appliquer les paramètres de caractéristiques de conditionnement (74, 75) aux premières données (15, 59a) ou à de premières données normalisées (59, 76').
AbstractList	There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator (10) may generate an audio signal (16) from an input signal (14) and target data (12) representing the audio signal (16). The target data (12) is derived from text. The audio generator comprises: a first processing block (40, 50, 50a-50h), receiving first data (15, 59a) derived from the input signal (14) and outputting first output data (69); a second processing block (45), receiving, as second data, the first output data (69) or data derived from the first output data (69). The first processing block (50) comprises: a conditioning set of learnable layers (71, 72, 73) configured to process the target data (12) to obtain conditioning features parameters (74, 75); and a styling element (77), configured to apply the conditioning feature parameters (74, 75) to the first data (15, 59a) or normalized first data (59, 76'). La divulgation concerne des techniques de génération d'un signal audio et d'entraînement d'un générateur audio. Un générateur audio (10) peut générer un signal audio (16) à partir d'un signal d'entrée (14) et des données cibles (12) représentant le signal audio (16). Les données cibles (12) sont dérivées de texte. Le générateur audio comprend : un premier bloc de traitement (40, 50, 50a-50h), recevant de premières données (15, 59a) dérivées du signal d'entrée (14) et délivrant de premières données de sortie (69) ; un second bloc de traitement (45), recevant, en tant que secondes données, les premières données de sortie (69) ou des données dérivées des premières données de sortie (69). Le premier bloc de traitement (50) comprend : un ensemble de conditionnement de couches pouvant être apprises (71, 72, 73) configuré pour traiter les données cibles (12) pour obtenir des paramètres de caractéristiques de conditionnement (74, 75) ; et un élément de mise en forme (77), configuré pour appliquer les paramètres de caractéristiques de conditionnement (74, 75) aux premières données (15, 59a) ou à de premières données normalisées (59, 76').
Author	BÜTHE, Jan FUCHS, Guillaume AHMED, Ahmed Mustafa Mahmoud GUPTA, Kishan KORSE, Srikanth PIA, Nicola MULTRUS, Markus
Author_xml	– fullname: KORSE, Srikanth – fullname: BÜTHE, Jan – fullname: MULTRUS, Markus – fullname: FUCHS, Guillaume – fullname: AHMED, Ahmed Mustafa Mahmoud – fullname: PIA, Nicola – fullname: GUPTA, Kishan
BookMark	eNrjYmDJy89L5WSIcgx18fRXcHf1cw1yDPEPUnD0c1HwdQ3x8HcJVnAD8qEynn7uQCkFiOpgT3c_Rx-w0pAgR08_FEm4UTwMrGmJOcWpvFCam0HZzTXE2UM3tSA_PrW4IDE5NS-1JD7c38jAyMjA3NLQyNLR0Jg4VQAbWjP0
ContentType	Patent
DBID	EVB
DatabaseName	esp@cenet
DatabaseTitleList
Database_xml	– sequence: 1 dbid: EVB name: esp@cenet url: http://worldwide.espacenet.com/singleLineSearch?locale=en_EP sourceTypes: Open Access Repository
DeliveryMethod	fulltext_linktorsrc
Discipline	Medicine Chemistry Sciences Physics
DocumentTitleAlternate	GÉNÉRATEUR AUDIO ET PROCÉDÉS DE GÉNÉRATION D'UN SIGNAL AUDIO ET D'ENTRAÎNEMENT D'UN GÉNÉRATEUR AUDIO
ExternalDocumentID	WO2022079129A1
GroupedDBID	EVB
ID	FETCH-epo_espacenet_WO2022079129A13
IEDL.DBID	EVB
IngestDate	Fri Jul 19 13:15:14 EDT 2024
IsOpenAccess	true
IsPeerReviewed	false
IsScholarly	false
Language	English French
LinkModel	DirectLink
MergedId	FETCHMERGED-epo_espacenet_WO2022079129A13
Notes	Application Number: WO2021EP78371
OpenAccessLink	https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20220421&DB=EPODOC&CC=WO&NR=2022079129A1
ParticipantIDs	epo_espacenet_WO2022079129A1
PublicationCentury	2000
PublicationDate	20220421
PublicationDateYYYYMMDD	2022-04-21
PublicationDate_xml	– month: 04 year: 2022 text: 20220421 day: 21
PublicationDecade	2020
PublicationYear	2022
RelatedCompanies	FRAUNHOFER-GESELLSCHAFT ZUR FÖRDERUNG DER ANGEWANDTEN FORSCHUNG E.V
RelatedCompanies_xml	– name: FRAUNHOFER-GESELLSCHAFT ZUR FÖRDERUNG DER ANGEWANDTEN FORSCHUNG E.V
Score	3.3848472
Snippet	There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator (10) may generate an audio signal (16) from...
SourceID	epo
SourceType	Open Access Repository
SubjectTerms	ACOUSTICS CALCULATING COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS COMPUTING COUNTING MUSICAL INSTRUMENTS PHYSICS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Title	AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR
URI	https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20220421&DB=EPODOC&locale=&CC=WO&NR=2022079129A1
hasFullText	1
inHoldings	1
isFullTextHit
isPrint
link	http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfV1LT8JAEJ4QfN4UNahommh6a6TbB_RATOkDMNISqEq8kN1SEhNTiK3x7zu7pYgXjrvfZtLd7HTm6zwKcE_nVEsMZijUsExFZ-ZCoeh4KDFtxu04MXWT8ALnYWD2X_SnqTGtwGdZCyP6hP6I5oioUTHqey7e16u_j1iuyK3MHtgHTi0f_ajjymt2TAjeQVV2ux1vFLqhIzsO8jY5GBdYy0LrZiNX2uOONO-07712eV3Katuo-CewP0J5aX4KlSStwZFT_nutBofDdci7BgciRzPOcHKth9kZvNvox4VSkXcWhWPJDlxp6EX90J1IyOtKZBD0EJKK1ZNBL7CfxdJobA-Cf-BG1Dnc-V7k9BV83NnmdGZv4fbetAuopss0qYOktSmhC6Iy3gIwQR5naqwda5o-N5rEYq1LaOySdLUbvoZjPuSBFaI2oJp_fSc3aJ9zdiuO9RdOL4rE
link.rule.ids	230,309,786,891,25594,76906
linkProvider	European Patent Office
linkToHtml	http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfV3dT8IwEL8Q_MA3RY0fqEs0e1uE7gN4IGZswKasIzCV8ELaMRITM4jM-O97LR_iC6_9NZe26fXu195dAR7YhOmJyU2NmXVLM7g11Rg6HlrMynEtTizDIiLBOaCW92o8D81hDj7XuTCyTuiPLI6IGhWjvmfyvJ7_XWK5MrZy8cg_sGn21I4arrpix4TgHqyobrPR6oVu6KiOg7xNpf0lVq2jdbORK-1VRX1e4Ty9NUVeynzbqLSPYb-H8tLsBHJJWoSCs_57rQiHwerJuwgHMkYzXmDjSg8XpzCy0Y8LlWXcWRT2FZu6StCKvNAdKMjr1ohPOwgpy94Dv0Ptruwa9W2f_gM3os7gvt2KHE_D4Y43qzN-D7fnpp9DPp2lyQUoeo0RNiUVLkoAJsjjLJ3XYl03JmaZ1Hn1Ekq7JF3thu-g4EVBd9z16cs1HAlIPLKQSgny2dd3coO2OuO3col_AfT3jbE
openUrl	ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Apatent&rft.title=AUDIO+GENERATOR+AND+METHODS+FOR+GENERATING+AN+AUDIO+SIGNAL+AND+TRAINING+AN+AUDIO+GENERATOR&rft.inventor=KORSE%2C+Srikanth&rft.inventor=B%C3%9CTHE%2C+Jan&rft.inventor=MULTRUS%2C+Markus&rft.inventor=FUCHS%2C+Guillaume&rft.inventor=AHMED%2C+Ahmed+Mustafa+Mahmoud&rft.inventor=PIA%2C+Nicola&rft.inventor=GUPTA%2C+Kishan&rft.date=2022-04-21&rft.externalDBID=A1&rft.externalDocID=WO2022079129A1