基于声学模型共享的零资源韩语语音识别
TN912; 精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题.声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别.本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系.在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了 27.33%.同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式....
Saved in:
Published in | 数据采集与处理 Vol. 38; no. 1; pp. 93 - 100 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | Chinese |
Published |
清华大学电子工程系,北京国家信息科学技术研究中心,北京100084%北京海天瑞声科技股份有限公司,北京 100083
2023
|
Subjects | |
Online Access | Get full text |
ISSN | 1004-9037 |
DOI | 10.16337/j.1004-9037.2023.01.007 |
Cover
Abstract | TN912; 精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题.声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别.本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系.在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了 27.33%.同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式. |
---|---|
AbstractList | TN912; 精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题.声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别.本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系.在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了 27.33%.同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式. |
Author | 张卫强 JEON Eunah 黄宇凯 王皓宇 李科 |
AuthorAffiliation | 清华大学电子工程系,北京国家信息科学技术研究中心,北京100084%北京海天瑞声科技股份有限公司,北京 100083 |
AuthorAffiliation_xml | – name: 清华大学电子工程系,北京国家信息科学技术研究中心,北京100084%北京海天瑞声科技股份有限公司,北京 100083 |
Author_FL | ZHANG Weiqiang JEON Eunah LI Ke WANG Haoyu HUANG Yukai |
Author_FL_xml | – sequence: 1 fullname: WANG Haoyu – sequence: 2 fullname: JEON Eunah – sequence: 3 fullname: ZHANG Weiqiang – sequence: 4 fullname: LI Ke – sequence: 5 fullname: HUANG Yukai |
Author_xml | – sequence: 1 fullname: 王皓宇 – sequence: 2 fullname: JEON Eunah – sequence: 3 fullname: 张卫强 – sequence: 4 fullname: 李科 – sequence: 5 fullname: 黄宇凯 |
BookMark | eNo9j01Lw0AQhvdQwVr7Hzx6SZzZTXa7Ryl-QcFL72WTTcRQUnAR8V5FEMSzgqEIopRSRfSQ39Otyb9wRZEZGHhfmIdnjTTyUZ4QsoHgI2dMbGU-AgSeBCZ8CpT5gD6AaJDmf75K2sYcR67kAUfJm4TbolyUN_bx1c6els8T-3BtL94W5fTrblzff1Yf42V5Wxcv1Xzmti7eq_mlvZquk5VUDU3S_rst0t_d6Xf3vd7h3kF3u-cZdDhPUylU4iamIWCS0kChjBhlNNQIEqVkkY4CLcNOqEFzwEhgJw2cTpKqmLXI5u_bM5WnKj8aZKPTk9wBByaLs_N4-OMJTk-wb7aLXhk |
ClassificationCodes | TN912 |
ContentType | Journal Article |
Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
DBID | 2B. 4A8 92I 93N PSX TCJ |
DOI | 10.16337/j.1004-9037.2023.01.007 |
DatabaseName | Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
DocumentTitle_FL | Zero Resource Korean ASR Based on Acoustic Model Sharing |
EndPage | 100 |
ExternalDocumentID | sjcjycl202301007 |
GrantInformation_xml | – fundername: NSFC-通用技术基础研究联合基金重点项目(NSFC; U1836219) funderid: NSFC-通用技术基础研究联合基金重点项目(NSFC; U1836219) |
GroupedDBID | 2B. 4A8 92I 93N ADMLS ALMA_UNASSIGNED_HOLDINGS PSX TCJ |
ID | FETCH-LOGICAL-s1037-d297aeaeac2501ef24a19b32325d1091993bdb4d9585d0d601b718f4337efac3 |
ISSN | 1004-9037 |
IngestDate | Thu May 29 04:00:12 EDT 2025 |
IsPeerReviewed | false |
IsScholarly | true |
Issue | 1 |
Keywords | 语音识别 零资源语音识别 韩语语音识别 |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-s1037-d297aeaeac2501ef24a19b32325d1091993bdb4d9585d0d601b718f4337efac3 |
PageCount | 8 |
ParticipantIDs | wanfang_journals_sjcjycl202301007 |
PublicationCentury | 2000 |
PublicationDate | 2023 |
PublicationDateYYYYMMDD | 2023-01-01 |
PublicationDate_xml | – year: 2023 text: 2023 |
PublicationDecade | 2020 |
PublicationTitle | 数据采集与处理 |
PublicationTitle_FL | Journal of Data Acquisition & Processing |
PublicationYear | 2023 |
Publisher | 清华大学电子工程系,北京国家信息科学技术研究中心,北京100084%北京海天瑞声科技股份有限公司,北京 100083 |
Publisher_xml | – name: 清华大学电子工程系,北京国家信息科学技术研究中心,北京100084%北京海天瑞声科技股份有限公司,北京 100083 |
SSID | ssib023646196 ssib001102757 ssib000459638 ssib001164671 ssib006568634 ssib002264227 ssib036439733 ssib057620134 ssib023167944 ssib051372606 |
Score | 2.3465693 |
Snippet | TN912;... |
SourceID | wanfang |
SourceType | Aggregation Database |
StartPage | 93 |
Title | 基于声学模型共享的零资源韩语语音识别 |
URI | https://d.wanfangdata.com.cn/periodical/sjcjycl202301007 |
Volume | 38 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV3Na9VAEA-lXryIouI3FdxTeTWbzW52j9nXPErBeqnQW8mnUvQJtj3YcxVBEM8KFhFEKaWK6OH9PX21_S-cmSQvafuEKi-EZbI7-5uZJbuzb2fiOHdMkKpEpLpTuDCC_ULwjpFJ0ZFZkhhYMucBpV28t6DmHvjzS3JpYvJJ69TS-loyk26MjSv5H6sCDeyKUbL_YNkRUyBAGewLd7Aw3E9lYxZJZnrMhizy8a4jpISCWZcKsyxULFIs1CzkVDli2mJBS2Z51SoESsAMNPdZZJixzEIrzawkisI6xqVHPRYafBT2kHlToEdWVBStqAso2_baF1kZSdgU04AtwoY6wKvsFxsCJF0L4hOAAHvXox1EJOhSDkJtBNUFymhKnY_uL0xH6_1mrxur2C4LSS_Yt60ozT4FwZulrgMWAmve3hEpw5Vp9JJKNKqw5DUCC40arQMDH1VYUgx1bIGxJPa6wg86sxaGObHqMhPUNiEKmmK2ks6WuumRJUF_HDVdIz1ibR3i8RWUplvXcREMFkzNR5PdJDLUYiwA_EsG1O_JcdgUimaDWnBD8nIcX80AHGEbQQKpPcLvo9QoGoHUhuxvKi2BYkvxdQ9xjsM2TeBEa0bFk07GLTP71FOu0CdeLeX8WX4ts1qJccphe3KSV4LyRKzMjHjP4DCg9LvlJ5SPpVBfXUlXnqePsZLLKffEGS8IuGztwFTezZHpCFbGXtA6FMAxF1_Le8IYdM9rh2krrZpsix4mmWiFneOnGhRvslsKcgYab0tyEXiqOfQgYZ3iVudiakGrs4iogbt_kZ-iD_tF3H_YWigvnnfOVR7uVFi-ri44ExuPLjpquDXYG7wZfvo23Pm8_-Xj8MPr4Yvve4Pt3-82D9__Ovi5uT94e7j19WB3B67DrR8Huy-Hr7YvOYu9aLE716k-2dJZpYDjzDNBnMMvBdeK54Xnx9wkAtw2mWEKYvCGkizxMyO1zNxMuTyBxXHhgzx5EafisjPZf9rPrzhTGlQZK9BAbLQvfAWOTAKuhu_GIgc98avO7UrM5eqNvLp83M7XTlHnunMWy-Wu6g1ncu3Zen4T_Iy15BaNjj_3F8xs |
linkProvider | Directory of Open Access Journals |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E5%A3%B0%E5%AD%A6%E6%A8%A1%E5%9E%8B%E5%85%B1%E4%BA%AB%E7%9A%84%E9%9B%B6%E8%B5%84%E6%BA%90%E9%9F%A9%E8%AF%AD%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%AB&rft.jtitle=%E6%95%B0%E6%8D%AE%E9%87%87%E9%9B%86%E4%B8%8E%E5%A4%84%E7%90%86&rft.au=%E7%8E%8B%E7%9A%93%E5%AE%87&rft.au=JEON+Eunah&rft.au=%E5%BC%A0%E5%8D%AB%E5%BC%BA&rft.au=%E6%9D%8E%E7%A7%91&rft.date=2023&rft.pub=%E6%B8%85%E5%8D%8E%E5%A4%A7%E5%AD%A6%E7%94%B5%E5%AD%90%E5%B7%A5%E7%A8%8B%E7%B3%BB%2C%E5%8C%97%E4%BA%AC%E5%9B%BD%E5%AE%B6%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6%E6%8A%80%E6%9C%AF%E7%A0%94%E7%A9%B6%E4%B8%AD%E5%BF%83%2C%E5%8C%97%E4%BA%AC100084%25%E5%8C%97%E4%BA%AC%E6%B5%B7%E5%A4%A9%E7%91%9E%E5%A3%B0%E7%A7%91%E6%8A%80%E8%82%A1%E4%BB%BD%E6%9C%89%E9%99%90%E5%85%AC%E5%8F%B8%2C%E5%8C%97%E4%BA%AC+100083&rft.issn=1004-9037&rft.volume=38&rft.issue=1&rft.spage=93&rft.epage=100&rft_id=info:doi/10.16337%2Fj.1004-9037.2023.01.007&rft.externalDocID=sjcjycl202301007 |
thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fsjcjycl%2Fsjcjycl.jpg |