TTS 음성에서 말속도, 메시지 유형 및 청취자 연령이 음성 호감도에 미치는 영향

목적: 본 연구는 TTS 말속도, 메시지 유형, 청자 연령이 음성 호감도에 미치는 영향을 분석하였다. 방법: TTS 음성 목록 중 두 개의 여성 화자(20~30대) 음성 선정한 뒤, 세 가지 말속도(느림, 보통, 빠름)와 두 가지 메시지 유형(이성적, 감성적)을 조합하여 총 12개의 음성을 생성하였다. 총 40명의 참가자가 연구에 참여하였으며, 청년층(n=20), 노년층(n=20)으로 구분되었다. 각 음성에 대한 호감도 평가 후, 연령대별 음성 호감도 차이를 분석하였다. 결과: TTS 말속도는 음성 호감도에 유의미한 영향을 미쳐 보...

Full description

Saved in:
Bibliographic Details
Published in언어치료연구, 34(2) pp. 97 - 106
Main Authors 하나경, 진유나, 박윤지, 심은진, 이영미
Format Journal Article
LanguageKorean
Published 한국언어치료학회 01.04.2025
Subjects
Online AccessGet full text
ISSN1226-587X
2671-7158
DOI10.15724/jslhd.2025.34.2.097

Cover

More Information
Summary:목적: 본 연구는 TTS 말속도, 메시지 유형, 청자 연령이 음성 호감도에 미치는 영향을 분석하였다. 방법: TTS 음성 목록 중 두 개의 여성 화자(20~30대) 음성 선정한 뒤, 세 가지 말속도(느림, 보통, 빠름)와 두 가지 메시지 유형(이성적, 감성적)을 조합하여 총 12개의 음성을 생성하였다. 총 40명의 참가자가 연구에 참여하였으며, 청년층(n=20), 노년층(n=20)으로 구분되었다. 각 음성에 대한 호감도 평가 후, 연령대별 음성 호감도 차이를 분석하였다. 결과: TTS 말속도는 음성 호감도에 유의미한 영향을 미쳐 보통 속도보다 느리거나 빠를 때 더 높은 호감도를 보였다. 감성적 메시지는 이성적 메시지보다, 노년층은 청년층보다 호감도가 높았다. 말속도와 메시지 유형 간 상호작용에서 감성적 메시지는 느린 속도에서, 이성적 메시지는 빠른 속도에서 더 높은 호감도를 보였으며, 삼차 상호작용은 유의하지 않았다. 결론: 본 연구는 TTS 음성의 말속도가 음성 호감도에 미치는 영향을 분석하고, 메시지 유형 및 청자의 연령대와의 상호작용 효과를 검증하였다. 연구 결과, TTS 말속도는 음성 호감도에 유의미한 영향을 미쳤으며, 느린 속도와 보통 속도, 보통 속도와 빠른 속도 간 유의미한 차이가 관찰되었다. 감성적 메시지는 느린 속도에서 가장 높은 호감도를 보였고, 이성적 메시지는 빠른 속도에서 가장 긍정적인 평가를 받았다. 또한, 노년층은 청년층보다 전반적으로 더 높은 호감도를 나타냈다. 이러한 결과는 TTS 음성 설계에서 메시지 유형과 말속도를 맥락에 맞게 조정함으로써 사용자 경험을 최적화할 수 있는 가능성을 제시하며, 보완대체의사소통(AAC) 시스템과 같은 응용 분야에서의 활용을 시사한다. Purpose: This study investigated the effects of TTS (text-to-speech) speech rate, message type, and listener age on the perception of voice attractiveness. Methods: Two TTS-generated female voices (speakers in their 20~30s) were manipulated to produce speech at three different rates (slow, moderate, fast) and deliver two distinctive message types (emotional, rational). A total of 40 participants, comprising younger adults (n=20) and older adults (n=20), evaluated the attractiveness of these voices using a 5-point Likert scale. Results: TTS speech rate had a statistically significant effect on voice attractiveness, with slower or faster rates showing higher likability than moderate speeds. Emotional messages were rated more favorably than rational ones, and older adults provided higher overall ratings compared to younger adults. In terms of interaction effects, emotional messages were rated higher at slower rates, while rational messages were rated higher at faster rates. Conclusions: TTS speech rate was found to be a critical factor in voice attractiveness. Differences emerged between slow and normal speeds, as well as between normal and fast speeds. Emotional messages were most appealing at a slow rate, whereas rational messages were most favorably received at a fast rate. Older adults, overall, provided higher ratings than younger adults. These findings suggest that tailoring TTS speech rate and message type to specific contexts can enhance user experience, offering practical insights for AAC systems and related applications. KCI Citation Count: 0
Bibliography:http://jslhd.org/
ISSN:1226-587X
2671-7158
DOI:10.15724/jslhd.2025.34.2.097