DEVICE AND METHOD FOR PARALLEL CORPUS FILTERING BASED ON SEMANTIC SIMILARITY

의미적 유사도에 기반한 병렬 말뭉치 정제 방법 및 장치가 개시된다. 상기 병렬 말뭉치 정제 방법은 적어도 프로세서를 포함하는 컴퓨팅 장치에 의해 수행되는 병렬 말뭉치 정제 방법으로서, 각각이 소스 문장과 타겟 문장을 포함하는 문장쌍들을 포함하는 병렬 말뭉치를 획득하는 단계, 복수의 필터링 기법들 각각에 대하여, 상기 문장쌍들 각각에 대한 스코어를 산출하는 단계, 상기 복수의 필터링 기법들 중에서 어느 하나의 필터링 기법을 선택하는 단계, 및 상기 어느 하나의 필털이 기법에 의한 스코어를 기초로 상기 문장쌍들을 샘플링하는 단계를 포함...

Full description

Saved in:
Bibliographic Details
Main Authors LIM HEUI SEOK, MOON HYEONSEOK
Format Patent
LanguageEnglish
Korean
Published 24.10.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:의미적 유사도에 기반한 병렬 말뭉치 정제 방법 및 장치가 개시된다. 상기 병렬 말뭉치 정제 방법은 적어도 프로세서를 포함하는 컴퓨팅 장치에 의해 수행되는 병렬 말뭉치 정제 방법으로서, 각각이 소스 문장과 타겟 문장을 포함하는 문장쌍들을 포함하는 병렬 말뭉치를 획득하는 단계, 복수의 필터링 기법들 각각에 대하여, 상기 문장쌍들 각각에 대한 스코어를 산출하는 단계, 상기 복수의 필터링 기법들 중에서 어느 하나의 필터링 기법을 선택하는 단계, 및 상기 어느 하나의 필털이 기법에 의한 스코어를 기초로 상기 문장쌍들을 샘플링하는 단계를 포함한다.
Bibliography:Application Number: KR20220151593