LEARNING DATA GENERATION DEVICE, ASSESSMENT DEVICE, LEARNING DATA GENERATION METHOD, ASSESSMENT METHOD, AND PROGRAM

Provided is a learning data generation device that is able to generate learning data used in learning of an assessment unit for assessing which portion of a document is unnatural. The learning data generation device includes: a main text extraction unit for extracting a portion of a document as a ma...

Full description

Saved in:
Bibliographic Details
Main Authors HIGASHINAKA, Ryuichiro, NARIMATSU, Hiromi, SUGIYAMA, Hiroaki
Format Patent
LanguageEnglish
French
Japanese
Published 25.11.2021
Subjects
Online AccessGet full text

Cover

Loading…
Abstract Provided is a learning data generation device that is able to generate learning data used in learning of an assessment unit for assessing which portion of a document is unnatural. The learning data generation device includes: a main text extraction unit for extracting a portion of a document as a main text; an unnecessary phrase selection unit for selecting, as an unnecessary phrase, one phrase in the document that is not included in the main text; an unnecessary phrase insertion unit for generating a pseudo problem by inserting the unnecessary phrase into the main text; a first learning data generation unit for generating first learning data by setting the unnecessary phrase as an option, and attaching to the pseudo problem a first label signifying that the context of the passage encompassing the option is natural; and a second learning data generation unit for generating second learning data by setting one phrase from the main text as an option, and attaching to the pseudo problem a second label signifying that the context of the passage encompassing the option is unnatural. L'invention concerne un dispositif de génération de données d'apprentissage qui est capable de générer des données d'apprentissage utilisées dans l'apprentissage d'une unité d'évaluation destinée à évaluer quelle portion d'un document est non naturelle. Le dispositif de génération de données d'apprentissage comprend : une unité d'extraction de texte principal destinée à extraire une portion d'un document en tant que texte principal ; une unité de sélection de phrase inutile destinée à sélectionner, en tant que phrase inutile, une phrase dans le document qui n'est pas incluse dans le texte principal ; une unité d'insertion de phrase inutile destinée à générer un pseudo-problème par insertion de la phrase inutile dans le texte principal ; une première unité de génération de données d'apprentissage destinée à générer des premières données d'apprentissage en définissant comme option la phrase inutile, et à attacher au pseudo-problème une première étiquette signifiant que le contexte du passage englobant l'option est naturel ; et une deuxième unité de génération de données d'apprentissage destinée à générer des deuxièmes données d'apprentissage en définissant comme option une phrase issue du texte principal, et à attacher au pseudo-problème une deuxième étiquette signifiant que le contexte du passage englobant l'option est non naturel. 文書のどの部分が不自然であるかを判定するための判定器の学習に用いる学習用データを生成することができる学習用データ生成装置を提供する。文書の一部を本文として抽出する本文抽出部と、文書のうち本文に含まれない一文を不要文として選択する不要文選択部と、本文に不要文を挿入して疑似問題を生成する不要文挿入部と、不要文を選択肢とし、選択肢の前後に存在する文章のつながりが自然であることを意味する第1のラベルを疑似問題に付して、第1の学習用データを生成する第1学習用データ生成部と、本文のうちの一文を選択肢とし、選択肢の前後に存在する文章のつながりが不自然であることを意味する第2のラベルを疑似問題に付して、第2の学習用データを生成する第2学習用データ生成部を含む。
AbstractList Provided is a learning data generation device that is able to generate learning data used in learning of an assessment unit for assessing which portion of a document is unnatural. The learning data generation device includes: a main text extraction unit for extracting a portion of a document as a main text; an unnecessary phrase selection unit for selecting, as an unnecessary phrase, one phrase in the document that is not included in the main text; an unnecessary phrase insertion unit for generating a pseudo problem by inserting the unnecessary phrase into the main text; a first learning data generation unit for generating first learning data by setting the unnecessary phrase as an option, and attaching to the pseudo problem a first label signifying that the context of the passage encompassing the option is natural; and a second learning data generation unit for generating second learning data by setting one phrase from the main text as an option, and attaching to the pseudo problem a second label signifying that the context of the passage encompassing the option is unnatural. L'invention concerne un dispositif de génération de données d'apprentissage qui est capable de générer des données d'apprentissage utilisées dans l'apprentissage d'une unité d'évaluation destinée à évaluer quelle portion d'un document est non naturelle. Le dispositif de génération de données d'apprentissage comprend : une unité d'extraction de texte principal destinée à extraire une portion d'un document en tant que texte principal ; une unité de sélection de phrase inutile destinée à sélectionner, en tant que phrase inutile, une phrase dans le document qui n'est pas incluse dans le texte principal ; une unité d'insertion de phrase inutile destinée à générer un pseudo-problème par insertion de la phrase inutile dans le texte principal ; une première unité de génération de données d'apprentissage destinée à générer des premières données d'apprentissage en définissant comme option la phrase inutile, et à attacher au pseudo-problème une première étiquette signifiant que le contexte du passage englobant l'option est naturel ; et une deuxième unité de génération de données d'apprentissage destinée à générer des deuxièmes données d'apprentissage en définissant comme option une phrase issue du texte principal, et à attacher au pseudo-problème une deuxième étiquette signifiant que le contexte du passage englobant l'option est non naturel. 文書のどの部分が不自然であるかを判定するための判定器の学習に用いる学習用データを生成することができる学習用データ生成装置を提供する。文書の一部を本文として抽出する本文抽出部と、文書のうち本文に含まれない一文を不要文として選択する不要文選択部と、本文に不要文を挿入して疑似問題を生成する不要文挿入部と、不要文を選択肢とし、選択肢の前後に存在する文章のつながりが自然であることを意味する第1のラベルを疑似問題に付して、第1の学習用データを生成する第1学習用データ生成部と、本文のうちの一文を選択肢とし、選択肢の前後に存在する文章のつながりが不自然であることを意味する第2のラベルを疑似問題に付して、第2の学習用データを生成する第2学習用データ生成部を含む。
Author HIGASHINAKA, Ryuichiro
NARIMATSU, Hiromi
SUGIYAMA, Hiroaki
Author_xml – fullname: HIGASHINAKA, Ryuichiro
– fullname: NARIMATSU, Hiromi
– fullname: SUGIYAMA, Hiroaki
BookMark eNrjYmDJy89L5WQo9nF1DPLz9HNXcHEMcVRwd_VzDXIM8fT3U3BxDfN0dtVRcAwOdg0O9nX1C4EL4dTj6xri4e-Cogcu5OeiEBDk7x7k6MvDwJqWmFOcyguluRmU3VxDnD10Uwvy41OLCxKTU_NSS-LD_Y0MjAyNjE0sTQ0cDY2JUwUAj6c61Q
ContentType Patent
DBID EVB
DatabaseName esp@cenet
DatabaseTitleList
Database_xml – sequence: 1
  dbid: EVB
  name: esp@cenet
  url: http://worldwide.espacenet.com/singleLineSearch?locale=en_EP
  sourceTypes: Open Access Repository
DeliveryMethod fulltext_linktorsrc
Discipline Medicine
Chemistry
Sciences
Physics
DocumentTitleAlternate DISPOSITIF DE GÉNÉRATION DE DONNÉES D'APPRENTISSAGE, DISPOSITIF D'ÉVALUATION, PROCÉDÉ DE GÉNÉRATION DE DONNÉES D'APPRENTISSAGE, PROCÉDÉ D'ÉVALUATION, ET PROGRAMME
学習用データ生成装置、判定装置、学習用データ生成方法、判定方法、プログラム
ExternalDocumentID WO2021234950A1
GroupedDBID EVB
ID FETCH-epo_espacenet_WO2021234950A13
IEDL.DBID EVB
IngestDate Fri Jul 19 14:21:49 EDT 2024
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Language English
French
Japanese
LinkModel DirectLink
MergedId FETCHMERGED-epo_espacenet_WO2021234950A13
Notes Application Number: WO2020JP20334
OpenAccessLink https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20211125&DB=EPODOC&CC=WO&NR=2021234950A1
ParticipantIDs epo_espacenet_WO2021234950A1
PublicationCentury 2000
PublicationDate 20211125
PublicationDateYYYYMMDD 2021-11-25
PublicationDate_xml – month: 11
  year: 2021
  text: 20211125
  day: 25
PublicationDecade 2020
PublicationYear 2021
RelatedCompanies NIPPON TELEGRAPH AND TELEPHONE CORPORATION
RelatedCompanies_xml – name: NIPPON TELEGRAPH AND TELEPHONE CORPORATION
Score 3.4948533
Snippet Provided is a learning data generation device that is able to generate learning data used in learning of an assessment unit for assessing which portion of a...
SourceID epo
SourceType Open Access Repository
SubjectTerms CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
Title LEARNING DATA GENERATION DEVICE, ASSESSMENT DEVICE, LEARNING DATA GENERATION METHOD, ASSESSMENT METHOD, AND PROGRAM
URI https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20211125&DB=EPODOC&locale=&CC=WO&NR=2021234950A1
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfV3dS8MwED_G_HzTqfgxpaD0yaJru48-DMmabJ3YdtQ69zbS2IEi27AV_30vcavzwT3mwgWScHf5JXe_AFwJ9PqSR9wQiagbNndSg8uXwgbnViJeWk7NlgXOftDwnuz7UX1UgvdlLYziCf1S5IhoUQLtPVf-ev57iUVVbmV2k7yiaHbXjdtUX6BjRDMYsHXaabNBSENXd13EbXoQqT7TQjRwSxArbeBBuintgQ07si5lvhpUunuwOcDxpvk-lN54BXbc5d9rFdj2F0_eFdhSOZoiQ-HCDrMDyB4YiYJ-0NMoiYn2k38mL5s0yoZ9l11r5FE6SsnUX4j-1fFZ7IX0j04hCqg2iMJeRPxDuOyy2PUMnMe4WLbxc7g6aesIytPZND0Grek0cetMa9ISii7N4WZtgucwLkw-SVL7BKrrRjpd330Gu7Ip6_XMehXK-cdneo6BO08u1Hp_AxbpkhE
link.rule.ids 230,309,783,888,25576,76876
linkProvider European Patent Office
linkToHtml http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfV3dT8IwEL8Q_MA3RY0fqEs0e3JRtvGxB2LGWhjKNjIn8rZ0dSQaA8TN-O97rYD4IK936SVtc3f9tXe_AlxxjPqCR1zjCa9pJrNSjYmXwjpjRsJfmlbVFA3Onl93n8z7UW1UgPdFL4zkCf2S5IjoURz9PZfxevZ7iUVkbWV2k7yiaHrXiVpEnaNjRDOYsFXSbtFBQAJHdRzEbaofSp1uIBq4tRErbeAhuyH8gQ7boi9ltppUOruwOUB7k3wPCm-sDCVn8fdaGba9-ZN3GbZkjSbPUDj3w2wfsj61Q7_ndxViR7byU38mLpsUQoc9h14r9qMIlIKpfyn6d4xHIzcgf8YsRT5RBmHQDW3vAC47NHJcDecRL5ctfg5WJ20cQnEynaRHoDSsBm6dboybXNKlWUyvjvEcxrjOxklqHkNlnaWT9eoLKLmR14_7Pf_hFHaESvTu6bUKFPOPz_QMk3ienMu1_wYetJUE
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Apatent&rft.title=LEARNING+DATA+GENERATION+DEVICE%2C+ASSESSMENT+DEVICE%2C+LEARNING+DATA+GENERATION+METHOD%2C+ASSESSMENT+METHOD%2C+AND+PROGRAM&rft.inventor=HIGASHINAKA%2C+Ryuichiro&rft.inventor=NARIMATSU%2C+Hiromi&rft.inventor=SUGIYAMA%2C+Hiroaki&rft.date=2021-11-25&rft.externalDBID=A1&rft.externalDocID=WO2021234950A1