SYSTEMS AND METHODS FOR SPELL CORRECTION OF NON-ROMAN CHARACTERS AND WORDS

Systems and methods to process and correct spelling errors for non-Roman based words such as in Chinese, Japanese, and Korean languages using a rule-based classifier and a hidden Markov model are disclosed. The method generally includes converting an input entry in a first language such as Chinese t...

Full description

Saved in:
Bibliographic Details
Main Authors ZHU, HONGJUN, CHAN, CHIU-KI, ZHU, HUICAN, HUANG, WEI-HWA, WU, JUN
Format Patent
LanguageEnglish
French
Published 05.01.2006
Subjects
Online AccessGet full text

Cover

Loading…
Abstract Systems and methods to process and correct spelling errors for non-Roman based words such as in Chinese, Japanese, and Korean languages using a rule-based classifier and a hidden Markov model are disclosed. The method generally includes converting an input entry in a first language such as Chinese to at least one intermediate entry in an intermediate representation, such as pinyin, different from the first language, converting the intermediate entry to at least one possible alternative spelling or form of the input in the first language, and determining that the input entry is either a correct or questionable input entry when a match between the input entry and all possible alternative spellings to the input entry is or is not located, respectively. The questionable input entry may be classified using, for example, a transformation rule based classifier based on transformation rules generated by a transformation rules generator. L'invention concerne des systèmes et des procédés pour le traitement et la correction d'erreurs d'orthographe pour mots en caractères non romains du type chinois, japonais et coréens en utilisant un classificateur à base de règles et un modèle de Markov caché. Le procédé consiste en règle générale à convertir une saisie d'origine en première langue du type chinois vers au moins une saisie intermédiaire en représentation intermédiaire, du type pinyin, différant de la première langue, puis à convertir la saisie intermédiaire vers au moins une orthographe ou forme alternative possible de la saisie d'origine dans la première langue, et à déterminer que la saisie est correcte ou douteuse lorsqu'une correspondance entre la saisie d'origine et toutes les orthographes alternatives possibles de la saisie d'origine est ou n'est pas localisée, respectivement. La saisie d'origine douteuse peut être classifiée,par exemple, au moyen d'un classificateur à base de règles de transformation reposant sur des règles de transformation produites par un générateur de règles de transformation.
AbstractList Systems and methods to process and correct spelling errors for non-Roman based words such as in Chinese, Japanese, and Korean languages using a rule-based classifier and a hidden Markov model are disclosed. The method generally includes converting an input entry in a first language such as Chinese to at least one intermediate entry in an intermediate representation, such as pinyin, different from the first language, converting the intermediate entry to at least one possible alternative spelling or form of the input in the first language, and determining that the input entry is either a correct or questionable input entry when a match between the input entry and all possible alternative spellings to the input entry is or is not located, respectively. The questionable input entry may be classified using, for example, a transformation rule based classifier based on transformation rules generated by a transformation rules generator. L'invention concerne des systèmes et des procédés pour le traitement et la correction d'erreurs d'orthographe pour mots en caractères non romains du type chinois, japonais et coréens en utilisant un classificateur à base de règles et un modèle de Markov caché. Le procédé consiste en règle générale à convertir une saisie d'origine en première langue du type chinois vers au moins une saisie intermédiaire en représentation intermédiaire, du type pinyin, différant de la première langue, puis à convertir la saisie intermédiaire vers au moins une orthographe ou forme alternative possible de la saisie d'origine dans la première langue, et à déterminer que la saisie est correcte ou douteuse lorsqu'une correspondance entre la saisie d'origine et toutes les orthographes alternatives possibles de la saisie d'origine est ou n'est pas localisée, respectivement. La saisie d'origine douteuse peut être classifiée,par exemple, au moyen d'un classificateur à base de règles de transformation reposant sur des règles de transformation produites par un générateur de règles de transformation.
Author ZHU, HUICAN
CHAN, CHIU-KI
WU, JUN
ZHU, HONGJUN
HUANG, WEI-HWA
Author_xml – fullname: ZHU, HONGJUN
– fullname: CHAN, CHIU-KI
– fullname: ZHU, HUICAN
– fullname: HUANG, WEI-HWA
– fullname: WU, JUN
BookMark eNqNy70KwjAUQOEMOvj3DhecCzGC4BiSG6I0uXITKE6lSJwkLdT3x0EfwOks31mLRR1rWYlruqeMIYGOFgJmTzaBI4Z0w7YFQ8xo8oUikINIsWEKOoLxmrXJyN-xI7ZpK5bP4TWX3a8bsXeYjW_KNPZlnoZHqeXdd6SkPEmp1OGs1fE_9QE_Yy_3
ContentType Patent
DBID EVB
DatabaseName esp@cenet
DatabaseTitleList
Database_xml – sequence: 1
  dbid: EVB
  name: esp@cenet
  url: http://worldwide.espacenet.com/singleLineSearch?locale=en_EP
  sourceTypes: Open Access Repository
DeliveryMethod fulltext_linktorsrc
Discipline Medicine
Chemistry
Sciences
Physics
DocumentTitleAlternate SYSTEMES ET PROCEDES POUR LA CORRECTION ORTHOGRAPHIQUE DE CARACTERES ET DE MOTS NON ROMAINS
ExternalDocumentID WO2006002219A2
GroupedDBID EVB
ID FETCH-epo_espacenet_WO2006002219A23
IEDL.DBID EVB
IngestDate Fri Jul 19 16:05:53 EDT 2024
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Language English
French
LinkModel DirectLink
MergedId FETCHMERGED-epo_espacenet_WO2006002219A23
Notes Application Number: WO2005US22027
OpenAccessLink https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20060105&DB=EPODOC&CC=WO&NR=2006002219A2
ParticipantIDs epo_espacenet_WO2006002219A2
PublicationCentury 2000
PublicationDate 20060105
PublicationDateYYYYMMDD 2006-01-05
PublicationDate_xml – month: 01
  year: 2006
  text: 20060105
  day: 05
PublicationDecade 2000
PublicationYear 2006
RelatedCompanies ZHU, HUICAN
CHAN, CHIU-KI
WU, JUN
ZHU, HONGJUN
HUANG, WEI-HWA
GOOGLE INC
RelatedCompanies_xml – name: GOOGLE INC
– name: CHAN, CHIU-KI
– name: HUANG, WEI-HWA
– name: ZHU, HONGJUN
– name: ZHU, HUICAN
– name: WU, JUN
Score 2.635578
Snippet Systems and methods to process and correct spelling errors for non-Roman based words such as in Chinese, Japanese, and Korean languages using a rule-based...
SourceID epo
SourceType Open Access Repository
SubjectTerms CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
Title SYSTEMS AND METHODS FOR SPELL CORRECTION OF NON-ROMAN CHARACTERS AND WORDS
URI https://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20060105&DB=EPODOC&locale=&CC=WO&NR=2006002219A2
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfR1da8Iw8BD3-ba5jX24EdjoW5l21eiDjJqmFLGNtN10T2JjhMGoMjv293eNH_PJt3AhR3Jwn7kPgCdqTy1KZ20ztdOaaae0abamk5Y5U7JVdCec0VpRKByETf_N7o0aoxJ8bWphdJ_QX90cETlKIr_nWl4v_oNYrs6tXD6nnwiav3pJxzW23nEx8NFwux0-EK5gBmPotxlhtNpDfVVvOyiwD9CQpgU_8PduUZey2FUq3hkcDhBflp9DSWUVOGGb2WsVOA7WX94VONI5mnKJwDUfLi-gF3_ECQ9i4oQuCXjiCzcm6M-ReMD7fcJEFHGdHUKER0KUlpEInJAw34kchgbs6uAQHcD4Eh49njDfxOuNt9QYD8XuW16uoJzNM3UNpNmuW1TZUqpaalM1mVgSVRSuZNFUsG7dQHUfptv923dwuo0-NKpQzr9_1D3q4zx90GT8AzBmhqU
link.rule.ids 230,309,783,888,25576,76876
linkProvider European Patent Office
linkToHtml http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwfR3LTsJAcELwgTdFjQ_UTTS9NUItLByIKdttKvZB2ip4InRZEhNTiK3x952Wh5y4bWazk91J5rnzAHig-lSjdNZRYz2uq3pMW2p7OmmrMynaeXfCGa3nhcKu17Lf9P6oOSrB17oWpugT-ls0R0SOEsjvWSGvF_9BLLPIrUwf408EzZ-tqGsqG-84H_iomL0uH_imzxTG0G9TvGC5h_qq0TFQYO-hkU1zfuDvvbwuZbGtVKxj2B8gviQ7gZJMqlBh69lrVTh0V1_eVTgocjRFisAVH6an0A8_woi7ITE8k7g8sn0zJOjPkXDAHYcwPwh4kR1CfIt4KC0D3zU8wmwjMBgasMuDQ3QAwzO4t3jEbBWvN95QYzz0t9_ydA7lZJ7ICyCtTkOjUhdC1mOdyslEE6iicCXypoIN7RJquzBd7d6-g4oduc7YefFer-FoE4lo1qCcff_IG9TNWXxbkPQPraGJmA
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Apatent&rft.title=SYSTEMS+AND+METHODS+FOR+SPELL+CORRECTION+OF+NON-ROMAN+CHARACTERS+AND+WORDS&rft.inventor=ZHU%2C+HONGJUN&rft.inventor=CHAN%2C+CHIU-KI&rft.inventor=ZHU%2C+HUICAN&rft.inventor=HUANG%2C+WEI-HWA&rft.inventor=WU%2C+JUN&rft.date=2006-01-05&rft.externalDBID=A2&rft.externalDocID=WO2006002219A2