METHOD FOR IDENTIFYING SUB-SEQUENCES OF INTEREST IN A SEQUENCE

The present technique provides for the analysis of a data series to identify sequences of interest within the series. The analysis may be used to iteratively update a grammar used to analyze the data series or updated versions of the data series. Furthermore, the technique provides for the calculati...

Full description

Saved in:
Bibliographic Details
Main Authors BUSH, STEPHEN, FRANCIS, TORRES, ANDREW, SOLIZ, EVANS, SCOTT, CHARLES
Format Patent
LanguageEnglish
French
Published 30.03.2006
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present technique provides for the analysis of a data series to identify sequences of interest within the series. The analysis may be used to iteratively update a grammar used to analyze the data series or updated versions of the data series. Furthermore, the technique provides for the calculation of a minimum description length heuristic, such as a symbol compression ratio, for each sub-sequence of the analyzed data sequence. The technique may then compare a selected heuristic value against one or more reference conditions to determine if additional iteration is to be performed. The grammar and the data sequence may be updated between iterations to include a symbol representing a string corresponding to the selected heuristic value based upon a non-termination result of the comparison. Alternatively, the string corresponding to the selected heuristic value may be identified as a sequence of interest based upon a termination result of the comparison. L'invention concerne l'analyse de série de données permettant d'identifier des séquences visées dans telle ou telle série. On peut ainsi actualiser une grammaire utilisée pour l'analyse de série de données ou de versions actualisées de série de données. On décrit aussi le calcul d'une heuristique de longueur de description minimum, du type taux de compression de symboles, pour chaque sous-séquence de la séquence de données analysée. Ensuite, il est possible de comparer une valeur heuristique spécifique à une ou plusieurs conditions de référence pour déterminer si une itération additionnelle est nécessaire. La grammaire et la séquence de données peuvent être actualisées entre itérations pour l'incorporation de symbole représentant une chaîne qui correspond à la valeur spécifique en question, sur la base d'un résultat de non-fin d'opération issu de la comparaison. On peut aussi identifier la chaîne correspondant à cette valeur spécifique, comme séquence visée, sur la base d'un résultat de fin d'opération issu de la comparaison.
Bibliography:Application Number: WO2005US17552