SYSTEM AND METHODS FOR ANALYZING BIOMOLECULAR SEQUENCES
Polymer sequences are assembled into bins. A first number of bins are populated with polymer sequences. The polymer sequences in each bin are assembled into one or more consensus sequences representative of the polymer sequences of the bin. The consensus sequences of the bins are compared to determi...
Saved in:
Main Authors | , , , , , , , , , , , , , |
---|---|
Format | Patent |
Language | English French |
Published |
30.09.1999
|
Edition | 6 |
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | Polymer sequences are assembled into bins. A first number of bins are populated with polymer sequences. The polymer sequences in each bin are assembled into one or more consensus sequences representative of the polymer sequences of the bin. The consensus sequences of the bins are compared to determine relationships, if any, between the consensus sequences of the bins. The bins are modified based on the relationships between the consensus sequences of the bins. The polymer sequences are reassembled in the modified bins to generate one or more modified consensus sequences for each bin representative of the modified bins. In another aspect of the invention, sequence similarities and dissimilarities are analyzed in a set of polymer sequences. Pairwise alignment data is generated for pairs of the polymer sequences. The pairwise alignment data defines regions of similarity between the pairs of polymer sequences with boundaries. Additional boundaries in particular polymer sequences are determined by applying at least one boundary from at least one pairwise alignment for one pair of polymer sequences to at least one other pairwise alignment for another pair of polymer sequences including one of the particular polymer sequences. Additional regions of similarity are generated based on the boundaries.
Des séquences de polymères sont assemblées en réservoirs. Un premier groupe de réservoirs est peuplé de séquences de polymères. Les séquences de polymères dans chaque réservoir sont assemblées en une ou plusieurs séquences consensus représentatives des séquences de polymères du réservoir. Ces séquences consensus sont comparées pour déterminer les relations, le cas échéant, entre les séquences consensus du réservoir. Les réservoirs sont modifiés en fonction des relations entre les séquences consensus. Les séquences de polymères sont réassemblées dans les réservoirs modifiés pour générer une ou plusieurs séquences consensus modifiées pour chaque réservoir représentatif des réservoirs modifiés. Selon un autre aspect de l'invention, les similarités et les disparités des séquences sont analysées dans un ensemble de séquences de polymères. Des données d'alignements par paires sont générées pour les paires de séquences de polymères. Ces données définissent des zones de similarité entre les paires de séquences de polymères avec des frontières. D'autres frontières dans des séquences de polymères particulières sont déterminées en appliquant au moins une frontière à partir d'au moins un alignement par paires pour une paire de séquences de polymères jusqu'à au moins un alignement par paires pour une autre paire de séquences de polymères comprenant une des séquences de polymères particulières. Des zones supplémentaires de similarité sont générées en fonction des frontières. |
---|---|
Bibliography: | Application Number: CA19992325469 |