Action ATGC

previous up next contents
Précédent : Présentation générale et objectifs Remonter : Action ATGC, Action Transversale Génome Suivant : Grands domaines d'application


Fondements scientifiques

  La similarité entre des séquences recouvre de multiples significations. Ainsi, des séquences peuvent être similaires: (i) au sens de leur composition globale, (ii) de leur distance phylogénétique, (iii) de leur alignement.

De nombreux algorithmes traitent ces problématiques différentes. On se référera à [BBE86,Bla85] pour le point 1 et à [Sob88] pour le point 2. L'action ATGC s'est focalisée sur le troisième point.

L'alignement est la mise en correspondance de lettres entre deux (alignement simple) ou plusieurs séquences (alignement multiple). Il s'agit d'obtenir un alignement simple ou multiple qui soit optimum pour ces séquences. Un score reflète la qualité d'un alignement. Il peut, par exemple, être égal au nombre de lettres identiques observées en faisant correspondre les deux segments.

De façon plus générale, à partir de l'analyse de l'évolution, on définit des matrices caractérisant la tendance pour chaque lettre à se substituer à une autre, à être supprimée ou insérée dans une séquence. L'algorithme de base est celui de Needleman & Wunsch ([NW70]), qui consiste à maximiser le score et qui est fondé sur la programmation dynamique.

Un alignement peut être global: il qualifie alors la ``divergence'' des séquences. Il peut être local, traduisant alors la modularité des séquences.

Généralement, les méthodes de comparaison de séquences peuvent être classées en trois catégories:



previous up next contents Précédent : Présentation générale et objectifs Remonter : Action ATGC, Action Transversale Génome Suivant : Grands domaines d'application