Il s'agit de comparer des séquences de gènes et/ou de protéines convenablement choisis chez différents organismes, et, par le résultat de la comparaison, d'en déduire l'arbre phylogénétique le plus vraisemblable entre les organismes étudiés (donc ici plus question de fossiles ...). Les différences de séquences entre les gènes ou les protéines à comparer pourront aussi se comporter pour l'étude choisie comme "horloges moléculaires" qui marqueront le temps qui s'est écoulé depuis la version ancestrale commune et les différents noeuds de l'arbre évolutif construit. L'auteur de ces lignes n'est pas vraiment capable d'expliquer en quelques lignes les études de phylogénie moléculaire et ce n'est pas le propos de cet exposé, mais il faut bien comprendre que les gènes ou les protéines choisis pour les études de phylogénie moléculaire déterminent la qualité et la vraisemblance des arbres phylogéniques construits et des . échelles de temps éventuellement proposées.
Pour parler simple, disons qu'en phylogénie moléculaire tout se passe
un peu comme si on ne pouvait disposer que de chronomètres dissociés : on a un chronomètre
qui compte les secondes de 0 à 60 mais pas au delà, un chronomètre qui compte les minutes de
0 à 60 mais pas au delà, un chronomètre qui compte les heures de 0 à 24 mais pas au delà.
Il faut alors choisir son chronomètre en fonction des écarts à mesurer !
Ainsi la séquence du cytochrome C permet de générer une horloge pertinente pour étudier
la phylogenèses des mammifères mais ne permet pas d'étudier les branches plus générales des grands phylums animaux.
Il faudra alors étudier par exemple les séquences des histones ... L'étude des séquences des gènes des ARN ribosomiaux (en particulier le 16-18S) permet d'étudier "ensemble" eucaryotes et bactéries...
Les études de phylogenèse moléculaires se sont montrées très pertinentes appliquées aux animaux (on dispose de données paléontologiques de validation bien pratiques). De nombreux arguments montrent leur pertinence lorsqu'elles sont convenablement appliquées aux bactéries (voir aussi la très importante note 3 sur le problème lié aux transferts latéraux de gènes en fin de paragraphe).
Parmi toutes les séquences nucléiques possibles, les gènes ARNr (les ARN ribosomiques, ARN de
structure des ribosomes, obtenus après transcription de gènes ribosomiaux mais non traduits) sont
devenus des index phylogénétiques de choix en bactériologie. En pratique, c'est l'ARNr 16S qui s'est imposé pour les études phylogénétiques de bactériologie . En effet, de bonne longueur, il réunit des propriétés assez idéales
pour les études phylogénétiques :
- présence universelle ;
- fonction conservée dans tout le vivant et telle que la pression de sélection qui s'exerce sur eux est
peu dépendante des variations du milieu externe ;
- mise en évidence chez les ARNr de différents "spots" avec des séquences d'hétérogénéité très
variables jusqu'à presque nulle. Certaines parties sont d'ailleurs identiques
chez toutes les bactéries et donc utilisables comme sites de complémentarité pour
des amorces universelles de séquences ou d'amplification (bien pratique au laboratoire!).
On peut cependant peut être retenir que les arbres phylogénétiques construits à partir des séquences ARNr 16S ne sont pas pas très résolutifs pour des espèces bactériennes très proches. Pour un niveau très résolutif, il faut faire appel à des séquences de divers gènes de ménage ...
Note 1 : il ne s'agit pas de croire que le seul séquençage des ARNr permet d'établir l'arbre
phylogénétique "vrai" de tout le vivant. Toute analyse phylogénétique moléculaire repose sur des
hypothèses quant à la nature de l'évolution des gènes séquencés et met en oeuvre différents
modèles mathématiques. C'est l'étude comparée des différentes analyses qui permet de proposer des
résultats phylogénétiques vraiment fondés.
Note 2 : la phylogenèses moléculaire utilise les gènes orthologues : sont
orthologues des gènes dont les séquences dérivent d'un même gène ancestral
et ont divergé à la suite des évènements d'évolution.
Note 3 : une des difficultés rencontrée en phylogénie moléculaire chez les bactéries est celle des
transferts latéraux (on dit aussi horizontaux)
de gènes entre organismes. Cette appellation qualifie l'échange de matériel génétique entre
individus appartenant à des espèces différentes parfois très éloignées. Un exemple très simple et illustratif est
celui d'une souche bactérienne devenue résistante à des antibiotiques en acquérant
les gènes de résistance à partir d'une souche d'espèce éloignée phylogénétiquement. Les
transferts latéraux de gènes compliquent ainsi énormément les études de phylogenèse ...
...
surtout si ils sont fréquents ...comme chez les bactéries ... on
obtiendrait alors une "phylogenèses en réseau complexe" et plus vraiment en "arbre" ... mais
il existe des méthodes pour détecter les gènes impliqués dans les transferts latéraux et on peut
construire des phylogenèse classiques pertinentes puisqu'on a établi l'existence de "noyaux de gènes" non impliqués
dans les transferts latéraux ...