Le modèle neutraliste de l'évolution moléculaire : Les horloges moléculaires
Un des résultats centraux de cette théorie est l’existence d’un taux de mutation à peu près constant au cours de l’évolution, ce qui a permis à ses auteurs de parler d’horloge moléculaire. Nous voudrions développer ici succinctement les calculs simples (mais non exempts d’approximations) permettant d’arriver à ce résultat avant de discuter d’un paradoxe soulevé par celui-ci et généralement passé sous silence.
Ces calculs utilisent les substitutions d’acides aminés intervenues dans la famille des globines. Lorsque l’on compare les chaînes de l’hémoglobine de 2 espèces de Vertébrés, on note un certain nombre d’acides aminés différents. Si on appelle daa ce nombre et naa le nombre total d’acides aminés de la séquence comparée, alors le pourcentage d’acides aminés diffé¬rents est Pd = daa /naa. On constate généralement que plus deux espèces sont éloignées au plan phylogénétique plus Pd est grand. Ce pourcentage ne représente pourtant pas le nombre exact de substitutions d’acides aminés apparues à partir de la séquence ancestrale. En effet, cette séquence est inconnue (même les « fossiles vivants » évoluent) et donc on ne peut discerner 2 mutations affectant un site en même position au sein des 2 lignées comparées. Pd sous-estime donc le taux réel de substitution d’acides aminés au cours de l’évolution moléculaire.
Pour estimer plus précisément ce taux de substitution, on considère que celles-ci suivent la loi statistique de Poisson (ou loi des petits nombres) et que la probabilité qu’il survienne 0, 1,2… substitutions pour 1 site suit la série de Poisson :
e-K°°+Kaae-K°°+{Kaa2/ 2!)e-K°°+…
avec Kaa le nombre moyen par site de substitutions d’acides aminés.
Pour calculer Kaa, il suffit de dire que la probabilité qu’un site ne subisse aucune substitution est égale d’une part au premier terme de la série, e-K™, et d’autre part à la proportion d’acides aminés identiques, 1 -Pd. Ceci est vérifié si les taux de substitution sont égaux d’un site à l’autre, ce qui reste à démontrer, ou si ces taux sont très faibles, ce qui est vrai.
On a donc :
e~K-=l-Pd, d’où Kaa =-Logn(l-Pd).
Cette relation est valable à condition que Pd reste inférieur à 50%. Pour des valeurs supérieures, on raffine et on prend :
Kaa =-Logn{-Pd-(IS)Pd2).
On peut alors connaître le taux de substitution d’acides aminés par site et par année, en utilisant les données de la paléontologie, kaa = Kaa/2T, avec T le temps écoulé depuis la divergence des deux lignées. On multiplie le dénominateur par deux (on double le temps) car les substitutions se sont produites dans les deux lignées comparées.
Lorsque l’on applique ces calculs à la chaîne a de l’hémoglobine des Vertébrés, on obtient des valeurs de Kaa à peu près alignées (Figure 2.12) avec un kaa correspondant au coefficient de la droite de régression, kaa = 0,9.1(T9 substitution par site et par année. Comme le souligne Kimura, ces points sont raisonnablement proches d’une droite et différents tests statistiques permettent de montrer qu’en effet ils n’en sont pas significativement éloignés. On constate de plus que les chaînes a et p évoluent à peu près à la même vitesse.
Ce tableau, regroupant différentes données établies chez les Mammifères, montre qu’il existe plusieurs « horloges » qu’on ne peut expliquer qu’à l’aide de la sélection naturelle. Plus la pression de sélection exercée sur une protéine est forte, plus kaa est petit. Par exemple, le taux d’évolution calculé pour la partie fonctionnelle de la molécule d’insuline est de 0,44.10’9 substitution par site d’acide aminé et par an, alors que pour la chaîne C, excisée lors de la maturation de la pro insuline, on obtient un taux de 2,4.10″9 substitution par site et par an. Cependant, pour nombre de ces protéines, l’existence d’une quelconque importance de la structure pour la réalisation de la fonction n’est pas démontrée mais simplement suggérée par le faible taux de substitutions que ces protéines présentent d’une lignée à l’autre. Ceci pourrait bien ressembler à un raisonnement tautologique, ce qui est d’ailleurs exploité comme argument par certains auteurs très critiques vis à vis de l’évolution (Denton 1988).
Ce résultat, généralement bien accepté en ce sens qu’il permet le renforcement d’une discipline naturaliste par un apport de « sciences dures », appelle malgré tout quelques remarques !
En ce qui concerne les séquences comparées, ces analyses ne concernent que les substitutions et négligent tous les autres types de mutations (inversion, délétion, etc.) qualifiées de lacunes. Or ces lacunes sont de plus en plus importantes quand les espèces comparées sont de plus en plus différentes.
En ce qui concerne le résultat lui-même, il est pour le moins paradoxal car on constate une constance du taux de substitution par site et par année et non pas par génération !
Pour expliquer ce qui semble bien être un fait de l’évolution moléculaire, les neutralistes commencent par démontrer qu’une hypothèse sélectionniste est insoutenable. La génétique des populations (version classique) montre que le taux de substitution des allèles mutants avantageux (k ) est proportionnel à Ne la taille efficace de la population (elle-même fonction du nombre de mâles et de femelles reproducteurs), au taux de mutation va et à sa l’avantage sélectif moyen de ces mutants avantageux.
On peut écrire :
k ~ Ne.va.sa
La probabilité pour que ce produit reste constant est effectivement très faible.
L’hypothèse neutraliste est plus satisfaisante mais aussi plus alambiquée. On suppose en fait que les mutations ne sont pas tout à fait neutres mais légèrement délétères. Dans une population d’effectif petit elles sont neutres alors que dans une population d’effectif grand elles sont contre-sélectionnées. Donc le nombre de mutations effectivement neutres diminue quand la taille de la population augmente. Chez les animaux, quand la taille corporelle augmente, le temps de génération augmente également en même temps que l’effectif de la population diminue. Donc la proportion de mutations neutres augmente chez ces animaux compensant ainsi la diminution du nombre de générations par année. L’interdépendance de ces paramètres conduit à une certaine constance des taux de substitutions. Il faut bien reconnaître malgré tout que cette explication n’est pas complètement lumineuse.
Ridley (1997) propose quant à lui une autre explication en partant du constat que l’indépendance de la vitesse d’évolution moléculaire par rapport au temps de génération ne concerne que les protéines et pas l’ADN. En effet, l’étude du rythme des substitutions nucléotidiques montre que celui-ci dépend du temps de génération et qu’il est plus rapide chez les espèces à temps de génération court. Chez ces dernières, le nombre de réplications par unité de temps dans la lignée germinale est supérieur à ce que l’on observe chez les espèces à temps de génération long. La relation entre temps de génération et substitutions nucléotidiques est encore plus net pour les mutations silencieuses. Le tableau ci-dessous présente des estimations de vitesse de telles mutations dans des groupes aux temps de génération contrastés, Primates, Artiodactyles et Rongeurs.