Taux de consanguinité : le chemin des écoliers

Maintenant que nous avons compris ce que signifie le taux de consanguinité, nous aimerions bien avoir une méthode pour le calculer un peu plus simplement qu’en dessinant des pastilles de couleur et en dénombrant tous les cas. On peut demander à Google, et google va nous répondre : « méthode des chemins ». Le problème, c’est qu’assez souvent, l’explication va se résumer à une formule magique, et éventuellement une justification allusive en quelques phrases. Forts de nos petites pastilles et de notre définition probabiliste du taux de consanguinité, heureusement, nous allons pouvoir comprendre d’où elle sort, et éviter les écueils lors de son application.

La méthode des chemins version « formule magique »

La plupart des résultats donnés par google vous explique simplement qu’il faut trouver les ancêtres communs (ancêtre se trouvant à la fois dans la partie maternelle et la partie paternelle de l’arbre généalogique du rat), et, pour chacun d’entre eux, calculer :

C = \frac{1}{2^{N+P+1}}

où N et P sont les longueurs des chemins allant respectivement de l’ancêtre commun au père du rat, et de l’ancêtre commun à la mère du rat. Puis, faire la somme de tous les C obtenus pour tous les ancêtres communs.

Le souci avec cette formule, c’est que d’une part on ne vous explique pas forcément très bien pourquoi, et que d’autre part, on ne vous explique pas forcément très bien comment compter la longueur des chemins : est-ce qu’on compte le nombre de générations ? le nombre de flèches ? le nombre de rats ? au fait, est-ce qu’on compte l’ancêtre commun ? une fois ou deux fois ? et le rat lui-même, il compte dans le chemin ou pas ? Bref, si on ne comprend pas exactement d’où ça sort, on risque de se tromper. En plus, que faire si l’ancêtre commun apparaît plus de deux fois ?

La méthode des chemins version « comprenons les probabilités »

La méthode des chemins (ou méthode des chaînes de parenté, proposée par un généticien français, Gustave Malécot, en 1948) s’appuie sur le principe de « une chance sur deux de transmission des allèles » que nous avons décortiqué plus haut, mais avec un niveau d’abstraction très légèrement supérieur, c’est-à-dire qu’on va se passer des pastilles de couleur et de l’énumération de tous les cas possibles (c’est quand même un peu laborieux !) et se souvenir qu’à chaque fois qu’on emprunte une flèche dans l’arbre généalogique, on divise par deux les probabilités de transmission d’un allèle.

Sur l’exemple père-fille traité dans notre article précédent, au lieu de dessiner les pastilles, raisonnons en probabilité. Je rappelle l’arbre généalogique de ce croisement père-fille :

arbreperefille

Que faut-il pour obtenir un rejeton M3 qui soit autozygote homozygote, donc qu’il ait deux copies strictement identiques d’un gène donné ? Il ne peut les avoir obtenus que de M1, puisque c’est le seul ancêtre commun. Il faut donc que M3 ait soit deux copies du « premier » allèle de M1 (vert foncé dans notre exemple précédent), soit deux copies du « deuxième » allèle de M1 (vert clair précédemment).

Imaginons d’abord pour le premier (vert foncé) :

  • Il faut que son père lui ait donné, ce qui a une chance sur deux de se produire.
  • Il faut aussi que sa mère lui ait donné. Pour que sa mère lui ait donné, il faut qu’elle l’ait reçu de son propre père, ce qui a une chance sur deux de se produire, et qu’elle lui ait ensuite transmis, ce qui a aussi une chance sur deux de se produire, soit au total : une chance sur quatre que sa mère lui ait donné.
  • Donc pour que son père lui ait donné (une chance sur deux) et qu’en même temps sa mère lui ait donné (une chance sur quatre), nous avons un total de 1/2 fois 1/4 = 1/8. Mais ça ne concerne que le premier cas, celui où M3 est autozygote pour le vert foncé.

On raisonne de même pour le deuxième (vert clair) : M3 a aussi une chance sur huit d’être autozygote pour le vert clair. Autozygote vert foncé et autozygote vert clair sont deux événements indépendants et mutuellement exclusifs (ils ne peuvent pas se produire en même temps) donc on peut additionner : 1/8 + 1/8 = 1/4, M3 a bien une chance sur 4 d’être autozygote pour le gène que nous regardons, donc son taux de consanguinité est bien de 25%.

Qu’avons-nous fait ? Nous avons cherché un chemin (une « chaîne de parenté ») entre l’ancêtre commun et M3, celui qui passe par son père (ce chemin est de longueur 1 puisque nous avons emprunté une flèche pour passer de M1 à M3) ; nous avons cherché le deuxième chemin entre l’ancêtre commun et M3, celui qui passe par sa mère (il est de longueur 2 puisqu’on emprunte exactement deux flèches pour passer de M1 à F2 puis M3) ; nous avons multiplié 1/2 avec lui-même autant de fois que nous empruntions une flèche ; et à la fin, nous avons multiplié par deux pour ne pas oublier que nous avions 2 cas d’autozygotie possible, double vert foncé ou double vert clair :

\frac{1}{2^1} \times \frac{1}{2^2} \times 2 = \frac{1}{4}

Cela commence à ressembler à notre formule magique, mais il y a encore une toute petite différence avec la formule classique, car pour compter nos chemins, nous avons compté aussi M3, ce qui n’est pas la coutume. Tordons un peu nos définitions. Au lieu de prendre le chemin de M1 à M3 d’un côté et de l’autre, je prends le chemin qui va de M1 au père de M3 (il est cette fois de longueur zéro puisque je m’arrête à M1 avant même d’être partie) et le chemin qui va de M1 à la mère de M3 (il est cette fois de longueur 1 puisque je m’arrête à F2). Je regarde donc les probabilités que M1 ait transmis un certain allèle à… lui-même (chemin de longueur 0), d’un côté, et les probabilités que M1 ait transmis ce même allèle à F2 (chemin de longueur 1), mais en faisant cela, j’ai « perdu » deux divisions par deux (la transmission de M1 à M3, et la transmission de F2 à M3), que je compense en les appliquant à la dernière multiplication par 2 (qui devient donc une division par deux, c’est-à-dire une multiplication par 1/2). En remplaçant :

\frac{1}{2^0} \times \frac{1}{2^1} \times \frac{1}{2} = \frac{1}{2^{(0+1+1)}} = \frac{1}{4}

Si j’appelle N la longueur du chemin qui va de l’ancêtre commun au père, et P la longueur du chemin qui va de l’ancêtre commun à la mère, je retrouve bien ma formule magique :

C(M3) = \frac{1}{2^{N+P+1}}

Attention ! si j’oublie de m’arrêter au père et à la mère et que je vais jusqu’à M3, j’ajoute une unité à chaque chemin. Si je veux faire comme ça (j’ai le droit), il faut remultiplier deux fois par deux pour compenser ces deux flèches empruntées en trop (entre M1 et M3 d’un côté, entre F2 et M3 de l’autre), et donc remplacer le +1 par un -1. Si j’appelle maintenant N’ le chemin qui va de l’ancêtre commun à M3 en passant par son père (N’=N+1) et P’ le chemin qui va de l’ancêtre commun à M3 en passant par sa mère (M’=M+1), j’ai maintenant la formule équivalente :

C(M3) = \frac{1}{2^{N'+P'-1}}

Il faut faire attention à la définition des chemins que l’on adopte, et à ne pas compter des rats ou des flèches en trop (problème de piquet et d’intervalle…).

La méthode des chemins c’est ça : c’est compter les probabilités, en évitant d’énumérer tous les cas et de dessiner des pastilles, mais c’est pareil.

Un exemple avec deux vrais chemins

L’exemple père-fille est presque trop simple : l’ancêtre commun est tellement proche, que le même rat joue le rôle d’ancêtre commun et de père, et nous nous retrouvons avec un chemin de longueur 0, que l’on ne peut donc pas visualiser (zéro flèche empruntée, on ne voit rien). Histoire d’être sûrs que nous avons bien compris, prenons un exemple un tout petit peu plus compliqué, dont voici l’arbre généalogique :

Nous avons toujours un seul ancêtre commun, MC0 en vert, mais il est maintenant plus éloigné, et donc distinct du rat jouant le rôle de père (MC2). Nous voulons calculer le taux de consanguinité de MD3 (le rat tout en bas, à la racine de l’arbre). Nous dessinons en bleu le chemin qui va de l’ancêtre commun MC0 au père MC2, et en rouge le chemin qui va de l’ancêtre commun MC0 à à la mère FD2 :

Le chemin bleu est de longueur N=1  et le chemin rouge de longueur P=2. En appliquant la formule, j’obtiens :

C(MD3) = \frac{1}{2^{N+P+1}} = \frac{1}{2^{1+2+1}} = \frac{1}{2^4} = 6.25\%

Si on raisonne en probabilité, on a bien :

  • le long du chemin bleu, une chance sur 2 que MC0 transmette un allèle donné à MC2 ;
  • le long du chemin rouge, une chance sur 2 que MC0 transmette un allèle donné à MC1, puis une chance sur deux que MC1 transmette ce même allèle à FD2, soit au total, 1/2 fois 1/2 = une chance sur 4 que MC0 ait transmis cet allèle à FD2 ;
  • ensuite, une chance sur deux que MC2 transmettre l’allèle à MD3 et une chance sur deux que FD2 transmette l’allèle à MD3, soit une chance sur 4 ;
  • mais on se fichait de l’allèle de départ (MD3 peut être autozygote pour l’un ou l’autre des allèles de MC0), donc on remultiplie le tout par deux.

Sur un autre type de schémas, le schéma de croisement (sorte d’arbre généalogique simplifié où on ne représente qu’une seule fois un seul et même rat, au besoin en utilisant plusieurs flèches partant de lui), on peut également visualiser cela très simplement. Les deux chemins qui vont de l’ancêtre commun (désormais représenté une seule fois puisque c’est un schéma de croisement) à MD3 se rejoignent aux deux bouts et forment une boucle, dessinée en rouge :

Attention, ici, j’ai adopté la définition des chemins qui vont jusqu’à MD3 (ils ne s’arrêtent pas à son père et à sa mère), donc j’ai des longueurs de chemin « prime », et c’est la deuxième formule qu’il faut que j’applique :

C(MD3) = \frac{1}{2^{N'+P'-1}} = \frac{1}{2^{2+3-1}} = \frac{1}{2^4} = 6.25\%

Sur ce schéma, je peux carrément oublier le père et la mère et l’existence de deux chemins, et considérer l’unique boucle qui lie MD3 à lui-même (boucle qui, au passage, n’existerait pas si MD3 n’était pas consanguin). Il me suffit de définir comme Q’ la longueur de la boucle qui va de MD3 à lui-même (par rapport au schéma précédent, Q’=N’+P’), et j’ai directement :

C(MD3) = \frac{1}{2^{Q'-1}} = \frac{1}{2^{5-1}} = \frac{1}{2^4} = 6.25\%

Vous voyez que c’est toujours pareil ! Et comme j’aime la simplicité et que ce -1 m’enquiquine, je choisis une formulation encore différente (mais toujours équivalente). Au lieu de compter les flèches, je vais compter les rats. Ça ne fait que décaler les choses de 1 (une flèche : deux rats, deux flèches : trois rats, trois flèches : quatre rats… des piquets et des intervalles !). Je définis la longueur Q comme le nombre de rats différents que je rencontre en chemin lorsque je vais du père à la mère en passant par l’ancêtre commun. C’est un chemin que je peux noter ici simplement : « MC2 MC0 MC1 FD2 » et que je peux suivre avec mon doigt sur le schéma de croisement. Je rencontre 4 rats sur ce chemin, donc Q=4 (et on a la relation Q’=Q+1, comme pour N’ et N, ou P’ et P). Et j’ai maintenant la formule simplissime  :

C(MD3) = \frac{1}{2^{Q}} = \frac{1}{2^4} = 6.25\%

Nous voilà donc armés pour comprendre et calculer le taux de consanguinité en présence d’un ancêtre commun apparaissant exactement deux fois dans l’arbre généalogique. Maintenant, que faire s’il y a plusieurs ancêtres communs ? et si l’ancêtre commun apparaît plus de deux fois ?

Ancêtres et chemins multiples

Et bien, on va simplement traiter chaque cas élémentaire par la méthode des chemins, et les additionner à la fin. En effet, un rat n’a de place que pour deux allèles, donc s’il est autozygote homozygote, il a deux allèles identiques par descendance qui ne peuvent lui venir que d’un et un seul ancêtre commun parmi tous ces ancêtres communs. Donc on peut calculer séparément les probabilités : probabilité d’être autozygote avec deux copies identiques d’un allèle venant du premier ancêtre commun, la même probabilité mais pour un allèle venant du deuxième ancêtre commun, etc. et les additionner.

Prenons un exemple avec deux ancêtres communs, chacun apparaissant deux fois.

Ne regardez pas trop les âges de reproduction, pas la peine de se donner des sueurs froides pour rien, c’est juste pour l’exemple. Que faut-il pour que MD3 soit autozygote ? Et bien, de deux choses l’une : soit il faut qu’il ait deux copies identiques issues de MC0, soit il faut qu’il ait deux copies identiques issues de FB0. Ces deux cas sont mutuellement exclusifs (MD3 n’a de place que pour deux allèles), donc on va les traiter séparément, et additionner à la fin. On applique la méthode des chemins sur l’ancêtre commun MC0, qui se trouve exactement dans le cas que nous venons de traiter, donc nous savons déjà qu’il apporte un taux de consanguinité de 6.25%. On applique également la méthode des chemins à FB0 (il se trouve que c’est pareil en symétrique donc il n’y a pas à être grand clerc), et on obtient également 6.25%. Le taux de consanguinité total de MD3 est donc 6.25 + 6.25 = 12.5 %.

Les valeurs classiques

Avec ça, vous en avez normalement assez pour retrouver les valeurs les plus connues de la consanguinité. Je vous donne l’abaque, si vous pensez avoir besoin de vérifier que vous avez tout compris jusqu’ici, n’hésitez pas à faire l’exercice !

\begin{tabular}{|l|l|c|}\hline  \bf Type de mariage & \bf Anc\^etres communs & \bf Taux de consanguinit\'e \\\hline\hline  Fr\`ere x s\oe{}ur & Leurs deux parents & 25\% \\\hline  Parent x enfant & Le parent & 25\% \\\hline  Demi-fr\`ere x demi-s\oe{}ur & Le parent commun & 12.5\% \\\hline  Oncle x ni\`ece & Les parents de l'oncle & 12.5\% \\\hline  Grand-parent x petit-enfant & Le grand-parent & 12.5\% \\\hline  Cousins germains & Deux grands-parents & 6.25\% \\\hline  \end{tabular}

Notons que le taux de consanguinité maximal obtenu en un seul mariage est le taux d’une portée entre un frère et sa sœur, ou le taux d’une portée entre un père et sa fille, ou encore le taux d’une portée entre une mère et son fils. Ce taux « maximum en une fois » vaut 25%.

Ancêtre commun apparaissant plus de deux fois

Jusqu’ici, nous avons supposé que chaque ancêtre commun apparaissait exactement deux fois dans l’arbre généalogique du rat dont on est en train de calculer le taux de consanguinité, une fois dans la moitié maternelle de son arbre, et une fois dans la moitié paternelle, et qu’il existait donc un unique chemin pour aller de l’ancêtre commun au père, et un unique chemin pour aller de l’ancêtre commun à la mère. Que faire si le même ancêtre apparaît plus de deux fois ? Et bien nous allons compter tous les chemins qui vont du père à la mère en passant par lui, comme autant de « cas possibles » de transmission de copies identiques à MD3, menant à la consanguinité. Et on fera l’addition de tout à la fin. Attention, il faut que les chemins :

  • passent bien à la fois par le père et par la mère ; si l’ancêtre commun apparaît deux fois du même côté (deux fois du côté maternel par exemple) mais pas dans l’autre moitié (le côté paternel), et bien c’est un ancêtre du rat qui est consanguin, mais pas le rat lui-même ;
  • n’aillent jamais à rebrousse-poil ! On ne passe jamais deux fois sur la même flèche quand on dessine les chemins. Quand on est en train de monter du père vers l’ancêtre commun, on s’arrête quand on rencontre l’ancêtre commun, et on redescend. Bien sûr, les parents de l’ancêtre commun sont aussi des ancêtres communs, mais si on commence à les compter aussi, on va compter plusieurs fois la même chose. Donc les ancêtres communs à prendre en compte dans le calcul sont en fait uniquement ce qu’on appelle « les ancêtres communs les plus proches » (en anglais MRCA pour most recent common ancestor), et quand on les rencontre en chemin, on change de cap pour redescendre vers la mère.

Par exemple si l’ancêtre commun MC0 apparaissait deux fois dans l’arbre maternel et une fois dans l’arbre paternel, nous aurions deux chemins à compter : le chemin entre la première apparition de MC0 à gauche et l’apparition de MC0 à droite, et un chemin entre la deuxième apparition de MC0 à gauche et l’apparition de MC0 à droite, mais il n’y a aucun chemin à compter entre les deux apparitions de MC0 à gauche. Et les parents de MC0 n’interviennent pas dans le calcul, car c’est lui l’ancêtre commun le plus proche de cette branche.

Ancêtre commun consanguin

Pour nous simplifier la vie jusque là, nous avons considéré que l’ancêtre commun n’était pas lui-même consanguin. Évidemment, s’il l’est, ça va augmenter la probabilité qu’il transmette des allèles identiques à ses descendants d’un côté et de l’autre, puisqu’il a déjà une probabilité non nulle de transmettre « automatiquement » un allèle (ce qui se produit s’il est autozygote pour le gène en question). Si le taux de consanguinité de l’ancêtre commun est α, sa probabilité de transmettre un allèle donné n’est plus 1/2, mais (1/2) x (1+α). Donc dans la formule des chemins, avec les notations précédentes (Q est le nombre de rats rencontrés en chemin quand on va du père à la mère en passant par l’ancêtre commun), on va simplement intégrer ce facteur correctif, et la formule devient (pour un chemin unique) :

\text{C } = \frac{1}{2^{Q}} \times (1+\alpha)

Remarquons que cette formule est valable à ses limites : si α=0, l’ancêtre commun n’est pas consanguin et a bien 1 chance sur 2 de transmettre un allèle donné à sa descendance ; si α=1, l’ancêtre commun est homozygote pour tous ses gènes sans exception, donc il a … une chance sur 1 de transmettre un allèle donné à sa descendance (il n’a qu’une seule version de chaque gène, qu’il transmet donc automatiquement).

C’est cet effet, et uniquement cet effet, qui permet d’obtenir des taux de consanguinité supérieurs à 25%. En effet, dans la reproduction sexuée, le croisement unique le plus consanguin que l’on puisse faire, c’est le croisement parent-enfant, ou le croisement frère-sœur. En l’absence d’ancêtres eux-mêmes consanguins, ce taux maximum est de 25%. On ne peut pas faire plus en une seule fois (méfiez-vous des gens qui vous parlent de « portée 100% consanguine » : ils n’ont absolument rien compris à la choucroute). Par contre, si on marie un frère et une sœur déjà eux-mêmes issus du croisement entre deux individus apparentés, le taux de consanguinité des parents va apparaître dans le calcul et lui permettre d’augmenter au-delà de 25%. (Nous verrons dans un futur article un exemple frappant de cet effet, celui de la souche consanguine de laboratoire).

Le taux de consanguinité ne dit pas tout

Le taux de consanguinité est un outil bien pratique pour quantifier la consanguinité d’un individu, mais il ne dit pas tout, car il réduit une situation potentiellement complexe à un seul et unique chiffre. Or, deux situations différentes peuvent donner un taux de consanguinité identique : le taux ne dit pas tout, il est intéressant de savoir de combien d’ancêtres communs il est issu. Comparez ces deux situations :

chemincomparaison

À gauche, il y a deux ancêtres communs, avec un « chemin » pour chacun. Nous avons un taux de 6.25% issu de MC0 et 6.25% issu de FB0, soit un taux de consanguinité total de 12.5%.

À droite, nous avons un seul ancêtre commun, mais il est plus proche puisqu’il est à la fois l’ancêtre commun et le père de la portée, il s’agit d’une portée grand-père x petite-fille. Le « chemin » entre le père et l’ancêtre commun est donc de longueur zéro (et de longueur 2 entre la mère et l’ancêtre commun), ce qui donne donc un taux de consanguinité de 12.5%, mais de 12.5% « en une seule fois », basé entièrement sur le génome de MC0.

À mon avis, il est important de se rendre compte que ces deux situations ne sont pas identiques. À taux de consanguinité égale, plus il y a d’ancêtres communs, et plus ils sont éloignés de la portée à naître en nombre de générations, ce qui veut dire qu’on a d’autant plus de recul sur eux.  Il importe donc de regarder à la fois le taux de consanguinité en lui-même, mais aussi la structure, l’architecture de l’arbre généalogique, et le nombre d’ancêtres communs qui participent à ce taux. On peut exprimer cette structure sous forme de « taux de consanguinité partiel », qui exprime la partie du taux de consanguinité apportée par l’un ou l’autre des ancêtres communs. Par exemple ici, 6.25% pour la consanguinité apportée par MC0 et 6.25% pour la consanguinité apportée par FB0.

Et quand ça se complique ?

La méthode des chemins est un peu plus abstraite que le dénombrement des cas et permet donc de représenter et calculer plus simplement qu’avec nos pastilles de couleur. Elle est facile à mémoriser si on a bien compris le mécanisme de probabilités sous-jacent. Elle est simple et efficace pour des arbres assez simples, et permet de faire face à un grand nombre de situations courantes, avec peu d’ancêtres communs.

Le souci, c’est qu’au bout d’un moment, elle va quand même montrer quelques limites. La méthode des chemins ne vous dit pas comment repérer les ancêtres communs, puis comment repérer l’intégralité des chemins qui passent par lui sans en oublier, ni dans quel ordre le faire. Maintenant, imaginez que je vous demande de calculer le taux de consanguinité de la femelle FA6 située tout en bas de cet arbre généalogique. (Vous pouvez cliquer sur l’image pour l’agrandir). On est mal barrés, non ?

generation6

On peut imaginer qu’il faut un certain courage pour appliquer la méthode des chemins sur cet arbre : nous avons 16 ancêtres communs, et certains apparaissent 5 fois ! Vous allez me dire, c’est la famille tuyau-de-poêle cette affaire, une famille pareille n’est pas raisonnable, elle va être beaucoup trop consanguine, personne de sensé ne se lancerait dans un plan de reproduction pareil. Et pourtant, le taux de consanguinité de FA6 n’est « que » de 8.11%, soit nettement moins qu’un simple croisement entre un oncle et sa nièce, configuration relativement fréquente en élevage (et le schéma a d’autres intérêts, mais ça, on en parlera un autre jour !). Donc, cela vaut le coup de savoir calculer la consanguinité d’un arbre pareil, mais la méthode des chemins est un peu… laborieuse dans ce cas.

Heureusement, nous avons encore quelques tours dans notre manche. Et ce sera l’objet du troisième et dernier article de cette série consacrée au calcul du taux de consanguinité, consacré à la méthode tabulaire.

Top