Probabilités

Cet article est encore en cours d’écriture – vous entrez à vos risques et périls !

 

Parmi tous les outils dont on peut avoir besoin quand on se lance dans la reproduction sélective ratounesque, les probabilités sont sans doute les moins bien maîtrisées et les plus mal comprises. A cela, trois raisons principales :

  • l’enseignement des probabilités n’est pas offert à tous dans le secondaire, il est réservé à certaines filières du lycée ;
  • il existe un indéniable blocage psychologique devant les mathématiques : « les probas, c’est des maths, je ne vais rien comprendre ! » ;
  • les probabilités sont particulièrement contre-intuitives et heurtent souvent la « logique » et le bon sens.

Pourtant, ça n’est pas si sorcier ! Je vous propose une petite introduction aux probabilités utiles et appliquées aux cas de reproduction ratesque. Les exemples pris dans cet article supposent que vous possédez déjà les bases minimales en génétique ; si ce n’est pas le cas, je vous renvoie en premier lieu vers des sources claires et complètes pour acquérir ces bases, telles que Ratlàlà, l’article génétique d’SRFA ou encore le lab-o-rats.

Avant-propos

On va parler de probabilités, (presque) jamais de certitudes. Ce n’est pas parce que le calcul vous dit que vous avez 98% de chances d’obtenir un bébé dove agouti double dumbo à pois que vous l’aurez. A commencer par le fait que (espérons-le en tous cas) votre rate a peu de chances de faire 100 bébés pour vérifier le calcul. La nature garde toujours une petite place pour la surprise ! Alors pas la peine de venir se faire rembourser si la portée n’est pas comme prévu !

Vocabulaire et notations

Probabilité est (peut-être) un mot qui vous fait peur. Désacralisons tout de suite : il s’agit juste de compter des trucs qui se produisent au hasard. Parfois, on compte des lancers de dés, de pièces, ou on pioche des boules rouges et noires dans des urnes. Ici, on comptera des ratouillots, mais dans le fond, c’est un peu pareil.

Faire reproduire deux rats, c’est faire une expérience avec une bonne part de hasard dedans. On appelle ça une expérience aléatoire. Le résultat qu’on en attend (surtout si on l’a fait exprès, ne niez pas), c’est un tas de ratouillots, et le tas qu’on a sur les genoux, on appelle ça un (heureux) événement. D’une manière plus formelle, pour nous et puisque ce sont les gènes et les phénotypes consécutifs qui nous intéresse, un événement sera un ou des gènes associé à un raton, ou une combinaison d’événements de ce type.

Exemple : « Bidulet est dumbo » est un événement. Pour raccourcir, on notera ça avec les lettres usuelles : « Bidulet = du/du ». « Bidulet est agouti hétérozygote dumbo, Bidulette est noire standard et sa tante issue de germain aime bien être au-dessus » est aussi un événement, mais c’est un événement composé, qui peut s’exprimer comme plusieurs événements simples, se produisant simultanément.

L’ensemble des événements s’appelle l’univers des possibles. Pour nous, ce sera l’ensemble de tous les résultats de portée qu’on peut avoir, étant donnés le papa et la maman. C’est pas mal grand, mais on sait compter ce qu’il y a dedans, donc ça va encore. Ce qu’on va calculer, c’est la probabilité qu’un événement donné de l’univers des possibles a de se produire.

Exemple : Quelle est la probabilité qu’un de mes Bidulets soit agouti dumbo ? On  notera ça p(Bidulet = A/- du/du) avec un p comme probabilité. Si on veut le décomposer en deux événements plus simples, à savoir « Bidulet est agouti » et « Bidulet est dumbo », on mettra une virgule : p(Bidulet = A/-, Bidulet = du/du) et on parlera de probabilité [b]jointe[/b] des deux événements.

Deux événements qui ne peuvent avoir lieu en même temps sont dits incompatibles. Par exemple « Bidulet est standard » et « Bidulet est dumbo ». Deux événements qui ont indifféremment lieu ensemble ou pas, qui ne dépendent donc pas l’un de l’autre, sont dits indépendants. Par exemple « Bidulet est dumbo » et « Bidulet est un mâle ». On supposera pour simplifier que tous les gènes de nos ratoux sont indépendants, ce qui n’est pas tout-à-fait vrai (suivant leur locus sur les chromosomes), mais ça sera assez compliqué comme ça.

Dénombrement, partition, équiprobabilité

Au départ de tout calcul de probabilité il y a une idée simple : on compte le nombre de cas possibles, s’ils ont tous la même chance de se produire, alors chaque cas a une chance de se produire de 1/nombre total de cas.

p(événement élémentaire) = 1 / nombre d’événements

Prenons un exemple simplissime : le sexe. L’univers des possibles se résume à deux événements : mâle, ou femelle. On peut raisonnablement supposer qu’il y a autant de chances d’avoir un mâle qu’une femelle. Donc p(Raoulet = mâle) = p(Raoulet = femelle) = ½. On dit que ces événements sont équiprobables.

Notons au passage que les événements « mâle » et « femelle » sont incompatibles et couvrent à eux deux tout l’univers des possibles. On parle de partition. Quand on a une telle partition, la somme des probabilités des événements doit faire 1 (le raton est, avec une certitude totale donc une probabilité de 1, un mâle OU une femelle). Si ça ne fait pas 1 à la fin, c’est qu’on s’est planté quelque part. La partition la plus couramment utilisée est une partition en deux, l’événement et son événement contraire (« Bidulet est dumbo rex à pois » vs. « Bidulet n’est pas dumbo rex à pois »), bien utile pour transformer les « et » en « ou » comme on le verra plus tard.

Un des pièges du dénombrement consiste à effectivement bien repérer les événements équiprobables. C’est le moment où il faut être vigilant. Le piège classique : il y a deux ratons, quelle est la probabilité qu’ils soient de deux sexes différents ?
–    La mauvaise réponse classique : soit il y a deux mâles, soit il y a deux femelles, soit il y a un mâle et une femelle, donc 1 chance sur 3. Perdu !
–    En effet l’événement « deux sexes différents » est plus probable que « deux femelles ». Pourquoi ? Il y a en réalité quatre cas possibles dans l’univers : le premier est un mâle et le deuxième un mâle, le premier est une femelle et le deuxième une femelle, le premier est un mâle et le deuxième une femelle, le premier est une femelle et le deuxième un mâle. L’événement « deux sexes différents » couvre donc 2 cas sur 4. La probabilité vaut un sur deux.

Heureusement, le problème se posera peu souvent, car on ne va pas s’amuser à énumérer à la main tous les cas possibles quand l’univers va grandir. Mais il faut le garder à l’esprit.

Si maintenant notre « souhait » n’est pas un événement élémentaire, mais peut-être réalisé par plusieurs événements de l’univers (cf. l’exemple juste au dessus « deux sexes différents »), on aura alors :

p(souhait) = nombre d’événements favorables / nombre total d’événements

Dans le cas de la génétique ratesque, cela arrivera souvent pour des gènes dominants, pour lesquels un même phénotype (ex. agouti) peut être réalisé pour plusieurs génomes (ex. A/A homozygote ou A/a hétérozygote).

Par exemple pour la couleur de base, si Bidulet A/a rencontre Bidulette A/a, l’univers des possibles pour le génotype de Bidulito est l’ensemble {A/A, A/a, a/A, a/a}, trois événements de l’univers réalisent le souhait « Bidulito est agouti » sur quatre cas possibles, donc p(Bidulito = A/-) = ¾.

Le second piège du dénombrement consiste à veiller si l’ordre des ratons est important ou pas. En général, on s’intéressera à savoir s’il y a un raton d’un certain type, peu importe qu’il ait été le premier ou le dernier à sortir. C’est la différence entre ce qu’on appelle un arrangement (l’ordre compte) et une combinaison (l’ordre ne compte pas). On passe d’un arrangement à un autre en permutant ses éléments. Si on a un ensemble de « n » ratons, on peut les réarranger dans n’importe quel ordre, ce sera la même portée. Comme faire un tel réarrangement ? On a « n » choix pour le raton qui sera le numéro 1. Puis (n-1) choix pour le suivant, etc… jusqu’au dernier raton, donc au total le nombre qu’on appelle « factorielle n » et qui s’écrit « n ! = n x (n-1) x (n-2) x (n-3)…. x 2 x 1. Quand on voudra calculer le résultat complet d’une portée, on commencera par poser que le premier raton est de tel type souhaité, le deuxième raton de tel autre type, etc… et il ne faudra pas oublier de multiplier par n ! pour prendre en compte toutes les permutations qui réalisent exactement la même portée.

Probabilités jointes

On sait maintenant dire qu’en prenant un rat au pif dans un tas de ratons, on a une chance sur 2 d’avoir un mâle. Vous allez me dire : merci, mais ça on le savait déjà. Un peu de patience !

Ce qu’on veut, nous, c’est savoir nos chances d’avoir un mâle ET agouti ET rex ET dumbo.

Reprenons l’exemple de la couleur de base. Papa et maman ont chacun deux gènes soit agouti (A) soit pas agouti (a), ils en transmettent chacun un, les génotypes A/A et A/a donnent des agoutis tandis que a/a donne du noir. Prenons un exemple simple. Bidulet est agouti porteur noir A/a et rencontre Bidulette rate noire a/a. Vous savez faire votre tableau et me dire qu’il y a quatre cas(es) possibles suivant ce que Bidulet et Bidulette transmettent à Bidulito, diviser deux par quatre et conclure que chaque raton a une chance sur 2 d’être noir, 1 chance sur 2 d’être agouti.

On peut aussi le faire sans tableau, en le prenant à l’envers et en décomposant. L’événement « Bidulito est noir » se décompose en « Bidulito a reçu un gène a de son papa Bidulet » ET « Bidulito a reçu un gène a de sa maman Bidulette ». Bidulet a 1 chance sur 2 de donner le a à Bidulito. Bidulette donne forcément un a à Bidulito, soit une chance sur 1 si on veut. Or 1 x ½ = ½.

Ca n’est pas une démonstration, mais ça permet de sentir un peu ce qui s’est passé : en multipliant les probabilités des deux événements séparés, on obtient la probabilité que ces deux événements se produisent en même temps.

p(événement 1, événement 2) = p(événement 1) x p(événement 2)

Attention, ça ne marche que si les deux événements sont indépendants ! Si on prend événement 1 = mâle et événement 2 = femelle, on obtiendrait une probabilité de ¼ d’avoir un raton qui serait à la fois mâle et femelle… ça ne marche pas car ces deux événements sont liés, p(mâle) = 1 – p(femelle).

Dans le cas de gènes indépendants, par exemple si je sais que Bidulito a une chance sur 2 d’être un mâle, une chance sur 2 d’être dumbo et 1 chance sur 4 d’être noir : il a donc ½ x ½ x ¼ = 1 chance sur 16 d’être un mâle noir dumbo.

La probabilité que deux ou plusieurs événements se produisent simultanément est plutôt facile à calculer. En revanche, la probabilité d’un « ou » est un peu plus astucieuse. Instinctivement, on aimerait pouvoir additionner les probabilités. Par exemple, je veux calculer la probabilité que Bidulito soit dumbo OU fléché. Trois cas sont possibles : ou bien Bidulito est dumbo et fléché, ou bien il est dumbo mais pas fléché, ou bien il est fléché et standard. Si on additionne p(dumbo) et p(fléché), on compte deux fois les cas où Bidulito est dumbo et fléché ! Pour avoir un calcul correct on aura alors :

p(evt1 OU evt2) = p(evt1) + p(evt2) – p(evt1,evt2)

Le problème, c’est que le dénombrement des cas devient vite compliqué si on a plus de deux événements à traiter. Pour éviter ça, on va utiliser l’astuce de la partition par deux. L’univers se découpe en deux sous-ensembles : tous les cas où Bidulito est dumbo ou fléché ou les deux, et les cas où Bidulito n’est ni fléché, ni dumbo. En passant d’un cas au cas inverse, on transforme le OU en ET, et la règle chiante du dessus par la règle sympa de la multiplication !

p(fléché OU dumbo) = 1 – p(ni fléché, ni dumbo) = 1 – p(non fléché)*p(non dumbo)
p(fléché OU dumbo) = 1 – (1-p(fléché))*(1-p(dumbo))

Remarquez que si je re-développe la multiplication juste au-dessus, je retombe exactement sur la règle du « ou ».

Si les événements sont incompatibles, et seulement dans ce cas :

p(evt1 OU evt2) = p(evt1) + p(evt2)

Et sur toute la portée ?

On sait maintenant calculer les chances d’un Bidulito donné d’être le rat de nos rêves. Le truc, c’est que Bidulito n’est pas tout seul dans sa portée, et qu’on s’en fiche pas mal que le rat de nos rêves soit sortie de la foufoune de maman le premier ou l’avant-dernier. Ce qu’on veut nous, c’est connaître nos chances globales.

Il y a deux façons de procéder suivant votre objectif. Soit vous voulez des prévisions globales de portées. Vous listez les génotypes attendus, vous déroulez votre calcul en multipliant dans tous les sens les probas élémentaires et hop.

Exemple innocent. Kubrick, rat agouti rex dumbo de papa noir et de maman topaze, rencontre Sariette, topaze lisse standard de maman beige porteuse dumbo. Nous avons suffisamment d’information pour établir leur génotype : A/a du/du Re/re R/r pour Kubrick, A/a Du/du re/re r/r pour Sariette. Comme on n’est pas trop mauvais en génétique on sait qu’on attend des rats topazes, noirs, beiges et agoutis, dumbo et standard, lisse et rex, on ne sait juste pas trop en quelle proportion. Par exemple sur la couleur, en détaillant à mort les calculs :
p(topaze) = p(A/-, r/r) = p(A/-) x p(r/r) = p(A/A ou A/a) x p(r/r)
p(topaze) = p(Kubrick donne A, Sariette donne A OU Kubrick donne A, Sariette donne a OU Kubrick donne a, Sariette donne A) x p(Kubrick donne r, Sariette donne r)
p(topaze) =  [ p(Kubrick donne A, Sariette donne A) + p(Kubrick donne A, Sariette donne a) + p(Kubrick donne a, Sariette donne A) ] x p(Kubrick donne r, Sariette donne r)
p(topaze) =  [ p(Kubrick donne A)*p(Sariette donne A)  + p(Kubrick donne A)*p(Sariette donne a) + p(Kubrick donne a)*p(Sariette donne A) ] * [ p(Kubrick donne r)*p(Sariette donne r)]
p(topaze) = [ ½ * ½  + ½ * ½ + ½ * ½ ] x [ ½ * 1 ] = 3/8
Et on en conclut, par une pirouette qu’on expliquera plus tard et qui a à voir avec la loi des grands nombres, que dans notre portée nous aurons 3/8 de ratons topazes. (Ce qui est un peu faux, on sait juste que chaque raton a 3 chances sur 8 d’être topaze, le passage à la proportion n’est qu’une estimation, et c’est bien pour ça que ça foire à chaque fois !)

Deuxième optique, vous savez exactement à quoi doit ressembler le raton de vos rêves et vous voulez savoir quelles sont vos chances. On commence par calculer la chance qu’a chaque raton de ressembler à ce rat idéal, mais il ne faudra pas oublier ensuite que son numéro ne nous intéresse pas.

Exemple toujours aussi innocent. Sur cette portée, j’aurais aimé avoir un raton mâle, topaze, dumbo, velours.
p(mâle A/- r/r du/du Re/re) = p(mâle) x p(topaze) x p(dumbo) x p(rex) = ½ x 3/8 x ½ x ½ = 3/64
Ce qui veut dire qu’un raton donné a 3 chances sur 64 d’être l’orange mécanique de mes rêves. Mais ce n’est pas un raton donné qui m’intéresse, c’est n’importe quel raton sur l’ensemble de la portée. Et j’en veux au moins un, s’il y en a quatre ou cinq ou douze en tout je serai contente aussi. On revient à la règle de départ : p(souhait) = nombre de cas favorables/ nombre de cas, il faut donc dénombrer tous ces cas. Compte tenu de mon univers (où je considère le sexe, la couleur de base, la dilution, les oreilles et les poils), il y a donc 64 cas équiprobables pour chaque raton. Les ratons sont indépendants, donc sur une portée de disons 10 ratons, j’ai 64 puissance 10 cas au total (juste pour le fun, ça fait à peu près 1 suivi de 18 zéros, pas mal n’est-ce pas ?). Si je voulais dénombrer tous les cas favorables, il faudrait que je calcule : la probabilité d’avoir un raton comme je le veux et que les 9 autres soient différents, la probabilité d’avoir deux ratons comme je le veux et que les 8 autres soient différents, etc. etc. jusqu’à la probabilité d’avoir 10 ratons exactement comme souhaité, puis que j’additionne tout ça. On obtiendrait un truc joli qui s’appelle la loi du binôme. Compliqué. Mais ça marcherait.

Le problème ici c’est que je demande à en avoir « au moins un », et ça c’est pas bien délimité. En revanche, « au moins un », c’est le contraire de « aucun ». Grâce à l’astuce du complément, on va avoir cette probabilité facilement. La probabilité qu’aucun des dix ratons ne soit comme je le veux, c’est la probabilité que le premier ne soit pas comme je le veux, fois la probabilité que le second ne le soit pas non plus, etc.
Soit p(aucun n’est comme je veux) = (1 – p(un raton donné est comme je veux)) puissance 10
Beaucoup plus simple !

En conclusion, la formule magique pour calculer ses chances :

p(avoir le rat de mes rêves) = (1 – p(pour un raton)) [i]puissance[/i] (nombre de ratons dans la portée)

Probabilités conditionnelles

A faire.

Top