Paradoxe des deux enfants
En théorie des probabilités, le paradoxe des deux enfants consiste à estimer le sexe d'un enfant parmi deux à partir de l'observation de l'autre, exemple-type d'inférence bayésienne. Il y a paradoxe pour deux raisons : d'une part la bonne réponse (l'autre enfant a davantage de chances d'être de sexe opposé) est contre-intuitive pour beaucoup de personnes, et d'autre part des formulations très voisines du problème mènent à un résultat différent.
Énoncé original
Formulation
La première occurrence de ce problème est un article de Martin Gardner, paru dans la revue Scientific American en 1959 sous le titre The Two Children Problem[1].
- Mr. Jones has two children. The older child is a girl. What is the probability that both children are girls?
- Mr. Smith has two children. At least one of them is a boy. What is the probability that both children are boys?
- M. Jones a deux enfants. L'enfant aîné est une fille. Quelle est la probabilité que les deux enfants soient des filles ?
- M. Smith a deux enfants. Au moins l'un des deux est un garçon. Quelle est la probabilité que les deux enfants soient des garçons ?
Dans cet article, les probabilités étaient évaluées respectivement à 1/2 et 1/3. Cela signifie que, parmi toutes les familles de deux enfants avec une fille en première position, la moitié d'entre elles a en réalité deux filles, tandis que, parmi toutes les familles de deux enfants avec au moins un garçon, un tiers d'entre elles a en fait deux garçons.
Mais Martin Gardner a reconnu plus tard que la seconde question était ambiguë[1]. En effet, la manière dont est acquise l'information selon laquelle il y a au moins un garçon influence la réponse à la question, qui peut alors varier de 1/3 à 1/2.
De nombreuses variantes de ce problème montrent l'importance de la formulation dans le calcul du résultat.
Hypothèses implicites
D'une part les sexes des enfants sont supposés indépendants d'un enfant à l'autre en l'absence d'hypothèse supplémentaire. D'autre part, chaque enfant peut être un garçon ou une fille de façon équiprobable.
Ces hypothèses ne traduisent pas exactement la réalité. D'une part, la possibilité que les enfants soient des jumeaux monozygotes contredit a priori l'indépendance des sexes et fait augmenter légèrement les deux probabilités calculées précédemment. D'autre part, les proportions des deux sexes sont inégales et varient même selon l'âge et le pays[2].
La correction de ces approximations fait varier les probabilités d'au plus quelques pourcents, ce qui ne change pas le résultat du paradoxe.
Explication par tableau
On distingue les quatre possibilités pour le sexe de deux enfants d'une famille à l'aide d'un tableau à double entrée :
Sexe du deuxième enfant | |||
---|---|---|---|
Fille | Garçon | ||
Sexe du premier enfant | Fille | FF | FG |
Garçon | GF | GG |
D'après les hypothèses implicites, ces quatre possibilités sont équiprobables. Il suffit alors de déterminer le rapport du nombre de cas favorables par le nombre de cas possibles dans chaque famille.
Dans la famille de M. Jones, les seuls cas possibles sont notés FF et FG et le seul cas favorable est FF. La probabilité que les deux enfants soient des filles vaut donc 1/2.
Dans la famille de M. Smith, les cas possibles sont FG, GF et GG, alors que le seul cas favorable est GG. La probabilité que les deux enfants soient des garçons vaut donc 1/3.
Calcul formel avec probabilités conditionnelles
Le calcul peut être effectué avec les notations d'événements :
- : « le premier enfant est une fille » ;
- : « le deuxième enfant est une fille ».
- Famille Jones
La probabilité qu'il y ait deux filles dans la famille Jones est alors la probabilité de l'intersection de ces deux événements, sous la condition du premier événement :
or, par indépendance de et ,
Cette probabilité vaut donc 1/2 d'après les hypothèses implicites.
- Famille Smith
La probabilité qu'il y ait deux garçons dans la famille Smith s'écrit :
la dernière égalité se déduisant des propriétés des opérations ensemblistes, notamment d'une des lois de De Morgan. Puis par passage au complémentaire et indépendance des événements et ,
Acquisition de l'information
Le calcul effectué précédemment suppose que la famille Smith se retrouve de façon équiprobable de l'une des trois cases du tableau intitulées FG, GF et GG. Or l'information selon laquelle il y a au moins un garçon peut être obtenue de différentes manières :
- À la question « Avez-vous au moins un garçon ? », M. Smith répond « Oui. » (événement ) ;
- À la demande « Indiquez-moi le sexe de l'un de vos enfants. », M. Smith répond « J'ai (au moins) un garçon. » (événement ).
Dans le premier cas, la probabilité qu'il y ait deux garçons correspond effectivement à la probabilité conditionnelle calculée précédemment et qui vaut 1/3. Mais dans le deuxième cas, le fait que M. Smith choisisse de mentionner un garçon affaiblit la probabilité qu'il y ait une fille, sauf à supposer qu'un parent choisit toujours de mentionner un garçon lorsqu'il en a un. En supposant qu'un parent d'un garçon et d'une fille mentionne l'un ou l'autre de façon équiprobable, la probabilité que M. Smith ait deux garçons remonte à 1/2.
Explication par tableaux
Le premier cas (« Avez-vous au moins un garçon ? — Oui. ») correspond exactement au tableau donné précédemment. L'information donnée par M. Smith permettant d'éliminer le cas FF du tableau, et les trois autres possibilités étant équiprobables d'après les hypothèses implicites, la probabilité du cas GG est 1/3.
Pour le deuxième cas, on distingue comme antérieurement les quatre possibilités de sexe, et on écrit dans le tableau à double entrée ce que M. Smith peut répondre :
Sexe du deuxième enfant | |||
---|---|---|---|
Fille | Garçon | ||
Sexe du premier enfant | Fille | FF « une fille » | FG « une fille » ou bien « un garçon » |
Garçon | GF « une fille » ou bien « un garçon » | GG « un garçon » |
M. Smith a répondu « un garçon », le cas FF est donc éliminé. M. Smith peut se trouver dans la situation GG, GF ou bien FG, ces trois situations étant équiprobables et associées à une probabilité d’1/3. Si l'autre enfant de M. Smith est une fille (GF ou FG), les deux réponses « un garçon » ou « une fille » sont possibles. En supposant qu'un parent dans cette situation répond sans préférence particulière, la réponse « un garçon » recueille la moitié de la probabilité de chaque situation, soit 1/6 pour GF et 1/6 pour FG, soit 1/3 au total. Si l'autre enfant de M. Smith est un garçon (GG), la réponse « un garçon » a la probabilité de la situation, soit 1/3 également. La probabilité que M. Smith réponde « un garçon » alors qu'il a aussi une fille (GF ou FG) ou alors qu'il a un second garçon (GG) sont donc égales, ce qui fait que la probabilité qu'il ait un second garçon est 1/2.
Calcul formel avec probabilités conditionnelles
D'autres manières d'acquérir l'information sur le sexe d'un enfant s'apparentent au deuxième cas, comme la rencontre d'un garçon disant être le fils de M. Smith.
Particularisation
Un autre biais de la formulation d'origine pour M. Smith est le recours à l'expression « l'un des deux » qui peut particulariser l'un des enfants de la même manière que le fait l'ordre de naissance. Cette particularisation peut être entérinée par la question « Quelle est la probabilité que l'autre enfant soit un garçon (aussi) ? » qui est parfois utilisée. Lorsque l’information est ainsi fournie spontanément par le locuteur, on pourra penser qu’il a en effet fait un choix préalable sur l’enfant dont il parle, choix qui pourra être aussi bien volontaire que fortuit, ou même dicté par le hasard.
Exemple : « J’ai deux enfants, l’un est un garçon » peut indiquer que le garçon en question a été choisi par celui qui s’exprime, de manière consciente ou non. Si c’est le cas, la probabilité que l’autre enfant soit (aussi) un garçon est bien ½, car à partir du moment où l'un et l'autre sont identifiés, le sexe de « l'autre » est indépendant de l'information fournie et la probabilité qu'il soit un garçon est bien 1/2.
A l’inverse, il reste possible que l’interlocuteur n’ai pas fait de choix, même avec cette tournure de phrase, il pourra s’agir par exemple d’un mathématicien ou logicien qui ne fait que livrer (malhabilement, ou très habilement) une information générale sur ces deux enfants, à savoir ici qu’il n’a pas deux filles, auquel cas la probabilité qu’il ait deux garçons est 1/3.
Ce point est celui qui porte le plus souvent à discussion, d’où le terme de paradoxe affublé à ce problème des deux enfants. Il disparait lorsque l’information fournie résulte d’une réponse à une question fermée.
Ainsi dans le dialogue suivant :
-« Avez-vous exactement deux enfants »
-« Oui »
-« Avez-vous au moins un garçon »
« Oui »
La particularisation de l’enfant ne peut ici plus être invoquée, et la probabilité qu’il ait deux garçons est bien 1/3.
Variantes
Les variantes les plus courantes du paradoxe des deux enfants consistent à joindre une autre information au sexe.
Jour de naissance
Lê Nguyên Hoang propose de considérer une famille de deux enfants, dont au moins l'un des enfants est un garçon né un mardi. On se demande quelle est la probabilité que l'autre enfant soit un garçon aussi[3].
En supposant l'équiprobabilité, un enfant est un garçon né un mardi avec une probabilité de , c'est un garçon né un autre jour avec probabilité , et une fille avec probabilité . Pour deux enfants, on obtient les probabilités suivantes :
Probabilité a priori | Deuxième enfant | ||||
---|---|---|---|---|---|
Garçon | Fille | ||||
né un mardi | né un autre jour | ||||
Premier enfant | Garçon | né un mardi | |||
né un autre jour | |||||
Fille |
Sachant que la famille a au moins un garçon né un mardi, on peut éliminer les cases qui ne correspondent ni à la première ligne, ni à la première colonne. On obtient alors par le calcul des probabilités conditionnelles que la probabilité recherchée est :
Prénom
Jean-Paul Delahaye a présenté le paradoxe suivant, inventé par Jacques Patarin[réf. nécessaire],[4]: déterminer la probabilité que deux enfants soient des filles sachant qu'il y a au moins une fille prénommée Sophie parmi eux[5]. L'information supplémentaire sur le prénom de la fille revient alors à particulariser l'enfant dont on parle, ce qui entraîne que la probabilité cherchée vaut à peu près 1/2.
Plus généralement, il montre que la probabilité que les deux enfants soient du même sexe sachant qu'au moins l'un d'eux est une fille avec une particularité de probabilité , est égale à .
Plus est faible — c'est-à-dire plus l'information particularise la fille (comme son prénom) — plus la probabilité est proche de 1/2, tandis que plus est proche de 1 — l'information n'apporte pas grand chose — plus la probabilité est proche de 1/3 du problème original.
Intuitivement, cela peut se comprendre en voyant que si est faible, alors il est presque deux fois plus probable que l'on retrouve la particularité parmi deux filles plutôt qu'une seule, et on a donc presque autant de chance d'avoir « fille-fille » plutôt que « fille-garçon ou garçon-fille ». Mais si est proche de 1, la particularité est vérifiée avec probabilité proche de 1 dès qu'il y a même une seule fille, et « fille-fille » reste donc à peu près deux fois moins probable que « fille-garçon ou garçon-fille ».
Généralisation
A noter que cette formule donnée par Jean-Paul Delahaye est applicable aux différentes versions du problème qui existent. Pour celle du jour de référence, vue plus haut, on constate que la formule donne bien la probabilité déjà calculée : ≈ 0,48
Cette formule est d’ailleurs relativement simple à retrouver :
Il existe 4 arrangements possibles pour les deux enfants (FF, FG, GF, GG), chacun équiprobable, soit une probabilité respective de 1/4 .
On introduit une caractéristique, une particularité pour un garçon, avec une probabilité p d’apparaitre.
L’arrangement (FG) peut être scindé en (FGp) si le garçon a la propriété, et (FG¬p) s’il ne l’a pas. ( ¬p signifie 'non p')
La probabilité d’apparition de (FGp) est alors De la même manière,
L'arrangement (GG) peut être scindé en (GpGp) (G¬pGp) (GpG¬p) et (G¬p G¬p).
P(G¬pGp) = , de même P(GpG¬p) =
Des cinq arrangements permettant l’apparition d’au moins un garçon avec la caractéristique donnée (FGp , GpF , GpGp , G¬pGp , GpG¬p), seuls les trois derniers permettent l’existence d’un autre garçon. La probabilité cherchée est alors le ratio entre, la probabilité d’apparition d’un de ces trois arrangements (la somme de leurs probabilité), sur la probabilité d’apparition d’un des cinq.
Soit
Exemples d’application : (Pierre-Henry Ladame) On se propose de considérer une famille avec deux enfants, dont au moins un des deux enfants est un garçon n’ayant pas le même signe astrologique que sa mère. Quelle est la probabilité que l’autre enfant soit aussi un garçon ?
p=11/12 la probabilité cherchée est alors ≈ 0,35
Autre famille de deux enfants, dont au moins un des deux enfants est un garçon avec le même signe astrologique que sa mère. Quelle est la probabilité que l’autre enfant soit aussi un garçon ?
p=1/12 la probabilité cherchée est alors ≈ 0,49
Extension
On peut généraliser le problème pour toute double expérience aléatoire dont les issues possibles sont équiprobables, avec la connaissance d’informations sur ces deux expériences.
Avec deux tirages équiprobables entre i issues , la connaissance d’une issue pour au moins l’un des tirages, ainsi qu’une information complémentaire ayant p chance d’apparaitre sur cette issue connue (information ne se référant pas à un seul des deux tirages), la probabilité que les deux tirages soient d’issue identique est égale à : (Pierre-Henry Ladame)
Exemple : On a dix dés dont sept ont les chiffres gravés, les autres les chiffres peints. Un dé est choisi au hasard et lancé. Puis les dés sont mélangés à nouveau et un dé est de nouveau choisi au hasard et lancé. On obtient l’information suivante sur le jet des dés: « il y a eu au moins un As avec chiffre gravé », l’information est reçue dans un mode qui permette d’assurer qu’aucun dé n’a été spécifiquement désigné. Quelle est la probabilité qu’il y ait eu deux As ?
Ici i = 6 et p=7/10 , la probabilité cherchée est alors ≈ 0,115
Notes
- (en) Martin Gardner, The Second Scientific American Book of Mathematical Puzzles and Diversions, Simon & Schuster, , 254 p. (ISBN 978-0-226-28253-4)
- Proportion de garçons et de filles selon les âges et les pays
- Science4All, « 3 variantes mindfucks des 2 enfants | Bayes 6 », (consulté le )
- Jacques Patarin, « Le Paradoxe des Sophies »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?) (consulté le )
- Jean-Paul Delahaye, « Le trésor et les Sophies », Pour la science n° 336, octobre 2005.
Articles connexes
- Portail des probabilités et de la statistique