Principe de Hardy-Weinberg
Le principe de Hardy-Weinberg (aussi connu sous le nom de loi de Hardy-Weinberg ou équilibre de Hardy-Weinberg, Hardy–Weinberg equilibrium en anglais) est une théorie de génétique des populations qui postule qu'au sein d'une population (idéale), il y a un équilibre des fréquences alléliques et génotypiques d'une génération à l'autre. Autrement dit, les fréquences alléliques et génotypiques restent constantes d’une génération à l’autre.
Histoire
Gregor Mendel est souvent reconnu comme le père fondateur de la génétique[1]. Il a étudié la transmission de caractères sur des petits pois tels que leur couleur ou leur aspect. Ses expériences l'ont amené à affirmer que des caractères distincts se transmettent de manière indépendante et que certains sont dominants et d'autres récessifs[2].
La génétique mendélienne a été critiquée par Udny Yule car il pensait que la proportion des allèles dominants ne feraient qu'augmenter. Reginald Punnett, qui ne parvenait pas à prouver le contraire à Udny Yule, a demandé au mathématicien britannique Godfrey Harold Hardy de résoudre le problème. Celui-ci a apporté la preuve que les génotypes restent stables d'une génération à l'autre.
Un médecin allemand, Wilhelm Weinberg, a abouti à cette même conclusion de manière indépendante. La loi a donc été nommée « loi de Hardy-Weinberg »[3],[4].
Démonstration
Hypothèses de départ
Pour que l'équilibre existe, plusieurs hypothèses sont considérées. La population doit être de taille infinie de telle sorte que l’on puisse assimiler les fréquences observées à des probabilités en vertu de la loi des grands nombres. Les couples se forment au hasard (panmixie) et les gamètes se rencontrent au hasard (pangamie). Les générations ne se chevauchent pas, c’est-à-dire que deux individus de générations différentes ne peuvent pas se reproduire ensemble. Enfin, il n’y a pas de sélection naturelle, ni de mutation, ni de migration[5],[6].
Démonstration mathématique
Considérons un gène possédant deux allèles : l’allèle A et l’allèle B.
Soient cinq suites , , , et . correspond à la fréquence de l’allèle A à la génération , et correspond à la fréquence de l’allèle B à la génération . correspond à la fréquence du génotype (A//A) à la génération , correspond à la fréquence du génotype (A//B) à la génération , et correspond à la fréquence du génotype (B//B) à la génération .
Puisqu’il n’existe que deux allèles possibles, on a . Et comme il n’existe que trois génotypes possibles, on a .
Étudions maintenant la transmission des allèles à la descendance. Comme la population est supposée de grande taille, la fréquence d’un allèle à la génération correspond à la probabilité qu’un parent le transmette à son descendant de la génération .
A (de probabilité ) | B (de probabilité ) | |
---|---|---|
A (de probabilité ) | (A//A) (de probabilité ) | (A//B) (de probabilité ) |
B (de probabilité ) | (B//A) (de probabilité ) | (B//B) (de probabilité ) |
À l’aide du tableau, on obtient les formules qui correspondent aux fréquences génotypiques de la génération d'après, soit la génération :
.
On peut remarquer que , ce qui est cohérent car la somme des fréquences génotypiques à une génération doit être égale à 1.
Voyons à présent les relations qui existent entre les fréquences alléliques et génotypiques au sein d’une même génération. On note le nombre total d’individus dans la population à la génération . Le nombre total d’allèles dans la population à la génération est donc puisque chaque individu possède deux allèles. Chaque individu de génotype (A//A) possède deux allèles A et chaque individu de génotype (A//B) possède un allèle A et un allèle B. Ainsi, le nombre total d’allèles A à la génération vaut . Or, il y a allèles dans la population donc la fréquence de l’allèle A à la génération est égale à :
.
Avec un raisonnement similaire, on obtient pour l’allèle B la formule suivante :
.
On peut mettre en lien les formules établies pour prouver le principe de Hardy-Weinberg. En choisissant comme valeur de dans la formule , on obtient . Or, nous avons vu que et que . On remplace les valeurs de et dans la formule et on obtient :
puisque .
donc la suite est constante. La fréquence de l’allèle A ne varie pas au cours des générations. Et comme et que est une suite constante, alors est aussi une suite constante. Nous avons démontré la stabilité allélique dès la première génération.
Ensuite, comme et que tous les sont égaux entre eux à partir de , alors tous les sont égaux entre eux à partir de . À l’aide du même raisonnement, tous les sont égaux entre eux à partir de et tous les sont égaux entre eux à partir de . Nous avons démontré la stabilité génotypique à partir de la seconde génération[5].
Usages
Mise en évidence d'un facteur évolutif
Les conditions nécessaires pour que la loi puisse s'appliquer ne sont que très rarement réunies. Il est donc légitime de se demander l'utilité de la loi de Hardy-Weinberg. En réalité, elle permet de prévoir l'évolution génétique d'une population et de s'en servir comme élément de comparaison avec la réalité. Cela permet de mettre en évidence un facteur évolutif. En effet, s'il n'y a pas d'équilibre, alors l'une ou plusieurs des hypothèses de départ ne sont pas remplies : la population est peut-être soumise à une sélection naturelle ou un autre mécanisme[7].
La production et la rencontre des gamètes s'effectuent de manière aléatoire. Par conséquent, l'évolution des fréquences allélique et génotypique comporte une part de hasard. Plus la population est grande, moins les variations seront grandes en vertu de la loi des grands nombres. En revanche, plus la population est petite, plus le hasard joue un rôle important et peut engendrer un grand écart par rapport à la valeur théorique. Ce phénomène, qui met en jeu le hasard, se nomme dérive génétique.
Les mutations permettent l'apparition de nouveaux allèles et modifient donc les fréquences alléliques. En effet, si un nouvel allèle apparaît, alors la fréquence des autres allèles diminue. Les mutations jouent un rôle essentiel dans l'Évolution. Cependant, les mutations restent rares. Leur effet et leur influence sur l'équilibre théorique reste limités.
Les populations ne sont généralement pas isolées. Il y a des échanges entre elles. Or, les fréquences alléliques peuvent être différentes entre populations. Les migrations ont tendance à homogénéiser les génomes. Elles peuvent donc être un élément qui éloignerait les fréquences alléliques de leurs valeurs théoriques calculées avec la loi de Hardy-Weinberg.
La sélection naturelle consiste en la sélection des individus possédant un avantage à la survie ou à la reproduction. Par exemple, un individu qui possèderait un allèle avantageux aurait plus de chances de survivre et donc de se reproduire qu'un individu qui posséderait un allèle désavantageux et risquerait de mourir plus tôt. La fréquence de l'allèle avantageux augmenterait et ne suivrait pas le modèle de Hardy-Weinberg. Les sélections (naturelle, sexuelle, gamétique…) ne permettent pas les stabilités alléliques et génotypiques.
D'autres mécanismes peuvent éloigner de l'équilibre théorique comme l'homogamie, la clonalité ou encore le chevauchement des générations[8].
Calcul de fréquences géniques
Le calcul est simple lorsque les gènes sont codominants, il suffit de les compter à partir des phénotypes observés, dont le génotype est certain, et nous obtenons immédiatement une estimation des fréquences géniques.
Lorsque nous avons un ou des gènes récessifs, nous devons tenir compte des divers génotypes possibles.
Il en est ainsi du système de groupe sanguin ABO que nous prenons (d'après R.R. Race et R. Sanger, Les groupes sanguins chez l'homme, Masson 1970) pour exemple de calcul. Le système ABO comporte 3 allèles, A, B, et O, ce dernier étant récessif. Par souci de simplification, nous ne différencions pas les 2 allèles A1 et A2 qui déterminent deux sortes différentes de groupe A, A1 étant dominant sur A2. Nous observons donc 4 phénotypes possibles. Nous observons, d'après M. Goudemand et Ch. Salmon, les fréquences suivantes en France, arrondies à trois décimales :
A, fréquence 0.437, génotypes possibles (A//A) et (A//O)
B, fréquence 0.092, génotypes possibles (B//B) et (B//O)
AB, fréquence 0.036, génotype certain (A//B)
O, fréquence 0.435, génotype certain (O//O)
Soit a, b, o les fréquences géniques respectives des allèles A, B, O. Nous avons, par définition, a + b + o = 1
La fréquence du génotype (O//O), égale à o² étant de 0.435, nous en déduisons la fréquence génique de o, soit : o = = 0.6595
La fréquence génique de l'allèle A en découle, car nous avons la fréquence des sujets A = 0.437 = a² + 2ao = a² + 1.3190a d'où a = 0.2743
La valeur de b s'en déduit immédiatement ; b =1 -(0.6595 + 0.2743)= 0.0662
Ou plus simplement la méthode de Bernstein :
o = = 0.6595
b = 1 - (a + o) = 1 - = 1 - 0.9338, soit b = 0.0662
a = 1- (b + o) = 1 - = 1 - 0.7259, soit a = 0.2741
Le total o+a+b n'est pas égal exactement à 1, et certaines corrections doivent être apportées, et l'ont été tant par Bernstein, qu'ultérieurement par d'autres auteurs -Taylor et Prior (1938), R.A. Fisher et G.L. Taylor (1940), A.M. Dobson et E.W. Ikin (1946) et J.A.F. Roberts (1948) en ont publié les formules d'application.
Exemple de test χ2 pour la déviation
L'écart par rapport à la loi de Hardy-Weinberg est estimé grâce au Test du χ² de Pearson, en comparant la structure des fréquences génotypiques obtenues à partir des données observées, aux fréquences calculées selon la loi de Hardy-Weinberg. Lorsque les systèmes comprennent de nombreux allèles, certains génotypes peuvent manquer ou n'être observés qu'en petit nombre. Le test de χ² est alors inapplicable, ou des regroupements de classes doivent être effectués, et une méthode dérivée de la méthode exacte de Fisher doit être appliquée.
Les données suivantes ont été fournies par E.B. Ford (1971) qui a noté les phénotypes observés dans une population de papillons écaille rouge. Une faible discordance génotype-phénotype peut être négligée. L'hypothèse nulle est que cette population répond à la loi de Hardy-Weingerg, l'hypothèse alternative étant qu'elle n'y répond pas.
Génotype | Tacheté blanc (AA) | Intermédiaire (Aa) | Peu tacheté (aa) | Total |
---|---|---|---|---|
Nombre | 1469 | 138 | 5 | 1612 |
D'où les fréquences alléliques peuvent être estimées :
et
Les valeurs attendues sont :
Il s'agit d'un test à un degré de liberté (ddl), -en règle, le nombre de degrés de liberté d'un test de χ² est de n − 1, où n est le nombre de classes, quoique qu'un autre ddl soit perdu, du fait que les valeurs attendues sont estimées à partir des valeurs observées. Le seuil de signification à 5 % du χ², pour 1 ddl, est à 3.84. La valeur du χ² obtenue étant inférieure à 3.84, l'hypothèse nulle, à savoir la population étudiée suit la loi de Hardy-Weinberg, n'est pas rejetée[9],[10].
Notes et références
- « Gregor Mendel : Biographie, Tombe, Citations, Forum... », sur JeSuisMort.com (consulté le )
- Encyclopædia Universalis, « Lois mendéliennes de l'hérédité », sur Encyclopædia Universalis (consulté le )
- « La loi de Hardy-Weinberg », sur www.collegeleseyquems.fr (consulté le )
- Encyclopædia Universalis, « Godfrey Harold Hardy », sur Encyclopædia Universalis (consulté le )
- « Thème 3, sous-thème 3-1, équilibre de Hardy-Weinberg », sur eduscol.education.fr, (consulté le )
- « Modèle de Hardy-Weinberg », sur atlasgeneticsoncology.org (consulté le )
- « Comprendre l’équilibre de Hardy Weinberg », sur SVT au lycée, (consulté le )
- Thierry De Meeûs, « 2. Concepts de base en génétique des populations », dans Initiation à la génétique des populations naturelles : Applications aux parasites et à leurs vecteurs, IRD Éditions, coll. « Didactiques », (ISBN 978-2-7099-2282-1, lire en ligne), p. 29–66
- (en) Aileen M. Dobson et Elizabeth W., « The ABO blood groups in the United Kingdom; frequencies based on a very large sample », The Journal of Pathology and Bacteriology, (lire en ligne)
- (en) J. A. Fraser Roberts, The frequencies of the ABO blood-groups in south-western England, Annals of Eugenics,
Voir aussi
Bibliographie
- Jean-Louis Serre, Génétique des populations, Dunod, , 280 p. (ISBN 2100496204)
Articles connexes
- Portail origine et évolution du vivant
- Portail des mathématiques