Taille du génome

La taille du génome correspond à la quantité d'ADN contenue dans une copie d'un génome. La taille d'un génome est également appelée valeur C. Elle est mesurée soit par sa masse où on utilise le picogramme, noté pg comme unité, ou bien par le nombre de nucléotides (paires de bases) avec le Mégabase, notée Mb (1 million de nucléotides) comme unité : 1 pg correspond à 978 Mb[1] (cette équivalence posée entre le nombre de paires de bases et la masse en picogrammes est facilitée par le fait qu’une paire GC a une masse moléculaire très voisine d’une paire AT).

Arbre phylogénétique indiquant la taille des génomes chez les organismes des trois domaines du monde vivant: les bactéries Bacteria (en bleu), les archées Archaea (en vert) et les eucaryotes Eucarya (en rouge).

Origine du terme

Le terme de "Taille du génome" est souvent attribué par erreur à Hinegardner[2], puisque Hinegardner utilisa ce terme en 1969 dans le sens "nombre de gènes". Par contre, en , Wolf et al. utilisèrent le terme "taille du génome" avec le sens actuel[3]. Le terme de "taille du génome" est devenu populaire au début des années 1970 sans doute à la suite de la publication du livre de Susumu Ohno, Evolution by Gene Duplication[4].

Conversion de picogrammes (pg) en paire de bases (bp),

ou simplement:

[1]

Évolution de la taille du génome

La taille des génomes eucaryotes est très variable. Le parasite intracellulaire Encephalitozoon cuniculi a un génome de 2,8 Mb (2,8 millions de paires de bases) alors que l'amibe Polychaos dubnium pourrait avoir un génome de 675 Gb (milliards de paires de bases), bien que cette estimation ancienne soit contestée[5]. Ces variations peuvent également être importantes au sein d'un même groupe : la taille du génome chez les arthropodes varie de l'ordre de 250 fois, chez les poissons de 350 fois et chez les angiospermes de 1000 fois. La variation des tailles de génome est due à une différence de tolérance à l'augmentation du génome ainsi qu'à un taux de perte d'ADN différent suivant les espèces. Par exemple, le génome relativement compact de la mouche Drosophila melanogaster est dû à un taux de perte d'ADN par délétion élevé et bien supérieur à celui des mammifères[6]. De plus, il est apparu qu'il n'existait pas de corrélation entre la taille du génome et la complexité d'un organisme. Cette observation a été appelée le paradoxe de la valeur C.

Enfin, contrairement à l'opinion courante, l'histoire évolutive du vivant ne se confond pas avec l'histoire de sa complexification (au niveau des organismes et au niveau génomique) car il semble que la réduction du génome soit le mode dominant de l'évolution[7].

Réduction du génome

La réduction de la taille d'un génome est une règle générale chez les virus et les procaryotes. La relation ou règle de Drake chez ces organismes montre une relation inversement proportionnelle entre la taille de génomes de ces microbes et une estimation de leurs taux de mutation spontané global (en moyenne une mutation par génome toutes les 200 générations cellulaires, mutation se produisant lors de la réplication de l'ADN, ou sous l'effet d'agents mutagènes, composés chimiques divers, rayons ultraviolets, radioactivité, radicaux libres issus du métabolisme cellulaire). Cette réduction du génome peut également se produire lors d'erreurs des mécanismes de réparation de l'ADN[8].

Cette réduction a été également mis en évidence chez des parasites eucaryotes (Par exemple:Encephalitozoon cuniculi) ou bien chez des symbiontes intracellulaires (Par exemple:Buchnera aphidicola). Dans le cas de symbiontes intracellulaires, la réduction du génome est accompagnée d'un transfert de gène du symbionte vers le noyau de la cellule hôte. Ce processus est à la base de la théorie endosymbiotique de l'origine des mitochondries et des chloroplastes.

Expansion du génome

La relation de Drake n'est valable que pour les virus et les procaryotes, car chez les eucaryotes, la relation serait en sens inverse[9].

Les mécanismes sont:

Chez les plantes, l'amplification des rétrotransposons LTR semble être une cause importante de la variation de la taille du génome. Ainsi, 70 % du génome du maïs est composé de rétrotransposons LTR. Cette expansion de rétrotransposon a induit le doublement du génome du maïs en quelques millions d'années[10]. Chez les arthropodes, le taux de perte d'ADN semble être le facteur essentiel pour la variation des tailles de génome. Ainsi, le criquet d'hawaï a un génome 11 fois supérieur à celui de la mouche Drosophila melanogaster et un taux de perte d'ADN 40 fois inférieur[6]. Chez les bactéries, la taille du génome est corrélée avec le taux de gènes dupliqués[11].

Les données de génomique structurale montrent que la taille d'un génome n'est pas proportionnelle à la complexité de l'organisme : c'est le paradoxe de la valeur C. Par exemple, la taille du génome du petit pois est 1,5 fois plus grande que celle de l'homme, celle du riz cultivé est dix fois plus grande[12]. Ce paradoxe est attribué au taux relatif d'expansion des séquences répétitives dispersées selon la lignée, et à la délétion de séquences sans grande importance. Ces séquences répétitives représentent à peine quelques pour cent de certains génomes eucaryotiques comme ceux de la levure et de la drosophile, mais plus de 50 % du génome humain et plus et plus de 90 % du génome d'espèces aussi diverses que certains criquets, des liliacées et des amibes[13].

Implication évolutive

La taille du génome est un « trait biologique » important car elle corrèle avec la taille cellulaire et nucléaire, le taux d'activité métabolique et la durée de la mitose et de la méiose[14]. Cependant, plusieurs modèles ont été proposés pour expliquer la fonction sélective et l'origine de la variation de la taille du génome. Une des explications de l'origine est l'importance de l'ADN non codant (appelé improprement « ADN poubelle ») constitué notamment de séquences répétées qui ont un rôle dans la régulation de l'expression des gènes[15]. L'hypothèse du généticien Michael Lynch (en), appelée parfois « hypothèse du péril mutationnel » (mutational hazard hypothesis ou MH), a eu un grand impact en génomique évolutive par son élégance et sa capacité à expliquer de nombreuses caractéristiques évolutives des génomes eucaryotes. Reposant sur la génétique des populations, elle propose que la taille efficace de population (en) a un impact décisif sur la taille des génomes. En effet, l’efficacité de la sélection pour limiter la propagation des gènes égoïstes (ou de toute séquence d’ADN qui peut à terme interférer avec la valeur sélective de l’organisme), augmente avec la taille efficace de population. Les espèces avec de petites tailles efficaces de populations telles que les hommes auraient tendance à accumuler de l’ADN non codant dans leur génome, alors que les espèces aux grandes tailles (communautés bactériennes) maintiendraient des petits génomes denses en séquences fonctionnelles et dépourvues de sources inutiles de mutations souvent délétères[16].

Taille des génomes d'espèces modèles

Organisme Taille du génome (Mpb) Nombre de gènes protéiques estimés
Virus Virus de la grippe0,013
Bactériophage λ0,05
Bactériophage T40,165
Mimivirus1,21 260
Bactéries Mycoplasma pneumoniae0,816689
Pelagibacter ubique1,31 354
Haemophilus1,81 657
Staphylococcus aureus2,82 619
Bacillus subtilis4,24 106
Escherichia coli4,644 243
Archaea Nanoarchaeum equitans0,49536
Pyrococcus abyssi1,771 898
Sulfolobus solfataricus32 977
Eucaryotes Encephalitozoon cuniculi2,91 996
Saccharomyces cerevisiae (levure)125 863
Plasmodium falciparum21,85 314
Caenorhabditis elegans (nématode)10022 628
Drosophila melanogaster (mouche)11816 548
Arabidopsis thaliana (plante)11927 379[17]
Populus trichocarpa (peuplier)48545 500
Zea mays (maïs)5 00054 606[18]
Mus musculus (souris)3 40030 000
Homo sapiens (homme)3 40026 517
Polychaos dubium (amibe)675 000

Avant qu'il soit séquencé, le génome humain était supposé contenir environ 100 000 gènes. Cette estimation a été revue à la baisse par la suite, et est actuellement de l'ordre de 24 000 - du même ordre que la plante Arabidopsis thaliana (27 379 gènes).

La séquence complète du dernier chromosome dans le génome humain (chromosome 1, le plus grand, contenant à lui seul 8 % de ce génome) a été obtenue en .

Plus grand génome

La fleur japonaise Paris japonica, du genre Paris a le génome eucaryote le plus vaste décrit : il comporte près de 150 milliards de paires de base, soit près de 50 fois la taille du génome humain[19]. Ceci est à considérer en excluant le génome de l'Amibe Polychaos dubium (≈700 Gpb) du fait de la précision incertaine de la méthode de mesure de son génome et de par le niveau de polyploïdie de l'espèce en question[20].

Références

  1. (en) Dolezel J, Bartoš J, Voglmayr H, Greilhuber J, « Nuclear DNA content and genome size of trout and human », Cytometry A, vol. 51, no 2, , p. 127-128 (PMID 12541287)
  2. (en) Hinegardner R, Molecular Evolution, Sinauer Associates, Inc., Sunderland, , « Evolution of genome size », p. 179-199
  3. (en) Wolf U, Ritter H, Atkin NB, Ohno S, « Polyploidization in the fish family Cyprinidae, Order Cypriniformes. I. DNA-content and chromosome sets in various species of Cyprinidae », Humangenetik, vol. 7, , p. 240-244
  4. Ohno S, Evolution by Gene Duplication, New York, Springer-Verlag,
  5. (en) Casey L. McGrath et Laura A. Katz, « Genome diversity in microbial eukaryotes », Trends in Ecology & Evolution, vol. 19, , p. 32–38 (DOI 10.1016/j.tree.2003.10.007, lire en ligne)
  6. Petrov DA, et al. Evidence for DNA loss as a determinant of genome size Science, 2000, 287, 1060-1062
  7. (en) YI Wolf, EV Koonin, « Genome reduction as the dominant mode of evolution », Bioessays, vol. 35, no 9, , p. 829-837 (DOI 10.1002/bies.201300037).
  8. (en) J W Drake, « A constant rate of spontaneous mutation in DNA-based microbes », Proc Natl Acad Sci USA, vol. 88, no 16, , p. 7160–7164 (DOI 10.1073/pnas.88.16.7160).
  9. (en) M. lynch, « Evolution of the mutation rate », Trends Genet, vol. 26, no 8, , p. 345-352.
  10. SanMiguel P, Bennetzen JL, Evidence that a recent increase in maize genome size was caused by the massive amplification of intergene retrotransposons. Ann. Bot. (Lond.), 1998 82:37–44
  11. Gevers D, Vandepoele K, Simillion C, Van der Peer Y, Gene duplication and biased functional retention of paralogs in bacterial genomes Trends in Microbiology. 2004 April;12(4):341-5.
  12. Norbert Latruffe, Françoise Bleicher-Bardeletti, Bertrand Duclos, Joseph Vamecq, Biochimie, Dunod, , p. 160.
  13. Greg Gibson et Spencer V. Muse, Précis de génomique, De Boeck Supérieur, , p. 101.
  14. Petrov DA. Evolution of genome size: new approaches to an old problem Trends Genet 2001 17 (1), 23-28
  15. Jean Deutsch, Le Gène. Un concept en évolution, Le Seuil, , p. 87.
  16. (en) M. Lynch et al, « The repatterning of eukaryotic genomes by random genetic drift », Annu Rev Genomics Hum Genet, vol. 12, no 1, , p. 347–366 (DOI 10.1146/annurev-genom-082410-101412).
  17. « TAIR9 Genome release » (consulté le ) : « The TAIR9 release contains 27,379 protein coding genes, 4827 pseudogenes or transposable elements and 1312 ncRNAs (33,518 genes in all, 39,640 gene models) »
  18. « Release Version » (consulté le )
  19. Pellicer J, Fay M, Leitch IJ, The largest eukaryotic genome of them all?, Botanical Journal of the Linnean Society, 2010;164:10–15
  20. T. Ryan Gregory, « Synergy between sequence and size in Large-scale genomics », Nature Reviews Genetics, vol. 6, (DOI 10.1038/nrg1674, lire en ligne)

Voir aussi

Articles connexes

Liens externes

  • Portail de la biologie cellulaire et moléculaire
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.