Nexus (format de fichier)

Le format de fichier extensible NEXUS est largement utilisé en bio-informatique. Ces fichiers stockent des informations concernant les taxons, les caractères morphologiques et moléculaires, les distances, les codes génétiques, les estimations, arbres, etc.[1] Plusieurs programmes phylogénétiques populaires comme PAUP*[2], MrBayes,[3] Mesquite,[4] MacClade[5] et SplitsTree[6] utilisent ce format. Rajoutons aussi les analyses de délimitation par Poisson Tree Process (arbres produits selon des lois de Poisson)[7].

Pour les articles homonymes, voir Nexus.

Nexus (format de fichier)
Caractéristiques
Extensions
.nex, .nxs, .nxz
Type MIME
application/octet-stream
Signature
20 73 78 4E (hexa)
Développé par
Istituto di Scienza e Tecnologie dell'Informazione (en), Conseil national de la recherche

Suivre ce lien pour un convertisseur de formats d'écriture de distances par paire de bases.

Syntaxe

Un fichier NEXUS est constitué d'un en-tête fixe #NEXUS suivi de multiple blocs. Chaque bloc commence par BEGIN block_name; et se finis par END;. Les mots-clés sont insensible à la casse. Les commentaires sont mis entre crochets [...]​[8].

Il y a quelques noms de blocs prédéfinis pour les types de data les plus communs. Par exemple[8]:

TAXA block
Le "TAXA block" contient des informations concernant les taxons.
DATA block
Le "DATA block" contient les matrices de data (ex: alignement de séquence).
TREES block
Le "TREES block" contient des arbres phylogénétiques décrits en utilisant le format Newick, e.g. ((A,B),C);:

Les exemples suivants utilisent les trois types de blocs ci-dessus:

#NEXUS
Begin TAXA;
  Dimensions ntax=4;
  TaxLabels SpaceDog SpaceCat SpaceOrc SpaceElf
End;

Begin data;
  Dimensions nchar=15;
  Format datatype=dna missing=? gap=- matchchar=.;
  Matrix
    [ Quand une position est un "matchchar", ça veut dire qu'elle est similaire que la première entrée à la même position. ]
    SpaceDog   atgctagctagctcg
    SpaceCat   ......??...-.a.
    SpaceOrc   ...t.......-.g. [ pareil que atgttagctag-tgg ]
    SpaceElf   ...t.......-.a.           
  ;
End;

BEGIN TREES;
  Tree tree1 = (((SpaceDog,SpaceCat),SpaceOrc,SpaceElf);
END;

Références

  1. Maddison DR, Swofford DL, Maddison WP, « NEXUS: An extensible file format for systematic information », Systematic Biology, vol. 46, no 4, , p. 590–621 (PMID 11975335, DOI 10.1093/sysbio/46.4.590)
  2. PAUP* « https://web.archive.org/web/20060903115314/http://paup.csit.fsu.edu/index.html »(Archive.orgWikiwixArchive.isGoogle • Que faire ?), Phylogenetic Analysis Using Parsimony *and other methods
  3. MrBayes
  4. Mesquite: A modular system for evolutionary analysis
  5. MacClade
  6. Huson and Bryant, Application of Phylogenetic Networks in Evolutionary Studies, Mol Biol Evol (2005) 23 (2): 254-267. https://doi.org/10.1093/molbev/msj030
  7. « bPTP server: a Bayesian implementation of the PTP model for species delimitation »
  8. Detailed NEXUS specification

Liens externes

  • Portail de l’informatique
  • Portail de la biologie
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.