dd (Unix)

dd est une commande unix permettant de copier un fichier – avec ou sans conversion(s) au passage – en ne sélectionnant qu'une partie de données à copier. Il est particulièrement adapté à la copie sur des périphériques blocs tel que des disques durs ou des lecteurs CD-ROM.

Pour les articles homonymes, voir DD.

Dd

Informations
Type Utilitaire UNIX (d)

Origine du nom

Plusieurs théories existent pour justifier le nom de cette commande.

L'une dit que l'on voulait nommer cette commande cc pour « Copy and Convert », mais ce nom de commande étant déjà utilisée par le compilateur C, on a utilisé la lettre suivante de l'alphabet.

Selon le manuel d'utilisation de certaines distributions Unix, ce serait l'acronyme de « data dump » ou ddtank.

Selon la page anglophone de Wikipedia sur dd, ce nom viendrait de « dataset definition » et serait une commande de l'IBM JCL (donc antérieure à Unix et au langage C) qui aurait gardé la syntaxe de cette machine. Cependant l'indication JCL DD (qui s'écrivait au départ en majuscules, comme tout le JCL) ne faisait qu'associer un nom de fichier dans un programme à un nom de fichier dans le système de fichiers : elle ne constituait donc qu'une indication et nullement un ordre d'action.

Le rétroacronyme satirique « Data Destroyer » (destructeur de données) lui est parfois attribué, car une simple erreur de manipulation de cette commande sur un disque dur peut détruire irrémédiablement les données sans aucun avertissement.

Syntaxe

La syntaxe de dd est différente des autres commandes Unix traditionnelles : dd utilise des options de la forme option=valeur au lieu des habituelles -o valeur ou --option=valeur.

Les principales options de dd sont les suivantes :

  • if=fichier_entree (Input File) : lit ce fichier en entrée. Cela peut être aussi bien un fichier régulier qu'un périphérique de type bloc. Par défaut, c'est l'entrée standard qui est utilisée (par exemple le clavier) ;
  • of=fichier_sortie (Output File) : écrit dans ce fichier en sortie ;
  • bs=t_b (Block Size) : copie les données par blocs de t_b octets ;
  • count=n_b : ne copie que n_b blocs ;
  • skip=n_e : ignore les n_e premiers blocs du fichier d'entrée[1] (ne copie le fichier d'entrée qu'à partir du bloc de rang n_e + 1) ;
  • seek=n_s : ignore les n_s premiers blocs du fichier de sortie[1] (ne commence à écrire dans le fichier de sortie qu'à partir du bloc de rang n_s + 1) ;
  • ibs=n_o : fixe la taille des blocs d'entrée à n_o octets. Par défaut 512 octets ;
  • conv=t_c1,t_c2 : effectue une ou plusieurs conversions des types t_c1, t_c2, etc. :
    • Par exemple, ascii convertit de l'EBCDIC (codage IBM) en ASCII,
    • ebcdic : ASCII vers EBCDIC,
    • ibm : EBCDIC vers ASCII avec les règles IBM,
    • swab : inverse les deux octets de chaque mot de 2 octets (swap bytes),
    • lcase : convertit en minuscules,
    • ucase : convertit en majuscules,
    • sync : complète les blocs d'entrée avec des zéros pour obtenir des blocs de ibs octets,
    • noerror : continue même s'il y a des erreurs ;
  • --help : message d'aide.

Particularité

Contrairement à des commandes comme cp, qui copient un fichier de façon « naïve » (lecture d'une partie du fichier sur un premier périphérique, puis copie sur le second, ce qui n'utilise pas la simultanéité et ralentit donc les opérations d'un facteur 2 environ), dd lance deux tâches asynchrones, d'une part de lecture et d'autre part d'écriture, assurant ainsi des copies environ deux fois plus rapides du fait de la simultanéité d'opération des deux périphériques concernés. Ce procédé ne fut introduit dans Windows qu'avec sa version 8 (2012).

Exemples

Il faut toujours faire attention lorsqu'on utilise dd. Le simple fait d'oublier une option ou d'échanger if et of peut avoir des conséquences désastreuses.

Pour créer une clé usb bootable à partir d'une image iso (/dev/sdX étant la clé non montée que l'on peut identifier avec la commande fdisk -l) :

dd if=le_nom_complet_du_fichier_iso of=/dev/sdX bs=1M; sync

Pour faire une image de sauvegarde d'un CD ou d'un DVD :

dd if=/dev/cdrom of=image-cd.iso

Pour formater une disquette à partir d'une image :

dd if=image-disquette.bin of=/dev/fd0

Pour découper un fichier en tranches de 100 Mio (pour cet usage, la commande split est cependant plus appropriée) :

dd bs=10K count=10K if=grosfichier of=grosfichier-part1
dd bs=10K count=10K skip=10K if=grosfichier of=grosfichier-part2
dd bs=10K count=10K skip=20K if=grosfichier of=grosfichier-part3
dd bs=10K count=10K skip=30K if=grosfichier of=grosfichier-part4
# et ainsi de suite

Pour faire une copie du MBR (table des partitions principales comprises) du disque hda :

dd if=/dev/hda of=full-mbr.bin bs=512 count=1

Pour détruire les données d'un disque dur hda en le remplissant de zéros (non-recommandé ; voir aussi la commande shred) :

dd if=/dev/zero of=/dev/hda

Pour inverser (échanger) chaque paire d'octets du fichier nuxi et écrire la sortie dans le fichier unix :

dd if=nuxi of=unix conv=swab

GNU ddrescue

GNU ddrescue est une alternative développée indépendamment de la commande UNIX dd, dont la particularité de ne pas s’arrêter lorsqu’une lecture échoue lui permet, entre autres, la récupération d’une partie d’un disque endommagé. Cette version est maintenue par le projet GNU[2]. Ddrescue recommande par ailleurs lzip (en) pour la compression des sauvegardes en raison de ses capacités de récupération de données, notamment lorsqu’il s’agit de fusionner plusieurs copies de sauvegarde. La combinaison ddrescue/lziprecover apparait également la meilleure option pour la récupération des données à partir de plusieurs sources.

Notes et références

  1. Linux en concentré Manuel de référence, Ellen Siever, Stephen Figgins & Aaron Weber, éditions O'Reilly ; 4e édition en français.
  2. (en) « GNU ddrescue », sur directory.fsf.org, FSF, .
  • Portail de l’informatique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.