dd (Unix)
dd
est une commande unix permettant de copier un fichier – avec ou sans conversion(s) au passage – en ne sélectionnant qu'une partie de données à copier. Il est particulièrement adapté à la copie sur des périphériques blocs tel que des disques durs ou des lecteurs CD-ROM.
Pour les articles homonymes, voir DD.
Origine du nom
Plusieurs théories existent pour justifier le nom de cette commande.
L'une dit que l'on voulait nommer cette commande cc
pour « Copy and Convert », mais ce nom de commande étant déjà utilisée par le compilateur C, on a utilisé la lettre suivante de l'alphabet.
Selon le manuel d'utilisation de certaines distributions Unix, ce serait l'acronyme de « data dump » ou ddtank.
Selon la page anglophone de Wikipedia sur dd
, ce nom viendrait de « dataset definition » et serait une commande de l'IBM JCL (donc antérieure à Unix et au langage C) qui aurait gardé la syntaxe de cette machine. Cependant l'indication JCL DD (qui s'écrivait au départ en majuscules, comme tout le JCL) ne faisait qu'associer un nom de fichier dans un programme à un nom de fichier dans le système de fichiers : elle ne constituait donc qu'une indication et nullement un ordre d'action.
Le rétroacronyme satirique « Data Destroyer » (destructeur de données) lui est parfois attribué, car une simple erreur de manipulation de cette commande sur un disque dur peut détruire irrémédiablement les données sans aucun avertissement.
Syntaxe
La syntaxe de dd
est différente des autres commandes Unix traditionnelles : dd
utilise des options de la forme option=valeur
au lieu des habituelles -o valeur
ou --option=valeur
.
Les principales options de dd
sont les suivantes :
if=fichier_entree
(Input File) : lit ce fichier en entrée. Cela peut être aussi bien un fichier régulier qu'un périphérique de type bloc. Par défaut, c'est l'entrée standard qui est utilisée (par exemple le clavier) ;of=fichier_sortie
(Output File) : écrit dans ce fichier en sortie ;bs=t_b
(Block Size) : copie les données par blocs det_b
octets ;count=n_b
: ne copie quen_b
blocs ;skip=n_e
: ignore lesn_e
premiers blocs du fichier d'entrée[1] (ne copie le fichier d'entrée qu'à partir du bloc de rangn_e
+ 1) ;seek=n_s
: ignore lesn_s
premiers blocs du fichier de sortie[1] (ne commence à écrire dans le fichier de sortie qu'à partir du bloc de rangn_s
+ 1) ;ibs=n_o
: fixe la taille des blocs d'entrée àn_o
octets. Par défaut 512 octets ;conv=t_c1,t_c2
: effectue une ou plusieurs conversions des typest_c1
,t_c2
, etc. :- Par exemple,
ascii
convertit de l'EBCDIC (codage IBM) en ASCII, ebcdic
: ASCII vers EBCDIC,ibm
: EBCDIC vers ASCII avec les règles IBM,swab
: inverse les deux octets de chaque mot de 2 octets (swap bytes),lcase
: convertit en minuscules,ucase
: convertit en majuscules,sync
: complète les blocs d'entrée avec des zéros pour obtenir des blocs deibs
octets,noerror
: continue même s'il y a des erreurs ;
- Par exemple,
--help
: message d'aide.
Particularité
Contrairement à des commandes comme cp
, qui copient un fichier de façon « naïve » (lecture d'une partie du fichier sur un premier périphérique, puis copie sur le second, ce qui n'utilise pas la simultanéité et ralentit donc les opérations d'un facteur 2 environ), dd
lance deux tâches asynchrones, d'une part de lecture et d'autre part d'écriture, assurant ainsi des copies environ deux fois plus rapides du fait de la simultanéité d'opération des deux périphériques concernés. Ce procédé ne fut introduit dans Windows qu'avec sa version 8 (2012).
Exemples
Il faut toujours faire attention lorsqu'on utilise dd
. Le simple fait d'oublier une option ou d'échanger if
et of
peut avoir des conséquences désastreuses.
Pour créer une clé usb bootable à partir d'une image iso (/dev/sdX étant la clé non montée que l'on peut identifier avec la commande fdisk -l) :
dd if=le_nom_complet_du_fichier_iso of=/dev/sdX bs=1M; sync
Pour faire une image de sauvegarde d'un CD ou d'un DVD :
dd if=/dev/cdrom of=image-cd.iso
Pour formater une disquette à partir d'une image :
dd if=image-disquette.bin of=/dev/fd0
Pour découper un fichier en tranches de 100 Mio (pour cet usage, la commande split
est cependant plus appropriée) :
dd bs=10K count=10K if=grosfichier of=grosfichier-part1
dd bs=10K count=10K skip=10K if=grosfichier of=grosfichier-part2
dd bs=10K count=10K skip=20K if=grosfichier of=grosfichier-part3
dd bs=10K count=10K skip=30K if=grosfichier of=grosfichier-part4
# et ainsi de suite
Pour faire une copie du MBR (table des partitions principales comprises) du disque hda :
dd if=/dev/hda of=full-mbr.bin bs=512 count=1
Pour détruire les données d'un disque dur hda en le remplissant de zéros (non-recommandé ; voir aussi la commande shred) :
dd if=/dev/zero of=/dev/hda
Pour inverser (échanger) chaque paire d'octets du fichier nuxi et écrire la sortie dans le fichier unix :
dd if=nuxi of=unix conv=swab
GNU ddrescue
GNU ddrescue est une alternative développée indépendamment de la commande UNIX dd
, dont la particularité de ne pas s’arrêter lorsqu’une lecture échoue lui permet, entre autres, la récupération d’une partie d’un disque endommagé. Cette version est maintenue par le projet GNU[2]. Ddrescue recommande par ailleurs lzip (en) pour la compression des sauvegardes en raison de ses capacités de récupération de données, notamment lorsqu’il s’agit de fusionner plusieurs copies de sauvegarde. La combinaison ddrescue/lziprecover apparait également la meilleure option pour la récupération des données à partir de plusieurs sources.
Notes et références
- Linux en concentré Manuel de référence, Ellen Siever, Stephen Figgins & Aaron Weber, éditions O'Reilly ; 4e édition en français.
- (en) « GNU ddrescue », sur directory.fsf.org, FSF, .
- Portail de l’informatique