rsync
rsync remote synchronization, en français : « synchronisation distante » est un logiciel libre de synchronisation de fichiers, distribué sous licence GNU GPL. La synchronisation est unidirectionnelle, c'est-à-dire qu'elle copie les fichiers de la source en direction de la destination. rsync est donc utilisé pour réaliser des sauvegardes incrémentielles ou différentielles ou pour diffuser le contenu d'un répertoire de référence.
Développé par | Andrew Tridgell, Paul Mackerras |
---|---|
Première version | |
Dernière version | 3.2.5 ()[1] |
Version avancée |
3.2.1pre1 ()[2] 3.2.2pre1 ()[3] 3.2.2pre2 ()[4] 3.2.2pre3 ()[5] 3.2.3pre1 ()[6] |
Dépôt | github.com/WayneD/rsync |
Écrit en | C |
Système d'exploitation | Type Unix |
Environnement | Type Unix |
Type |
Logiciel utilitaire Protocole réseau Differential backup (en) Transmission de données |
Licence | Licence publique générale GNU version 3 ou ultérieure (d) |
Site web | rsync.samba.org |
rsync fonctionne sur une large gamme de systèmes d'exploitation (Microsoft Windows, GNU/Linux, Mac OS X, Unix), permettant ainsi de synchroniser des fichiers de différents systèmes d'exploitation.
Détails
rsync est similaire à rcp d'Unix, mais possède de nombreuses options supplémentaires. Il utilise un protocole de mise à jour à distance plus efficace afin d'accélérer significativement le transfert de fichiers lorsque le fichier de destination existe déjà.
Le protocole de mise à jour à distance rsync lui permet de ne transférer que la différence entre deux jeux de fichiers à travers le réseau, en utilisant un algorithme de recherche de somme de contrôle. Ce protocole établit ses connexions sur le port TCP 873 par défaut.
La synchronisation fonctionne selon deux modalités :
- en mode local (sur le même système de fichiers ou sur un répertoire réseau monté en local): le programme client se charge de comparer les deux versions des répertoires et effectuer la synchronisation ;
- en mode distant : le programme client contacte le programme serveur, habituellement grâce au protocole SSH, ce qui permet une communication sécurisée à travers le réseau.
Une version est disponible sous MS Windows utilisant la bibliothèque Cygwin, nommée cwRsync[7]. Il s'agit d'une « combinaison » de Cygwin et de rsync.
Historique
rsync a été développé par Andrew Tridgell grâce à ses travaux sur rzip, un algorithme de compression « longue distance » (très efficace car capable de repérer les redondances dans des gros fichiers).
Algorithme
Rsync utilise un algorithme créé par Andrew Tridgell permettant de transmettre efficacement une structure de données (telle qu'un fichier) à travers un réseau de communication lorsque l'ordinateur récepteur possède déjà une version différente de la même structure de données.
L'ordinateur destinataire découpe sa propre version du fichier en morceaux ne se chevauchant pas, de taille S, et calcule deux sommes de contrôle pour chacun des morceaux : une somme MD4 et une somme plus faible de « fonctionnement ». Il envoie ces sommes de contrôle à l'ordinateur source. La version 3.0 du protocole (présente dans la version 3.0 du logiciel RSync) utilise à présent l'algorithme MD5 en lieu et place de MD4.
L'ordinateur source calcule la somme de fonctionnement pour chacun des morceaux de taille S dans sa propre version du fichier, même pour des morceaux se chevauchant. Ceci peut être effectué efficacement du fait d'une propriété spéciale de la somme de fonctionnement : si la somme de fonctionnement allant des octets n à n+S-1 est R, la somme de fonctionnement des octets n+1 à n+S peut être calculée grâce à R, l'octet n et l'octet n+S sans avoir à examiner les octets intermédiaires. Ainsi si l'on connaît déjà la somme de fonctionnement des octets 1 à 25, l'on peut aisément obtenir la somme de fonctionnement des octets 2 à 26 à partir de la somme précédente.
La somme de fonctionnement utilisée est basée sur la fonction adler-32 de Mark Adler, utilisée dans la zlib et se basant elle-même sur la somme de contrôle de Fletcher. La source compare alors sa somme de fonctionnement avec celle envoyée par le destinataire pour vérifier s'il y a des similitudes. Pour chaque similitude, la source calcule le hachage (hash md4 ou md5) pour le bloc correspondant en le comparant avec le hachage pour ce bloc envoyé par le destinataire. La source envoie par la suite au destinataire les morceaux de fichiers pour lesquels il y a des différences de données, en même temps que l'information nécessaire à l'intégration de ces morceaux dans le fichier incomplet du destinataire. Toutefois, à cause d'éventuelles collisions des données des hash md5 et ou de la somme de fonctionnement, il demeure une faible probabilité pour que des différences entre la source et le destinataire ne soient pas détectées et de ce fait demeurent incorrectes. Sur 128 bits pour MD5 plus 32 pour la somme de fonctionnement, et en considérant l'entropie maximale de ces bits, la possibilité d'une collision de somme de contrôle en combinant les deux sommes (MD5 et de Fonctionnement) est de 2-(128+32) = 2-160 . En pratique, la probabilité est quelquefois supérieure, puisque de bonnes sommes de contrôle approchent l'entropie de sortie maximale.
Si les versions de fichier de la source et du destinataire ont plusieurs sections communes, il n'y a besoin d'envoyer que peu de détails pour synchroniser les fichiers.
Même si son algorithme forme le cœur de l'application Rsync qui optimise grandement les transferts entre deux ordinateurs reliées par un réseau TCP/IP, l'application RSync intègre d'autres éléments clés qui aident de manière significative au transfert de données et à la sauvegarde. On peut citer la compression et décompression de données bloc par bloc en utilisant zlib du côté source ou destination, et le support de protocoles tels que ssh permettant la transmission chiffrée de données différentielles compressées. En définitive, Rsync permet de limiter la bande passante consommée durant un transfert.
Applications Rsync
Nom | GNU/Linux | Mac OS | Windows | Commentaire | Licence libre |
---|---|---|---|---|---|
luckyBackup | Oui | Oui | Non | Oui | |
GADMIN RSYNC | Oui | Non | Non | Oui | |
Grsync | Oui | Oui | Oui | Interface graphique pour rsync | Oui |
QtdSync (en) | Oui | Non | Oui | Oui | |
DeltaCopy | Non | Non | Oui | Oui[8] | |
Yintersync | Non | Non | Oui | ? | |
HardlinkBackup | Non | Non | Oui | Client uniquement | Non |
Syncrify | Oui | Non | Oui | Non | |
Backuplist+ | Non | Oui | Non | ? | |
Rclone | Oui | Oui | Oui | Ligne de commande pour de nombreux services de stockage en ligne | Oui |
RipCord Backup | Non | Oui | Non | ? | |
RsyncX | Non | Oui | Non | ? | |
arRsync | Non | Oui | Non | Oui | |
Duplicati | Oui | Oui | Oui | Oui | |
Unison | Oui | Oui | Oui | Bidirectionnel | GPL |
Notes et références
- « NEWS for rsync 3.2.5 », (consulté le )
- « https://git.samba.org/rsync.git/?p=rsync.git;a=tag;h=aecb880fa1a6dddda1db4f10b9de2876ab9284ab »
- « https://git.samba.org/rsync.git/?p=rsync.git;a=tag;h=6d58bc7622b76471e988638a5e0f159e98c7d626 »
- « https://git.samba.org/rsync.git/?p=rsync.git;a=tag;h=10734e28e88a0800cf593148bb58973b57b3aa6c »
- « https://git.samba.org/rsync.git/?p=rsync.git;a=tag;h=06c52aad7d12fbbcfde75623a1f28eddf3eceb53 »
- « https://git.samba.org/rsync.git/?p=rsync.git;a=tag;h=c6574a7fb49cecd5f7fef40835200efec7febc7c »
- cwRsync
- DeltaCopy - Rsync for Windows, 20 juillet 2011.
Voir aussi
Articles connexes
Liens externes
- (en) Site officiel
- (en) A Java Rsync Gui : Sisyphe
- Portail de l’informatique
- Portail des logiciels libres