Document numérique
Un document numérique est une forme de représentation de l'information consultable à l'écran d'un appareil électronique. L’affichage de ce type de document peut être apparenté soit au « document » même, ou soit à l’interface logicielle. Suivant l'intervention d'applications informatiques dans une partie de son contenu (bases de données, POO), les changements dans l'organisation logique de ses données peuvent être apportés. À l'inverse du document sur papier, qu'il soit manuscrit ou imprimé, le document numérique permet de séparer la présentation (les techniques de mise en page) de l'information (composition de texte, données). Des multimédias (image fixe ou animée, vidéo, son) peuvent être insérés à l’intérieur du document numérique. Sa technique de production et de communication se résume en quatre grandes familles de logiciels : les outils de traitement de texte, les tableurs, les logiciels de courriel, les logiciels de gestion documentaire.
Historique
Deux sources au document numérique peuvent être trouvées dans l'histoire. D'une part, la présentation du document numérique à l’écran évoque souvent chez certains chercheurs une association aux tablettes sumériennes en argile (3400-3200 av. J.-C.)[réf. nécessaire]. La manière de faire défiler le texte est semblable à la lecture d’un manuscrit enroulé. Naturellement, comme tout dispositif socio-technique, le document numérique s’inscrit dans la perspective d'un mode de communication rattaché à son support. D'autre part, la partie invisible du document, c’est-à-dire le codage de l'information, renvoie à l’étymologie du mot « numérique ». Apparu en 1616, il provient du latin numerus « qui a rapport aux nombres, qui appartient aux nombres » [1]. Certes, à cette époque, le codage de l'information n'était pas encore envisagé et les langages de description et d'encodage n'étaient pas non plus inventés.
Le document numérique commence à émerger avec le traitement de texte et, plus précisément, dans le domaine de la bureautique. Avant qu’il ne soit purement informatique, il a été mécanographique ou microphotographique. Bien des projets consistaient d’abord à automatiser le processus d’enregistrement de l’information visuelle ou sonore de façon analogue. Plus tard, les chercheurs voudront établir des relations entre cette automatisation et les idées produites par la matière grise[réf. nécessaire].
C’est le 9 avril 1860, soit 17 ans avant le phonogramme d'Edison et 28 ans avant le premier enregistrement connu, celui d'un oratorio de Haendel sur un rouleau de cire[2], qu’un Français, Édouard-Léon Scott de Martinville, décide de mettre en œuvre l'ambitieux projet de noter visuellement le son de la chanson Au clair de la Lune. Effectué à l’aide d’un appareil phonautographe qui contenait une bande de papier recouverte de noir de fumée, fixée sur un cylindre en rotation lente[3]. Au XXe siècle, d’autres projets d’automatisation de l’information ont été entrepris par Paul Otlet (1934) et Vannevar Bush (1945), mais n’ont jamais vu le jour.
En 1963,Theodor Nelson[4] invente le terme Hypertext, synonyme d’hypermédia. Par le biais du réseau électronique, le contenu du document numérique, textuel ou non, pourra être désormais affiché à l’écran. Des travaux de Douglas Engelbart sur l’interactivité, les interfaces au SRI (Stanford Research Institute) contribuent au développement des Systèmes hypertextuels. Dans les années 1970-1980, l’arrivée de la microinformatique facilite dans les bureaux le traitement de texte. Le principe d’affichage du document à l’écran ainsi que son obtention telle que vue directement sur l'ordinateur lors de l’impression est nommé wysiwyg. Dès les années 1980, le document structuré voit le jour. Il se dote de nouvelles caractéristiques : l’interactivité, l’insertion de nouveaux modes de communication dans les documents (images, sons, etc.) ainsi que l’emploi de balises. En 1984, le logiciel conçu pour Macintosh Hypercard démocratise le concept d’hypertexte. L’arrivée du Web (1989, Tim Berners-Lee, Genève) marquera pour le document numérique une ère nouvelle de plus en plus interactive et hybride, propre à décrire son contenu (titres, paragraphes, disposition des images) et à y inclure des hyperliens grâce aux langages HTML et XHTML. Actuellement, les documents en réseau se produisent avec un langage dynamique et sont reliés à une base de données dont le contenu peut varier.
Concept
Le document numérique incite à réfléchir sur le concept du document à proprement parler. C’est un objet, du point de vue rhétorique, aux caractéristiques mouvantes. En quelque sorte, les dispositifs techniques ont effacé le côté rhétorique en insistant davantage sur le côté technique de l’usage. Les outils d’interaction permettent alors de consulter les documents numériques (les premiers sites d’Internet, notamment) sur tout type de plate-forme avec n’importe quel navigateur. Jean-Michel Salaün insiste sur la triple dimension de la structure de ce type de document « à partir des caractéristiques matérielles, intellectuelles et mémorielles négociées »[5]. En effet, si le document sur un support papier est, en quelque sorte, la gravure de notre pensée et, par conséquent, de notre passé, il va de soi que le document numérique que l'on peut modifier à n'importe quel moment serait plutôt le reflet d'une constante évolution de la réflexion. Les traces ou les données qui s'enregistrent derrière une information d'un dispositif technique créent des liens entre la rédaction dans le passé et la rédaction dans le présent en nous orientant vers le futur.
Au passage, notons les différentes versions du terme document numérique et des métaphores qui l'entourent. Par exemple, Jean-Michel Salaün, professeur à l’École Normale Supérieure de Lyon, dans son ouvrage Vu Lu Su. Les architectes de l'information face à l'oligopole du Web définit ce type de document comme un « néodocument ». Dans le même temps, remarquons que Dominique Cotte, dans son article Le concept de "document numérique", considère qu'un « objet numérique est un objet qui ne dit pas son nom »[6]. Il poursuit en disant qu' « il serait plus juste de parler d'objet informatique ou plus exactement d'électronique, car il relève d'une technologie qui repose sur une organisation binaire : le passage ou non du courant électrique »[6].
Selon le contexte, il existe également plusieurs adjectifs antonymes de numérique : document imprimé, document manuscrit, document matériel ou matérialisé. L'emploi du substantif papier comme adjectif est réprouvé par les autorités linguistiques francophones (Académie française, Office québécois de la langue française, notamment). « Dire ou écrire "un document papier", "un dossier papier" relève d'une connaissance défaillante de la langue française et d'une façon de s'exprimer tout à fait infantile »[7]. En cas de doute sur l'antonyme précis de l'adjectif numérique, il convient de former correctement le complément de nom : un document numérique s'oppose à un document sur papier. On peut aussi se souvenir de l'existence des mots manuscrit et imprimé, et les employer aussi bien comme adjectifs (« le document imprimé et le document numérique ») que comme substantifs (« remettez-moi l'imprimé et le manuscrit »). En ingénierie et en architecture, on ne doit pas parler de plans papier ni même de plans sur papier mais de tirages de plans.
Les principales différences avec le document sur papier
Au début de son évolution, le document numérique était une adaptation du document imprimé. Il était tout de même évident que le document numérique exigeait une procédure plus détaillée du découpage de l’information pour la structuration et la mise en relief de l’information sur l’écran. Dans cette optique, le lecteur se place au centre de la conception des documents numériques; l'introduction de la dimension humaine contribuera au processus cognitif de stockage et de traitement de l’information, permettant du coup de faire progresser la maintenance du système. L’usage du document numérique s’inscrit dans un contexte différent de celui des spécialistes; il peut également servir d'outil pour l'apprentissage ou le divertissement. À l’ère du Web 2.0 l’existence du document sur papier peut ainsi être remis en question: les différences avec son homologue sont explicites et peuvent être analysées selon quatre points de vue l'immatérialité, le traitement cognitif, la perception physiologique, l'usage.
L'immatérialité
Le premier aspect matériel concerne la nature du support du document numérique, à savoir son immatérialité. Affiché sur l’écran, présenté par l’intermédiaire d’un dispositif technique, il s'agit d'un document immatériel virtuel et indépendant du dispositif matériel d’affichage. L’affichage du document peut toutefois être considéré comme matériel lorsqu’il est sauvegardé sur un support de stockage. Or, sur les supports d’enregistrement, les signes qui imposent le formatage ne sont pas directement visibles ni lisibles (code binaire : 0 ou 1) et leur existence est donc virtuelle si le dispositif de décodage est absent. Sous forme numérique, l'information offre divers avantages pour une multiplication des traitements et des transmissions de données en réseau de façon immédiate.
Le traitement cognitif
Afin de mieux représenter la structure du document, ce dernier est soumis à un traitement cognitif qui consiste à indiquer son volume, à localiser l’endroit où se trouve le lecteur et à assurer la bonne navigation à l’intérieur du document. Le processus de production du document numérique est contraint à divers aspects techniques, matériels ou logiciels, d’où la nécessité pour le concepteur de connaître un langage (auteur pour les cédéroms, HTML pour les sites Web). Les commanditaires, à leur tour, utilisent des assistants pour créer des documents numériques formatés en fonction de styles graphiques proposés. Par conséquent, il s’avère indispensable de maîtriser techniquement un outil d’écriture ou de lecture.
La perception physiologique
La perception physiologique dépend de la lisibilité et la visibilité de l’information ainsi que du confort postural. Certaines polices sont plus faciles à lire que d’autres. L’ouverture du document numérique ne demande aucun effort physique, ni de la part de la machine, ni de l’utilisateur. Par contre, les questions d’éclairage, de scintillement, de l’instabilité de l’image, de la bonne qualité d’affichage peuvent poser quelques éventuels problèmes au lecteur.
L'usage
De nouveaux dispositifs numériques imposent de nouvelles pratiques des usagers. Ainsi, les gestes du lecteur confronté au contact matériel direct avec le document sur papier ou à l’immatérialité du document numérique sont différents. Les producteurs du document numérique étaient à l'origine, plus généralement, des spécialistes (graphistes, responsables du contenu, programmateurs). La manière de lire des informations sur les deux supports est également différente. À cause des fonctions séquentielles propres à l’écran, c’est une lecture de découpage ou de montage qui correspond davantage à l’information incluse dans le document numérique.
Qui plus est, la possibilité du transfert des documents via les réseaux rend immédiate leur consultation dans différents lieux, si bien qu'ils deviennent modifiables à distance. Ainsi, le numérique apporte des formes de sociabilités nouvelles[8] : cette transformation permet l'ouverture sociale du document[9]. Mais la stabilité du support se perd[10] : la question de la fiabilité, de la stabilité et de la pérennité du document se pose (fake news, transformation des données, documents en construction) et cela amène à une remise en question du document devenu hybride. Les pratiques informationnelles s’hybrident également : elles sont à la fois formelles (dans un cadre scolaire, professionnel) et informelles (avec les réseaux sociaux, les activités de loisirs, etc.). Des formations se mettent en place dans différents contextes, notamment scolaire (EMI)[11].
Supports de diffusion
L'enregistrement digital de l'information facilite le développement de la numérisation et la multiplication des documents numériques. Les supports de haute densité capables d'enregistrer des données binaires exigent de plus en plus de perfectionnement.
Les disques optiques
À la suite de l'apparition du compact disc audio, l'accès à l'information est devenu plus direct qu'à l'époque des bandes magnétiques. La duplication du CD-ROM et du DVD est également plus simple, ce qui a favorisé leur grande diffusion. Or, beaucoup de supports optiques ont déjà disparu, tels le vidéodisque, le CDX-A, le CD-I (compact disc interactif), le CD-ROM X3 (Data Discman de Sony). L'évolution de ce type de supports a été souvent confrontée aux questions de compatibilité et de pérennité dans les systèmes d'informations. Les premiers CD-ROM ont maintenant quinze ans et sont en bon état de conservation, mais leur développement s'est fait sous MS-DOS[12]. Autres types de disques : Le Century Disc, Le Blu-ray Disc, le HVD (holographic versatile disc), le Forward Versatile Disc (FVD), l'EVD (enhanced versatile disc). Leurs principales différences concernent la capacité de stockage.
Le livre électronique
Les livres numériques ou E-book peuvent avoir deux formes d'affichage: sur les liseuses, smartphones ou tablettes tactiles et sur les sites Web. Depuis 20 ans, le livre électronique ne cesse d'évoluer : du mini-CD, fabriqué par le Data Discman de Sony en 1992, en passant par le Sigma Book de Matsushita (2004) et jusqu'à l'application iBooks conçue et développée par Apple pour la tablette tactile iPad (2010), dont le design graphique est semblable à celui de la vraie bibliothèque.
Ces supports posent de nombreuses questions qui nous renvoient aux domaines d'identification, de conservation, de congruence économique et éditoriale. Selon Brigitte Juanals, maître de conférence HDR en SIC qui a soutenu une thèse intitulée Mutations de l'accès à l'information, du livre aux dispositifs hypermédias en réseau sur l'internet, « l'empreinte de la technique a profondément évolué dans le passage du livre imprimé aux dispositifs informatisés. Sur des supports induisant des cultures techniques différentes (la culture du livre et la culture informatique), ce sont les modes de pensée qui changent »[13].
Wikis et blogs
Les outils d'écriture collective, dont les plus connus sont l'encyclopédie ouverte Wikipédia et les carnets de notes collectifs ou personnels nommés blogs, illustrent le principe de la publication libre et accessible des documents numériques au plus grand nombre. Les documents numériques sur ces supports viennent poser la question de plus en plus ambiguë de « ce qu'est l'édition », car il n'est jamais clair s'il s'agit d'édition, d'auto-édition, de simple publication, etc. Le statut éditorial de ces ouvrages est de la sorte souvent moins clair et défini que pour le livre électronique, qui passe souvent soit par une maison d'édition, soit par des plateformes d'auto-édition (ce qui contribue à en clarifier le statut).
Les problèmes de compatibilité de formats
L'utilisation de documents électroniques à la place des documents sur papier pose de multiples problèmes de compatibilité entre formats de fichiers, dont les fichiers texte ne sont pas exempts.
Les sources les plus typiques d’incompatibilités entre fichiers textuels sont l’existence de plusieurs conventions pour les fins de lignes (liées à des systèmes d’exploitation concurrents) et surtout la multiplication des normes de codage des caractères (liée à la multitude des langues humaines et des efforts, nationaux ou internationaux, pour les représenter informatiquement). Les difficultés que causent ce dernier point tendent cependant à s’estomper depuis les années 2000, du fait de l’adoption lente des normes de codage universel Unicode (notamment UTF-16 et UTF-8).
D’autres difficultés sont liées aux formats de fichiers complexes de différents traitements de texte, tableurs et éditeurs graphiques. Pour les contourner, beaucoup de sociétés de logiciels distribuent des visualiseurs libres pour leurs formats de fichiers propriétaires (par exemple Adobe Reader pour lire les fichiers PDF). L'autre solution est le développement de formats de fichiers normalisés non-propriétaires (comme HTML, SGML, et XML) ; et la création de documents électroniques pour des utilisations spécifiques avec des formats spécialisés (par exemple, les articles électroniques spécialisés en physique utilisent TeX ou PostScript).
Contenu
Le champ de la conception du document a été étudié par de nombreuses disciplines telles que l'analyse littéraire, la sémiologie, les sciences de l'information et de la communication. Dans ce contexte se posent des questions sur le texte, le signe, l'information et le document même; le document numérique propose une véritable révolution de la manière de penser le texte.
Les évolutions liées à la dématérialisation
À l'origine, toutes les données figuraient sur des supports physiques (sur papier). Ensuite, les premières phases d'informatisation (grands systèmes) ont conduit à des documents électroniques internes aux entreprises. Les données de sortie finales étaient toujours sur papier, et les échanges de documents entre clients et fournisseurs se faisaient également sous cette forme.
Les technologies d'affichage sont aussi soumises au progrès ce qui permet, à l'égard de la consultation des documents à l'écran, d'assurer une bonne ergonomie et ce qui offre davantage de facilité pour leurs envois électroniques. En ce qui concerne l'industrie du papier, on gagne, incontestablement, de l'espace au niveau du stockage des copies imprimées. Cependant, l'utilisation massive de documents numériques n'empêche pas l'utilité et l’utilisation des documents papier. Paradoxalement, les nouvelles technologies de la communication ont contribué à accroître leur nombre étant donné que l’informatique engendre un besoin croissant d’impression[14].
Conservation
Le document numérique en tant qu'ensemble d'unités de l'information est susceptible d'être codé et, par conséquent, permet la préservation à long terme. La possibilité de sauvegarde rapide et de conservation ergonomique des documents numériques facilite les pratiques de plusieurs institutions telles que les bibliothèques ou les musées. En revanche, une accumulation de documents numériques nécessite une gestion compétente des collections et des images supposées être numérisées. Qui plus est, ce progrès technologique engage les institutions à développer leurs réseaux internes et, par conséquent, à mettre en place des catalogues électroniques et des outils intranets.
Les procédures d'extraction du sens ou de langages documentaires destinés à décrire le contenu des documents ont été inventées afin de pallier les contraintes liées aux questions de volume des documents et à favoriser ainsi la recherche rapide des informations. La recherche sur Internet en est un exemple : les liens obtenus présentent des documents de sources variées. Toutefois, la rapidité d’accès pose quelques problèmes, comme ceux de l'identification de l'auteur et de la fiabilité des informations obtenues.
Le grand avantage du processus de stockage du document numérique consiste à pouvoir sauvegarder toute nature de son contenu (sons, textes, images). Néanmoins, si les technologies actuelles de numérisation ou d'enregistrement de documents assurent la pérennité aux supports de stockage, nous ne savons rien sur la pérennité des matériels et des logiciels qui permettent d'accéder à ces supports. Tant que les logiciels existent, il demeure possible d'avoir accès aux fichiers; néanmoins, si le logiciel disparaît, il y a possibilité qu'à long terme nous ne puissions plus avoir accès aux documents, car ils ne seront plus pris en charge.
Notes et références
- Étymologie du mot « numérique », Sermons du P. Coton dans R. Philol. fr., t. 44, p. 76-77
- Benoît Habert, Construire ensemble des mémoires numériques durables : l'archivage numérique pérenne. In « Document numérique, entre permanence et mutations », Paris, Utopia, 2010, p. 5.
- L'article détaillé ici
- « Ted » Nelson, philosophe et autodidacte en informatique à l’université Harvard. Il est l’auteur des termes Hypertext, Linktext et Jumptext ou Zapwrite.
- Jean-Michel Salaün, Vu, Lu, Su. Les architectes de l'information face à l'oligopole du Web, La Découverte, Paris, 2012, p. 58
- Cotte Dominique. Le concept de "document numérique". In: Communication et langages. no 140, 2e trimestre 2004, p. 31-41 (lire en ligne)
- Banque de dépannage linguistique de l'Office québécois de la langue française
- Anne Cordier, « Quand le document fait société », Communication & langages, no 199, , p. 21 à 35 (lire en ligne)
- Dominique Cotte, « La « fabrique du document » à l’assaut des métiers », Les Enjeux de l’Information et de la Communication, vol. n°18, no 2, , p. 9 à 17 (lire en ligne)
- Manuel Zacklad, « Processus de documentarisation dans les documents pour l’action (DopA) », in Le Numérique : impact sur le cycle de vie du document, Savard R. (dir.), 13-15 octobre 2004, Montréal, Lyon, École nationale supérieure des sciences de l’information et des bibliothèques URL : http://www.enssib.fr/bibliotheque-numerique/documents/1209-processus-de-documentation-dansles-documents-pour-l-action-dopa.pdf
- Anne Lehmans et Vincent Liquète, « Le document dans une pragmatique sociale de l’information », Communication & langages, vol. n° 199, no 1, , p. 115 à 129 (lire en ligne)
- Jacques Chaumier, Document et numérisation, Enjeux techniques, économiques, culturels et sociaux, Paris, ADBS éditions, 2006, p. 27.
- Brigitte Juanals, « Introduction », Communication et langages (ISSN 1778-7459), no 145, septembre 2005, p. 37-45 (lire en ligne)
- Évolution de la consommation de papier - lepapier.fr
Annexes
Bibliographie
- Jean-Philippe Accart et Alexis Rivier, Mémento de l’information numérique, Paris, Electre – Editions du Cercle de la Librairie, coll. « Bibliothèques », 2012 (ISBN 978-2-7654-1332-5)
- Jacques André et Marie-Anne Chabin (coord.), Les documents anciens, Paris, Hermès, 1999 (ISBN 2-7462-0087-2)
- Lionel Barbe, « Wikipédia et Agoravox : des nouveaux modèles éditoriaux ? », dans Ghislaine Charton et Evelyne Broudoux (coord.), Document numérique et Société : actes de la Conférence organisée dans le cadre de la semaine du Document numérique à Fribourg (Suisse) les 20-21 septembre 2006, Paris, ADBS Éditions, 2006 (ISBN 2-84365-089-5), p. 50-65 [Disponible en ligne].
- Mostapha Bellafkih, Joël Gardes, Mohamed Ramdani et Khaldoun Zreik (dir.), Le « Document » à l’ère de la différenciation numérique : Actes du 14e Colloque international sur le Document électronique, Paris, Europia, 2012 (ISBN 979-10-90094-07-9)
- Jacques Chaumier, Document et numérisation : enjeux techniques, économiques, culturels et sociaux, Paris, ADBS Éditions, 2006 (ISBN 2-84365-080-1)
- Viviane Couzinet (dir.), Dispositifs info-communicationnels : questions de médiations documentaires, Paris, Hermes Science Publications, coll. « Systèmes d'information et organisations documentaires », 2009 (ISBN 978-2-7462-2287-8)
- Stéphane Caro Dambreville, L’écriture des documents numériques : approche ergonomique, Paris, Hermes Science Publications, coll. « Ingénierie représentationnelle et constructions de sens », 2007 (ISBN 978-2-7462-1666-2)
- Benoît Habert, « Construire ensemble des mémoires numériques durables : l’archivage numérique pérenne », dans Madjid Ihadjadene, Manuel Zacklad et Khaldoun Zreik (dir.), Document numérique entre permanence et mutations : actes du 13e Colloque international sur le document électronique (CIDE 13), 16-17 décembre 2010, INHA, Paris, Paris, Europia, 2010 (ISBN 978-2-909285-67-2), p. 5–24
- Brigitte Juanals, « Introduction », Communication et langages (ISSN 1778-7459), no 145, septembre 2005, p. 37-45 [lire en ligne]
- Marie-France Lebert, De l’imprimé à l’internet, Paris, Éditions 00h00, 1999 (ISBN 2-7454-0192-0)
- Louise Merzeau, « Du signe à la trace : l’information sur mesure », Hermès, la revue (ISSN 0767-9513), no 53 : Traçabilité et réseaux, 2009, p. 23-29 [lire en ligne]
- Roger T. Pédauque, Le Document à la lumière du numérique, Caen, C&F éditions, 2006 (ISBN 2-915825-04-1)
- Christian Rossi, « De la diffusion à la conservation des documents numériques », Cahiers GUTenberg (ISSN 1140-9304), no 49, octobre 2007, p. 47-61 [lire en ligne]
Articles connexes
- Gestion électronique des documents
- Dématérialisation
- Papier électronique
- Langage de programmation
- Donnée (statistique)
- Bases de données
- Sciences de l'information et de la communication
- Publication numérique
- Lecture sur écran
- Portail de l’informatique
- Sciences de l’information et bibliothèques
- Portail de l’édition numérique