PDF (siglas en inglés de Portable Document Format, 'formato de documento portátil') es un formato de almacenamiento para documentos digitales independientes de plataformas de software o hardware. Este formato es de tipo compuesto (imagen vectorial, mapa de bits y texto).
Portable Document Format | ||
---|---|---|
Desarrollador | ||
Adobe Systems | ||
https://www.iso.org/standard/75839.html y http://www.adobe.com/products/acrobat/adobepdf.html | ||
Información general | ||
Extensión de archivo |
.pdf | |
Tipo de MIME |
application/x-gzpdf | |
Type code |
'PDF ' | |
Uniform Type Identifier | com.adobe.pdf | |
Número mágico |
%PDF | |
Lanzamiento inicial | junio de 1993 | |
Tipo de formato | ||
Extendido de | PostScript | |
Estándar(es) | ISO/IEC 32000-1:2008 | |
Formato abierto | ||
Inicialmente desarrollado por la empresa Adobe Systems, fue oficialmente lanzado como un estándar abierto el 1 de julio de 2008 y publicado por la Organización Internacional de Estandarización (ISO) como ISO 32000-1.
Características del PDF
- Es multiplataforma, es decir, puede ser utilizado en los principales sistemas operativos (GNU/Linux, MacOS, Unix, Windows), sin que se modifique el aspecto ni la estructura del documento original.
- Puede contener cualquier combinación de texto, elementos multimedia como vídeos o sonido, elementos de hipertexto como vínculos y marcadores, enlaces y miniaturas de páginas.
- Los archivos PDF no pierden el formato con el envío a otros usuarios, como sí sucede cuando se envían documentos de texto (se desordenan las páginas, se desorganizan los párrafos, etc.).[1]
- Es uno de los formatos más extendidos en Internet para el intercambio de documentos. Por ello, es muy utilizado por empresas, gobiernos e instituciones educativas.
- Es una especificación abierta, para la que se han adaptado herramientas de software comercial como las suites ofimáticas Microsoft Office y WordPerfect Office y creado otras en software libre que permiten crear, visualizar o modificar documentos en formato PDF, como OpenOffice.org, LibreOffice y Calligra Suite así como sistemas de composición de textos (LaTeX u ConTeXt).
- Puede cifrarse para proteger su contenido e incluso firmarlo digitalmente.
- Un archivo PDF puede crearse desde varias aplicaciones exportando el archivo, como es el caso de OpenOffice.org, LibreOffice y Microsoft Office (a partir de la versión 2007, si se actualiza a SP2[2]).
- Puede generarse desde cualquier aplicación mediante la instalación de una «impresora virtual» en el sistema operativo, en caso de usar aplicaciones sin esa funcionalidad integrada.
- Es el estándar ISO (ISO 19005-1:2008) para ficheros contenedores de documentos electrónicos con vistas a su preservación de larga duración.[3]
- Los ficheros PDF son independientes del dispositivo, por lo que pueden imprimirse en una impresora matricial, de inyección de tinta, láser o en microfilme. Para la optimización de la impresión, se configuran las opciones apropiadas en la creación del fichero PDF.
Reseña histórica
Los archivos PDF[4], junto con las aplicaciones que podían ver y crear este tipo de documentos, comenzaron a desarrollarse a partir de 1991, y su adopción comercial y general era muy reducida. El software de las aplicaciones se distribuía como software de licencia privativa. En esa época el visor de documentos PDF estaba disponible de forma gratuita (freeware), pero no de forma libre.
Versiones del formato PDF
El formato de archivos PDF ha cambiado varias veces, relacionadas con las nuevas versiones de Acrobat que ha ido lanzando Adobe. Hasta el momento, se han publicado doce versiones de la especificación de archivos PDF:
Año | Versión de PDF | Versión de Adobe Acrobat |
---|---|---|
1993 | PDF 1.0 | Acrobat 1.0 |
1994 | PDF 1.1 | Acrobat 2.0 |
1996 | PDF 1.2 | Acrobat 3.0 |
1999 | PDF 1.3 | Acrobat 4.0 |
2001 | PDF 1.4 | Acrobat 5.0 |
2003 | PDF 1.5 | Acrobat 6.0 |
2005 | PDF 1.6 | Acrobat 7.0 |
2006 | PDF 1.7 | Acrobat 8.0 / ISO 32000 |
2008 | PDF 1.7, Adobe Extension Level 3 | Acrobat 9.0 |
2009 | PDF 1.7, Adobe Extension Level 5 | Acrobat 9.1 |
2009 | PDF 1.7, Adobe Extension Level 6 | Acrobat 9.1 |
2009 | PDF 1.7, Adobe Extension Level 8 | Acrobat X (10.0) |
Uso de los archivos PDF
Los archivos PDF se utilizan para almacenar documentos e información, interactivos y regulares, así como mapas, gráficos, catálogos, presentaciones y libros electrónicos.
Las versiones tempranas de los documentos PDF no tenían hipervínculos externos; por este motivo, su adopción en Internet era considerablemente reducida y no tenía mucha popularidad. En esos tiempos, eran comunes las conexiones lentas a Internet a través de módems telefónicos, y el tamaño de los documentos PDF era mucho más grande que otros tipos de documentos, como por ejemplo el texto simple (sin formato); por lo tanto, la banda ancha fue un factor clave para su aceptación en Internet. Además, ya existían otros tipos de documentos que le hacían fuerte competencia al tipo de documentos PDF, como por ejemplo, los documentos PostScript (.ps
), los cuales, en esos tiempos, eran considerablemente comunes.
Con el tiempo, el formato PDF fue adquiriendo popularidad de varias formas diferentes, como publicidad, hasta convertirse en un estándar de facto.[5] Este formato es visto como una “página digital” que está lista para imprimirse exactamente como se muestra en la pantalla, sin problemas de márgenes a la hora de imprimir, a diferencia de lo que sucede en otros formatos digitales de documento.
En los años recientes, han surgido varias aplicaciones lectoras de este tipo de archivos tales como Evince, Atril y Okular, que son de software libre, entre otras. Su popularidad ha abierto la posibilidad de crear documentos PDF con programas de software privativo y libre tales como Microsoft Office, WordPerfect Office, OpenOffice.org, LibreOffice y Calligra Suite. Otras aplicaciones, son incluso capaces de editarlos de manera directa, sin necesidad de usar la típica aplicación para crear y editar documentos PDF de Adobe.
Tipos de archivos PDF
Archivos de sólo imágenes
Un archivo de sólo imágenes se presenta como una imagen de mapa de bits o una instantánea. Debido a que es el equivalente a una fotografía no es posible hacer búsquedas por texto, porque lo visualizado es la imagen que genera el texto, no el texto en sí mismo (igual que se le puede hacer una foto a un libro). Sin embargo, este formato es útil cuando las versiones digitales deben ser absolutamente fieles a las originales, como en los casos de facturas o documentos legales.
Documentos sin etiquetas
Los documentos sin etiquetar se han creado sin etiquetas PDF. Las etiquetas PDF son similares a las etiquetas utilizadas en el código HTML para hacer la búsqueda Web más accesible. El texto en documentos sin etiqueta es a menudo difícil de leer. Cuando sucede esto, aparecerá un cuadro de diálogo, dando al usuario la opción de añadir etiquetas.
Documentos etiquetados
Los documentos etiquetados son fáciles de encontrar a través de una búsqueda web. Son fáciles de leer, optimizados para ser vistos en una pantalla pequeña y capaz de ser copiados.
Formularios electrónicos
Los formularios PDF electrónicos ofrecen al usuario la posibilidad de guardar los datos introducidos con el teclado o copiados de un archivo existente. Los formularios terminados pueden ser protegidos con contraseña y guardados. Los formularios también pueden ser publicados en Internet o enviados a través de correo electrónico.
Formato de archivo PDF
Independientemente de cómo se hayan creado los archivos PDF, todos ellos comparten la misma estructura interna compuesta de cuatro partes:
- Cabecera: información sobre la especificación del estándar PDF que se ha seguido, en donde se indica, por ejemplo, la versión.
- Cuerpo: descripción de los elementos usados en las páginas del documento.
- Tabla de referencias cruzadas: información de los elementos usados en las páginas del archivo.
- Coda: indica dónde encontrar la tabla de referencias cruzadas.
Hay que notar que, cuando un archivo PDF se modifica y se añade nuevo contenido, este tendrá nuevas secciones de cuerpo, tabla de referencias cruzadas y coda, pero al guardar este documento se puede optimizarlo para que las secciones duplicadas se fusionen en una sola y se reorganice el archivo.
Representación del color en PDF
El formato PDF está indicado para la impresión de documentos, ya que especifica toda la información necesaria que los definen. Es interesante especificar cómo se hace la representación de colores del fichero en PDF. En el formato PDF se especifican espacios de color, esto es la descripción de cómo hay que interpretar los colores del documento.
Un color se define mediante uno o varios componentes numéricos y la interpretación de estos se hará según el espacio de color especificado.
Los espacios de color pueden ser:
- dependientes del dispositivo,
- independientes del dispositivo,
- espacios de color espaciales.
Dependientes del dispositivo
Es la forma más simple e imprecisa de reproducir colores, usada por aparatos que no disponen de gestores de color. Cada punto es descrito por un color que está compuesto de ciertas cantidades de colorantes.
Para PDF existen tres espacios de colores distintos dependientes del dispositivo:
- CMYK del dispositivo: los valores de composición de los colores son descritos por los colores primarios de pigmento CMYK (Acrónimo de “Cyan, Magenta, Yellow y Black”; Cian, Magenta, Amarillo y Negro) mediante mezcla sustractiva que es la usada en pintura y artes gráficas.
- RGB del dispositivo: los valores de composición de los colores son descritos por los colores primarios de la luz RGB (“Rojo, Verde y Azul”) mediante mezcla aditiva.
- Gris del dispositivo: los valores de composición de los colores son descritos por una escala acromática de blanco a negro.
Modo | Color | Descripción |
---|---|---|
CMYK | Verde puro | (66 %, 0 %, 100 %, 0 %) |
RGB | Verde puro | (0,255,0) |
Gris | Verde puro | Negro=20% |
Al usar la definición de color dependiente, aunque tenga unos mismos valores del color, la reproducción de ellos variará según el dispositivo que lo reproduzca.
Independientes del dispositivo
Estos espacios de color están basados en los estándares de la Comisión Internacional de la Iluminación (CIE), organización internacional que estudia la luz y el color. Su objetivo es describir con detalle cómo ve el ser humano e intenta reproducirlos de la misma forma, independientemente del dispositivo que lo reproduzca. A estos colores también se les llama “calibrados”. Los colores son descritos mediante matrices numéricas y se modifican mediante transformaciones de valores usando las ideas de colores neutros más claros y más oscuros.
Para PDF existen cuatro espacios de colores distintos independientes del dispositivo:
- RGB calibrado: los valores de composición de los colores son descritos por los colorantes RGB mediante mezcla aditiva pero tanto la intensidad, tonalidad y gradación dependen de funciones decodificadoras en las que se aplica un valor gamma particular para cada colorante.
- Gris calibrado: los valores de composición de los colores son descritos por una escala acromática de blanco a negro pero la intensidad, la tonalidad y la gradación dependen de funciones decodificadoras en las que se aplica un valor gamma particular para el colorante.
- Lab: espacio de color basado en CIE compuestos por “A, B y C” que se les asigna los valores L*, a* y b* del espacio de color CIELAB (espacio de color Lab).
- Basado en ICC: basados en los espacios de color del Consorcio Internacional del Color, el cual no se basa en las entradas de los diccionarios de espacio de color sino en perfiles de color International Color Consortium (ICC).
Espaciales
Se utilizan métodos espaciales de reproducción del color.
- Espacios de color Separación: son espacios de color monocromos en donde se usan colorantes especiales como tintas metálicas o fluorescentes.
- Espacios de color Dispositivo: usados para ocasiones en que los objetos necesiten utilizar más colorantes en la impresión. Estos espacios de color permite que los colorantes que haya en el dispositivo se traten como un espacio de color del dispositivo con varios componentes.
Compresión en PDF
Los archivos PDF se pueden comprimir y cada elemento del mismo es comprimido mediante uno u otro algoritmo. Los textos y órdenes de formato PostScript se pueden comprimir usando el algoritmo Lempel Ziv Welch (LZW) y las imágenes mediante JPEG, ZIP o RLE.
JPEG
JPEG (Joint Photographic Experts Group), en modo con pérdidas o sin pérdidas usado para imágenes en escala de grises o cuatricromías. Si se recomprime causa pérdida acumulativa de información.
ZIP
ZIP (Formato de compresión ZIP) realizada mediante el algoritmo LZW, sin pérdidas, en donde reemplaza secuencias repetidas por marcadores. Indicado para imágenes en color y escala de grises.
RLE
RLE (Run-length encoding) sistema sin pérdidas usado para imágenes de línea (gráfico rasterizado).
Referencias
- «PDF: qué es, origen e historia de este formato». 14 de enero de 2021. Consultado el 26 de agosto de 2021.
- «Description of 2007 Microsoft Office Suite Service Pack 2 (SP2)». Microsoft. Consultado el 9 de mayo de 2009.
- Jim King (4-12-2007) ISO Ballot for PDF 1.7 Passed!, Adobe systems (en inglés).
- «PDF Docs». 17 de marzo de 2018. Consultado el 4 de febrero de 2019.
- «Document management — Portable document format — Part 1: PDF 1.7 (PDF 32000-1:2008)» (en inglés). Adobe Systems Incorporated. p. 6. Consultado el 18 de febrero de 2017.
Véase también
- E-comic
- Formato abierto
- Formulario
- PostScript
- DjVu
- ABBYY, software para conversión de PDF.
- Gestor documental
- Impresora multi-funcional (MFP), que puede usarse para digitalizar documentos a PDF.
- Reconocimiento óptico de caracteres (OCR), para convertir un PDF a contenido buscable (searcheable).
- Sellado de tiempo