Archiving 2010 | PDF/A-2 is er (bijna)

In 2005 werd PDF/A een ISO-standaard: ISO 19005-1. Dit bestandsformaat was gebaseerd op PDF 1.4 en werd speciaal ontwikkeld voor langetermijnbewaring. PDF/A wordt gebruikt voor archivering van zowel born-digital documenten als van gedigitaliseerde documenten. Er zijn twee subversies:

  • PDF/A-1a: bevat de logische structuur van het document (dmv PDF-tags), ondersteunt Unicode
  • PDF/A-1b: bevat enkel het uitzicht van het document

Sinds het publiceren van deze standaard volgden verschillende versies van het gewone PDF-formaat elkaar op. PDF 1.7 werd eveneens een ISO-standaard (ISO 32000-1). Deze nieuwe versies brachten nieuwe functionaliteiten met zich mee. Daarom begon men aan een herziening van PDF/A die verschillende van de nieuwe mogelijkheden van PDF 1.7 overneemt.

De komst van PDF/A-2 betekent niet dat de oude versie verdwijnt. PDF/A-2 is eigenlijk een uitbreiding van de bestaande standaard, veeleer dan een geheel nieuwe standaard. Bovendien is dit bestand voor langetermijnbewaring bedoeld. Het na verloop van tijd stopzetten van de ondersteuning van het formaat is daardoor geen optie.

PDF/A-1 blijft dus een geldige ISO-standaard. Verder beantwoorden PDF/A-2’s automatisch ook aan de PDF/A-1 standaard. Erfgoedorganisaties die gebruik maken van PDF/A-1 hoeven hun bestanden niet te migreren naar de nieuwe versie. Verwacht wordt dat PDF/A-2 door ISO als standaard wordt erkend in het najaar.

De nieuwigheden

JPEG2000
De oude versie bevatte enkel JPEG-compressie. Dit betekent dat er sowieso gegevensverlies plaats vindt bij het comprimeren. JPEG2000-compressie kan zo worden ingesteld dat de compressie verliesloos is. Dit opent perspectieven. Op Archiving 2010 werd bijvoorbeeld de mogelijkheid geopperd om de JPEG2000 master van een scan op te nemen in een PDF/A. Die PDF/A zou dan alle metadata kunnen bevatten die men bij de scan wil bewaren.

Lagen
Verschillende lagen content kunnen boven elkaar geplaatst worden. De gebruiker kan er voor kiezen bepaalde lagen uit te zetten. Zo kan men bijvoorbeeld een tekst in verschillende talen in één bestand opnemen. Ook kan men bij plannen bepaalde stukken weglaten of toevoegen door lagen aan of uit te zetten. Bij wijze van voorbeeld is aan dit blogbericht een gewoon PDF-bestand met lagen bijgevoegd. Het bevat een kaart die u op verschillende manieren kunt bekijken, door lagen aan en uit te zetten. De kaart is afkomstig van Centremaps Live.

Transparantie
Deze eigenschap wordt gebruikt om bepaalde visuele effecten te verkrijgen zoals shading. Ook voor het toevoegen van commentaar aan een bestand, wordt dit gebruikt.

OpenType lettertypes
De OpenType fonts werden toegevoegd aan de door PDF/A ondersteunde lettertypes.

ICC-profielen
Kleurprofielen werden door de vorige versie van PDF/A ook ondersteund. Sinds de publicatie van PDF/A-1 heeft het ICC de standaard voor kleurprofielen echter herzien. De nieuwe versie 4 ICC-profielen zijn accurater dan de oude versie 2 profielen. Door de herziening van PDF/A zullen deze nieuwe kleurprofielen ondersteund worden.

Collecties
Verschillende PDF/A bestanden kunnen worden samengevoegd tot één grote container PDF/A.

Grotere omvang
Tot nu toe kon een afbeelding op schaal 1:1 niet groter zijn dan 5 × 5 m. Vanaf nu is een omvang van 381 × 381 km mogelijk!

Verschillende subversies van PDF/A
Net zoals bij PDF/A-1, brengt ook versie twee verschillende subversies met zich mee. Deze keer zijn het er drie:

  • PDF/A-2a: bevat de logische structuur van het document (dmv PDF-tags), ondersteunt Unicode
  • PDF/A-2b: bevat enkel het uitzicht van het document
  • PDF/A-2u: ondersteunt Unicode

Niet opgenomen in PDF/A-2: 3D-vectorafbeeldingen
In een gewone PDF kunt u een 3D-vectorafbeelding opnemen. Schrijver dezes had gehoopt dat deze mogelijkheid ook in PDF/A-2 zou opgenomen worden. Dat is niet het geval. Navraag bij de mensen van het PDF/A Competence Center leert dat dit wel overwogen werd. De afwezigheid van voldoende standaardisatie binnen de wereld van de 3D-vectorafbeeldingen heeft geleid tot de beslissingen geen 3D-vectorafbeeldingen in PDF/A-2 op te nemen.

Dit is jammer aangezien de keuze voor een bepaalde standaard door PDF/A had kunnen bijdragen tot meer standaardisatie bij 3D-vectorafbeeldingen. Het had ook een stap vooruit kunnen zijn in de zoektocht naar een oplossing voor het archiveren van CAD-bestanden.

PDF/A-3
PDF/A-2 is nog niet uit of er wordt al gedacht aan de volgende versie. Het echte werk aan PDF/A-3 zal pas beginnen eenmaal PDF/A-2 gepubliceerd werd. Toch is al bekend dat in de volgende uitbreiding van de norm dynamische elementen een belangrijke rol zullen spelen.

Voor meer informatie over PDF/A kunt u terecht bij het PDF/A Competence Center.

 

ADDENDUM

Op 30/11/2010 werd de PDF/A-2-standaard goedgekeurd door ISO. De naam van de standaard is ISO 19005-2 : 2010.

Jeroen Poppe