Digitalisatie KBR op kruissnelheid

Geautomatiseerde scanner © KBR

De KBR kocht drie geautomatiseerde scanners aan om haar 19e- en 20e-eeuwse collectie Belgische boeken en tijdschriften in verhoogd tempo te kunnen digitaliseren en online toegankelijk te maken.

Digitalisering van collecties

Veel bibliotheken en archieven ervaren dat lezers hun collecties steeds meer ‘vanop afstand’ willen raadplegen. Dat is ook bij de KBR het geval. Zo’n raadpleging op afstand vraagt om gedigitaliseerd en online beschikbaar collectiemateriaal. Frédéric Lemmers, diensthoofd Digitalisering van de collecties bij KBR, verklaart: “KBR wil hier de komende jaren nog meer op inzetten. Enerzijds via de handmatige digitalisering van handschriften, kranten, kaarten, plannen en andere kostbare, unieke of kwetsbare documenten. Maar anderzijds willen we voor enkele specifieke collecties de geautomatiseerde scanners of ‘robots’ gebruiken om het tempo waaraan we digitaliseren te kunnen opdrijven.”

KBR heeft drie geautomatiseerde scanners in gebruik en hoopt daarmee haar online aanbod met zo’n 15.000 pagina’s per dag, of 3.000.000 pagina’s per jaar te kunnen uitbreiden. Er zijn zelfs plannen om op korte termijn een vierde scanner aan te kopen.

De robots worden momenteel getest in het kader van het onderzoeksproject ARTPRESSE dat KBR uitvoert i.s.m. KU Leuven en ULiège. Dit project bestudeert Belgische kunst aan de hand van de populaire periodieke pers uit de jaren 1920-1930. Sébastien Hermans, medewerker Digitalisering KBR, digitaliseert voor dit project tijdschriften zoals Hebdo en Ons Volk met de geautomatiseerde scanners. Zoals in onderstaand filmpje duidelijk wordt, zuigt de scanner de pagina’s omhoog, waarna ze automatisch omgeslagen worden en de pagina’s tegen de glasplaat gebracht worden. Daarna wordt een scan gemaakt. De scanner detecteert via een zeer fijne luchtstraal of er een of meerdere pagina’s omhoog gezogen worden. Zo ‘weet’ de scanner of elke pagina gescand wordt.

Menselijke input

Niet alle tijdschriften komen in aanmerking voor zo’n automatische digitalisering. Er wordt onder meer gekeken naar de staat van het document (type papier, geen grote scheuren of beschadigingen) en het maximum formaat (A3). Ook de mate van consultatie speelt een rol: weinig geconsulteerde en dus nog vrij ‘gave’ exemplaren kunnen makkelijker door de robot gedigitaliseerd worden dan vaak geconsulteerde documenten. Die laatste vertonen immers meer schade door leesgebruik zoals horizontale of verticale scheurtjes, loskomende papierstukjes aan de rand, minder effen pagina’s … en worden dus beter handmatig gedigitaliseerd.

Dat ‘de mens’ nog steeds een centrale rol speelt bij geautomatiseerd scannen, blijkt ook tijdens een demonstratie. Sébastien staat niet enkel in voor de selectie en controle van de te scannen documenten, maar is tijdens het digitaliseringsproces ook stand-by om eventuele problemen op te vangen. Wanneer er bijvoorbeeld toch twee pagina’s tegelijk geselecteerd worden, legt hij de robot stil om de overgeslagen pagina toch te laten scannen. Ook bij kleine papiersnippers of verticale scheurtjes in documenten kijkt hij extra aandachtig of de scans alle informatie bevatten. Wanneer de robot vastloopt, checkt hij wat het probleem is en start hij de scanner terug op. Omwille van zo’n korte onderbrekingen worden de vooropgestelde cijfers van 5.000 gescande pagina’s per dag per robot momenteel nog niet gehaald.

(Inter)nationale uitwisseling

KBR ging niet over één nacht ijs bij de aankoop van de geautomatiseerde scanners. Piet Janssens, medewerker Digitalisering KBR, zocht vorig jaar contact met de nationale bibliotheken van Noorwegen en Zweden en met het Nederlandse Nationaal Archief, gezien hun ervaring met en interesse in geautomatiseerde scanapparatuur. Via uitwisseling met deze internationale collega’s kwam KBR tot een aantal criteria die vooropgesteld werden bij de aankoop van de robots. Niet alleen de prijs speelde mee, ook de verwerkingssoftware speelde een doorslaggevende rol.

Verwerkingssoftware voor de gescande documenten. © KBR

De scans worden automatisch van de productiestations naar een postproductie-omgeving doorgestuurd, waar ze via verwerkingssoftware verder behandeld worden. Die software laat onder meer toe om de dubbel gescande pagina’s automatisch te knippen zodat elke pagina als apart document kan opgeslagen worden. In deze fase wordt ook nauwgezet nagekeken of alle pagina’s correct gescand werden, welke pagina’s eventueel manueel opnieuw moeten ingescand worden …

De bestanden worden via OCR (Optical Character Recognition) full text doorzoekbaar gemaakt. De gedigitaliseerde documenten zijn raadpleegbaar via BelgicaPeriodicals – het platform voor gedigitaliseerde tijdschriften van KBR – en zullen ook in grotere databanken zoals Europeana opgenomen worden. Ook hierover wisselt KBR informatie uit met andere erfgoedorganisaties. Zo neemt Sébastien Hermans deel aan de Collegagroep Digitalisering Periodieken die de Vlaamse Erfgoedbibliotheken samen met meemoo en FARO organiseert, om kennis en ervaring over digitalisering van kranten en tijdschriften te verzamelen en te delen.

Toekomstplannen

In april 2022 zullen de geselecteerde tijdschriften voor het project ARTPRESSE gedigitaliseerd zijn. De robotscanners zullen vanaf dan gebruikt worden om andere publicaties te digitaliseren. Omwille van de grote vraag naar Belgische boeken en tijdschriften uit de 19e en 20e eeuw, zal KBR de robots inzetten om ook deze collectie-items geautomatiseerd te digitaliseren.

Foto’s: Geautomatiseerde scanner // Verwerkingssoftware voor de gescande documenten © KBR

Jelena Dobbels
KBR
digitalisatie
digitaliseren
digitalisering
scanners
Collegagroep digitalisering periodieken
Opening / lancering