Narodowe Archiwum Geologiczne zdigitalizowało 10 milionów stron!

W Narodowym Archiwum Geologicznym zdigitalizowano już 10 milionów stron z ponad 250 tys. zgromadzonych tam dokumentacji archiwalnych. Niezwykle pomocna okazała się autorska aplikacja „Skanery”, która przyspiesza proces digitalizacji aż o 60 procent.

Digitalizacja dokumentacji archiwalnych jest jednym z zadań, jakie realizują pracownicy Narodowego Archiwum Geologicznego (NAG). NAG jest jednostką organizacyjną Państwowego Instytutu Geologicznego – Państwowego Instytutu Badawczego i największym w Polsce archiwum przechowywującym dokumentacje geologiczne. W jego zasobach znajduje się ponad 8 km bieżących półek z dokumentami i przeszło 450 tys. dokumentacji archiwalnych. Dodatkowo archiwizowanych jest 241 tys. publikowanych i niepublikowanych opracowań kartograficznych.

Digitalizacja, czyli zamiana formy analogowej dokumentacji geologicznych na formę cyfrową wynika z potrzeby podniesienia stopnia bezpieczeństwa gromadzonych dokumentacji archiwalnych. Udostępnienie wersji cyfrowej daje także możliwość jednoczesnego korzystania z niej większej ilości osób.

Pierwsze prace związane z digitalizacją rozpoczęły się projektem pilotażowym, który realizowano w latach 2015-2017. W ramach projektu został opracowany przebieg całego procesu digitalizacji, wraz z potrzebnymi do wykonania zadaniami na każdym jego etapie. Powstała pracownia digitalizacji, wyposażona w profesjonalny sprzęt (skanery i komputery).

wnętrze pracowni do skanowania z wieloma urządzeniami

Pracownia digitalizacji w NAG w Warszawie

Projekt zakładał digitalizację 600 metrów bieżących dokumentacji archiwalnych. Do tego celu wytypowane zostały dokumentacje zarejestrowane w latach 1991-1999. Cały ten zasób został przygotowany i zinwentaryzowany przez pracowników Instytutu, natomiast skanowanie odbyło się w podziale: 550 metrów bieżących siłami firmy zewnętrznej, a 50 metrów bieżących w ramach prac własnych.

Przed skanowaniem wszystkie digitalizowane dokumentacje podlegają w pierwszej kolejności pełnej inwentaryzacji, w ramach której wykonuje się:

  • sprawdzenia kompletności dokumentacji i ułożenia jej zawartości zgodnie ze spisem treści załączników,
  • konserwacji dokumentu (m.in. naprawy rozerwanych stron, wyprostowanie zagięć, przepakowanie w teczki lub pudła bezkwasowe),
  • paginacji ołówkiem w prawym górnym rogu wszystkich zapisanych stron,
  • uzupełnienia w podsystemie Dokumenty CBDG metadanych dotyczących zawartości, stanu zachowania, wymiaru oraz stwierdzonych braków danej jednostki inwentarzowej.

Inwentaryzacja każdej dokumentacji zakończona jest wygenerowaniem i wydrukowaniem „Karty Dokumentu”, na której znajduje się unikalny kod kreskowy, oryginalna numeracja, tytuł dokumentu, a także informacje dotyczące zawartości, stwierdzonych braków, ilość pagin, wymiar teczki lub pudeł oraz stan zachowania.

wnętrze archiwum ze zgromadzonymi zbiorami

Opracowany i przepakowany zasób dokumentów

grafika ilustracyjna

Podsystem Dokumenty CBDG – metadane Karta Dokumentu

grafika ilustracyjna

Wygenerowana Karta Dokumentu

W ramach zadań związanych ze skanowaniem powstaje cyfrowa kopia wzorcowa, która nie podlega obróbce mogącej wpłynąć na autentyczność zabezpieczonej treści. Z wersji tej na potrzeby udostępniania dokumentacji generowane są lekkie pliki JPG oraz zbiorczy plik PDF.

Proces skanowania dokumentacji, jak i kontroli jakości odbywa się przy użyciu autorskiej aplikacji NAG „Skanery”. Pierwsze prace nad aplikacją zaczęły się w 2016 roku, a cała funkcjonalność, którą posiada była i jest tworzona na bieżąco. Wprowadzane udoskonalenia wynikają z potrzeb i uwag zespołu pojawiających się w trakcie skanowania lub kontroli jakości, tak, aby cały proces maksymalnie usprawnić. Wdrożenie w proces skanowania aplikacji „Skanery” pozwala przyspieszyć proces skanowania o co najmniej 60 procent i powoduje, że codziennie w Narodowym Archiwum Geologicznym skanowanych jest średnio 6,5 tys. stron różnego formatu (tj. około 11 tys. stron w przeliczeniu do formatu A4).

grafika ilustracyjna

Aplikacja "Skanery"

Aplikacja uruchamiana jest na każdym kontrolerze skanera i codziennie otrzymuje unikalną nazwę pracy, a wszystkie skanery włączone w proces digitalizacji skonfigurowane są tak, aby ich nazewnictwo było zgodnie z przyjętym w niej system oznaczenia.

Aplikacja poza modułem usprawniającym proces skanowania, posiada ponadto moduł do kontroli jakości. Bez poprawnie zaakceptowanego dokumentu, system nie pozwala na wygenerowanie lekkich plików JPG i zbiorczego PDFa, co jest dodatkową funkcją aplikacji i elementem kończącym pracę z digitalizacją dokumentu.

grafika ilustracyjna

Wybór dokumentu przekazanego do kontroli jakości

grafika ilustracyjna

„Skanery” kontrola jakości – błędy

Tekst: Kamil Kaczmarek
Zdjęcia: Barbara Ruszkiewicz, Kamil Kaczmarek