W Narodowym Archiwum Geologicznym zdigitalizowano już 10 milionów stron z ponad 250 tys. zgromadzonych tam dokumentacji archiwalnych. Niezwykle pomocna okazała się autorska aplikacja „Skanery”, która przyspiesza proces digitalizacji aż o 60 procent.
Digitalizacja dokumentacji archiwalnych jest jednym z zadań, jakie realizują pracownicy Narodowego Archiwum Geologicznego (NAG). NAG jest jednostką organizacyjną Państwowego Instytutu Geologicznego – Państwowego Instytutu Badawczego i największym w Polsce archiwum przechowywującym dokumentacje geologiczne. W jego zasobach znajduje się ponad 8 km bieżących półek z dokumentami i przeszło 450 tys. dokumentacji archiwalnych. Dodatkowo archiwizowanych jest 241 tys. publikowanych i niepublikowanych opracowań kartograficznych.
Digitalizacja, czyli zamiana formy analogowej dokumentacji geologicznych na formę cyfrową wynika z potrzeby podniesienia stopnia bezpieczeństwa gromadzonych dokumentacji archiwalnych. Udostępnienie wersji cyfrowej daje także możliwość jednoczesnego korzystania z niej większej ilości osób.
Pierwsze prace związane z digitalizacją rozpoczęły się projektem pilotażowym, który realizowano w latach 2015-2017. W ramach projektu został opracowany przebieg całego procesu digitalizacji, wraz z potrzebnymi do wykonania zadaniami na każdym jego etapie. Powstała pracownia digitalizacji, wyposażona w profesjonalny sprzęt (skanery i komputery).
Pracownia digitalizacji w NAG w Warszawie
Projekt zakładał digitalizację 600 metrów bieżących dokumentacji archiwalnych. Do tego celu wytypowane zostały dokumentacje zarejestrowane w latach 1991-1999. Cały ten zasób został przygotowany i zinwentaryzowany przez pracowników Instytutu, natomiast skanowanie odbyło się w podziale: 550 metrów bieżących siłami firmy zewnętrznej, a 50 metrów bieżących w ramach prac własnych.
Przed skanowaniem wszystkie digitalizowane dokumentacje podlegają w pierwszej kolejności pełnej inwentaryzacji, w ramach której wykonuje się:
- sprawdzenia kompletności dokumentacji i ułożenia jej zawartości zgodnie ze spisem treści załączników,
- konserwacji dokumentu (m.in. naprawy rozerwanych stron, wyprostowanie zagięć, przepakowanie w teczki lub pudła bezkwasowe),
- paginacji ołówkiem w prawym górnym rogu wszystkich zapisanych stron,
- uzupełnienia w podsystemie Dokumenty CBDG metadanych dotyczących zawartości, stanu zachowania, wymiaru oraz stwierdzonych braków danej jednostki inwentarzowej.
Inwentaryzacja każdej dokumentacji zakończona jest wygenerowaniem i wydrukowaniem „Karty Dokumentu”, na której znajduje się unikalny kod kreskowy, oryginalna numeracja, tytuł dokumentu, a także informacje dotyczące zawartości, stwierdzonych braków, ilość pagin, wymiar teczki lub pudeł oraz stan zachowania.
Opracowany i przepakowany zasób dokumentów
Podsystem Dokumenty CBDG – metadane Karta Dokumentu
Wygenerowana Karta Dokumentu
W ramach zadań związanych ze skanowaniem powstaje cyfrowa kopia wzorcowa, która nie podlega obróbce mogącej wpłynąć na autentyczność zabezpieczonej treści. Z wersji tej na potrzeby udostępniania dokumentacji generowane są lekkie pliki JPG oraz zbiorczy plik PDF.
Proces skanowania dokumentacji, jak i kontroli jakości odbywa się przy użyciu autorskiej aplikacji NAG „Skanery”. Pierwsze prace nad aplikacją zaczęły się w 2016 roku, a cała funkcjonalność, którą posiada była i jest tworzona na bieżąco. Wprowadzane udoskonalenia wynikają z potrzeb i uwag zespołu pojawiających się w trakcie skanowania lub kontroli jakości, tak, aby cały proces maksymalnie usprawnić. Wdrożenie w proces skanowania aplikacji „Skanery” pozwala przyspieszyć proces skanowania o co najmniej 60 procent i powoduje, że codziennie w Narodowym Archiwum Geologicznym skanowanych jest średnio 6,5 tys. stron różnego formatu (tj. około 11 tys. stron w przeliczeniu do formatu A4).
Aplikacja "Skanery"
Aplikacja uruchamiana jest na każdym kontrolerze skanera i codziennie otrzymuje unikalną nazwę pracy, a wszystkie skanery włączone w proces digitalizacji skonfigurowane są tak, aby ich nazewnictwo było zgodnie z przyjętym w niej system oznaczenia.
Aplikacja poza modułem usprawniającym proces skanowania, posiada ponadto moduł do kontroli jakości. Bez poprawnie zaakceptowanego dokumentu, system nie pozwala na wygenerowanie lekkich plików JPG i zbiorczego PDFa, co jest dodatkową funkcją aplikacji i elementem kończącym pracę z digitalizacją dokumentu.
Wybór dokumentu przekazanego do kontroli jakości
„Skanery” kontrola jakości – błędy
Tekst: Kamil Kaczmarek
Zdjęcia: Barbara Ruszkiewicz, Kamil Kaczmarek