Skip to the content

Från pappersarkiv till strukturerade digitala data

Foto: Mads Bjørkli, NAV

Så digitaliserar NAV historiska pappersarkiv med PixEdit applikationer för skanning


NAV har ett stort fysiskt arkiv från tiden innan man började arkivera digitalt. För resultatområdet ”NAV Arbeid og ytelser”, med ansvar för bl.a. sjukpension, dagersättning och sjukpenning, innefattar detta ca 7000 hyllmeter fördelade på enheter över hela landet. NAV Arbeid og ytelser Styringsenhet har etablerat en egen tillfällig skanningsenhet för att digitalisera det fysiska arkivet för det resultatområdet. Enheten är finns på Hagegata 23 i Oslo.


Ove Hildrum är avdelningsdirektör/projektledare och berättar att målet för arbetet är att både underlätta utredarnas åtkomst till dokumenten, och reducera myndighetens behov för arkivutrymme. Lösningen för digitalt arkiv ska också underlätta avdelningens arbete med sortering eller leverans av material till arkivverket. Arbeids- och Velferdsdirektoratet har etablerat en egen digital arkivlösning, HistArk, för myndighetens historiska arkiv.

Effektiv produktionslinje för skanning

Med flera hyllkilometer av pappersarkiv som ska digitaliseras, krävs en noga planlagd produktion och noggranna rutiner för ett lyckat projekt.
Mads Björkli, projektmedarbetare hos NAV Arbeid og ytelser, berättar att pappersarkivet innehåller all dokumentation kring bidrag från före 2012. Det är ansökningar, dokumentation och beslut angående bland annat sjukbidrag, barnbidrag, sjukpenning och dagersättning. Totalt 66 olika sorters bidrag registreras hos NAV.
Olika sorters bidragsdokument har olika kassationsregler när det gäller krav på lagringstid, men genom att digitalisera, kan hela pappersarkivet gå till kassation. Därmed frigörs massvis hyll- och lagerutrymme!
Mads Björkli är tillsammans med Jan Breivoll ansvarig för skanningproduktionen. De ser till att programvara och maskinvara fungerar som det ska och att rutinerna för skanning, dokumentbehandling och arkivering fungerar som det ska. De beskriver ett gott samarbete med utvecklingsavdelningen hos PixEdit som avgörande för att lösningen har kommit på plats.
.

«Vi började med en teknisk beskrivning som inte täckte vårt behov fullt ut, men tillsammans med PixEdit har vi kommit fram till ett väl fungerande produktionsflöde som effektiviserar arbetet med skanning och datafångst. Under arbetets gång har vi haft stor nytta av PixEdits snabba respons och utmärkta service»

Mads Bjørkli, NAV

Anders Alvsåker, chefen för utvecklingsavdelningen hos PixEdit, bekräftar att det också har varit viktigt för PixEdit att utveckla modellen för datafångst från skannade dokument tillsammans med NAV. Det är viktig att verkligen förstå kundens målbild för att kunna ta fram tekniska lösningar som ger önskat resultat. Alvsåker beskriver digitaliseringsavdelningen hos NAV Arbeid og Ytelser som nytänkande, kunnig och mycket resultatinriktad mot bästa möjliga digitala arkiv för framtida bevaring.


Sparar 1-2 årsverken med automatisk dokumentbehandling

I produktionslinan hittar vi 6 skanningsstationer med kraftiga dokumentskannrar knutna till datorer med PixEdit Desktop. PixEdit Desktop kontrollerar skannern och behandlar de skannade dokumenten fortlöpande.

Automatisk behandling i PixEdit innefattar bland annat

  • Borttagning av tomma sidor
  • Upprätning av snett skannade dokument
  • Städning, borttagning av visuellt «brus»
  • Uppdelning av mappen/bunten som skannas med skiljeark mellan varje ärende

Nästa steg är att sätta upp en kraftig server med PixEdit Serverlösning. Här ska all tung dokumentbehandling utföras som en servertjänst, så att arbets-datorerna avlastas och behandlingen går snabbare. Björkli uppskattar att 1-2 årsverken sparats in genom att dokumentflödet satts upp på detta sätt.

 

 

Foto: Mads Bjørkli, NAV

Kvalitetssäkring och automatisering av återkommande arbetsmoment

Pappersdokumenten kommer i många olika former, och vissa kräver lite mer bearbetning än andra. Mycket kan räddas med lite manuell finjustering, så när den automatiska dokumentbehandlingen är genomförd, kommer dokumentet till handläggaren för kontroll. Här utförs nödvändiga justeringar för att bevara informationen på bästa sätt.
Genom att använda makron i PixEdit, sparas mycket tid på uppgifter som annars hade varit mycket tidskrävande manuella operationer. Makron är «inspelningar» av en serie uppgifter som ska upprepas ofta. Dessa sparas och kan sedan «spelas upp» vid behov.
Exempel: När pappret som skannats i är i så dåligt skick att det är oläsligt, så ska dokumentationen anges i det digitala arkivet. I stället för att utföra 4–5 olika operationer, behöver handläggaren bara spela upp makrot «Stämpla som oläslig pappersdokumentation»

«Med många tillfällen för effektiv automatisering av enstaka uppgifter, blir summan av sparad tid mycket stor»

Mads Bjørkli, NAV


Datafångst: Från ostrukturerade till strukturerade data

För att systematisera och indexera personmappar med tillhörande ärenden i HistArk, måste metadata hämtas från dokumenten.

Data som ska hämtas ut hos NAV är:

1. Antal ark i PDF-filen
2. Enhetsnummer: Nummerkoden till NAV-enheten som har ansvar for arkivet i dag
3. NAV Enhet: Namnet på NAV-enheten
4. Bidrag: Vilken/vilka typ(er) av bidrag det gäller. Olika bidrag har olika koder
5. Mottagarens personnummer
6. År från: årtalet de första dokumenten i ärendet skapades
7. År till: årtalet för de senast skapade dokumenten i ärendet
8. Tidpunkt för skanning
9. Skannernamn
10. Skannerenhet: Nummerkoden för NAV enheten som har skannat ärendet
11. Filnamn: Namnet på PDF filen
12. Klagomål: Ja/Nej beroende på om ärendet innehåller ett klagomål eller inte. Vid klagomål gäller andra kassationsregler under vissa förhållanden.

NAV använder modulen för datafångst i PixEdit Desktop där dessa fält för metadata definieras i ett formulär. Formuläret används sedan för registrering. En del metadata hämtas automatiskt, andra kopieras från dokumentet genom att använda OCR/texttolkning. Hur mycket som hämtas automatiskt och hur mycket som hämtas manuellt beror på om dokumenten i utgångspunkt är lika (formulär/strukturerade data) eller ostrukturerade.

 

Skärmexempel från PixEdit - modul för datafångst

«Det är mycket enkelt att designa registreringsformulär passande den information vi önskar hämta ut. Den flexibiliteten är kostnadsbesparande för oss eftersom vi enkelt kan göra ändringar själva utan extern hjälp»

Mads Bjørkli, NAV

 

Lagring i arkivsystem

Det skannas en arkivmapp per person, med personnummer som identifieringsnyckel. De olika ärendena i mappen separeras med PixEdit skiljeark. När mappen är färdigskannad, dokumenten digitalt förbättrade och metadata registrerat, är resultatet en PDF-fil med det skannade dokumentet och en kopplad CSV-fil med metadata. Filerna läggs in i HistArk och det är därmed enkelt att leta upp alla ärenden knutna till ett visst personnummer vid åtkomst till arkivet.


Vinster:

Större produktion • Mera användarvänligt • Mindre fel

Bjørkli sammanfattar med att berätta att lösningen är enkel att använda. Det är en stor fördel att kunna anpassa användargränssnittet så att verktyg som inte används kan slås av för användaren. Användaren ser bara de verktyg hen har användning för, och ser samma gränssnitt oavsett vilken skanner som används.
I början av projektet registrerades all metadata manuellt i ett kalkylark. Den nya lösningen med användning av PixEdit för skanning och datafångst gav en kraftig ökning i produktionen, samtidigt som riskerna för fel i stort sett försvann.
Vi på PixEdit sätter stort pris på samarbetet med NAV, som har fört till nya idéer och lösningsförslag runt optimering av produktionsskanning. Detta är helt i linje med vår vision om att öka värdet på dokumenten på vägen från papper till digital version.

 

Ska Ni igång med att digitalisera ett pappersarkiv?


PixEdit-lösningen för produktionsskanning och datafångst som är i drift hos NAV, kan anpassas till de flesta dokument och arkivsystem.

Mer om lösningen för datafångst

Kontakta oss för en diskussion om ert skanning- och digitaliseringsprojekt

Om författaren

© PixEdit AS, Norge.

Svensk översättning PixEdit AB - Anders Nordén

Dokumenten i det digitala arkivet ska värderas högre än pappersutgåvorna

Kontakt

Så här beställer du licenser

Kort leveranstid och enkel installation gör att man snabbt kommer igång med arbetsuppgifterna