Skip to the content

OCR (Texttolkning)

Ett skannat dokument är egentligen att "digitalt foto" av alla sidorna. Människor kan enkelt läsa och förstå texten genom att se på bilden, men en dator kan inte göra mycket mer än att visa det på skärmen.

För att kunna använda själva texten, så måste programmet först köra dokumentet genom en process som kallas OCR (Optical Character Recognition/Texttolkning). Den tekniken gör det möjligt för datorer att analysera och tolka skannade bilder och konvertera dem till äkta elektronisk text.

OCR ökar värdet på de skannade dokumenten genom att innehållet blir sökbart och möjligt att återanvända.

Sökbara PDF-er

OCR är viktig när man skannar dokument till PDF, eftersom det gör filerna sökbara. Det i sig gör att dokumenthanteringssystemet kan indexera dokumenten så att man snabbt kan återsöka dem från arkivet senare.

PixEdit programvara lagrar både den elektroniska texten och den skannade bilden i PDF-filen. Vi kaller det "dold" text. Med det menas att dokumenten kommer att vara fullt sökbara och texten kan återanvändas, samtidigt som den visuella presentationen kommer att vara helt lik originalet.

PixEdit programvara lagrar PDF-dokumenten i enlighet med Riksarkivets riktlinjer för för arkivering.

Återanvänd text

OCR är även användbart för andra ändamål:

  • Snabb kopiering av text från ett skannat dokument till ett annat program, till exempel Word, Excel, PowerPoint, Outlook o.l
  • Export till en textfil och import i andra program
  • Hjälper till med att lägga till PDF Bokmärken snabbare
  • Formulärtolkning och extrahering av metadata

Instruktionsfilmer

OCR och sökbara PDF (YouTube länk)
PDF Bokmärken (YouTube länk)

 

OCR Program

Så här beställer du licenser

Kort leveranstid och enkel installation gör att man snabbt kommer igång med arbetsuppgifterna