• Slider Image

Dokumentklassifikation – se på dokumentets livscyklus

Rigtigt mange af vores kunder har en daglig udfordring med dokumentklassifikation. Det kan være dokumenter (filer), der ligger på fællesdrev og man ved måske ikke helt, hvad det er. Det kan fx være, at der indleveres datamængder til et centralt arkiv, og at disse ikke er tilstrækkeligt beskrevne. Det kan være ved overflytning / migrering af dokumenter og data til nye systemer eller mange andre scenarier. At rydde op i den slags er den stor opgave, og vi har tidligere skrevet en del om (se evt her). Det her indlæg skal handle om en anden tilgang.

En af vores kunder har et ønske om at nedbringe deres omkostning ved arkivering markant. Deres behov for dokumentklassifikation er i det store hele, at dokumentet ved upload til arkivdatabasen påtrykkes en klassifikation, som repræsenterer dokumentets oprindelse (hoved- og delproces) samt en retentionstid. Det er relativt få informationer, der skal til for at dokumentet gemmes korrekt og kan genfindes (med lidt besvær). Men det er i dette tilfælde mere korrekt opbevaring end nem og hurtig genfinding, der er målet.

Diskussionen handlede om, hvordan vi kan afløfte information af de indleverede dokumenter med en form for automatiseret løsning. Som det ses i de artikler, der ovenfor er refereret til, er der righoldige muligheder for det, og rigtigt mange af disse løsninger er dybt imponerende (… på trapperne er en artikel om brug af kunstig intelligens …), men vi kommer ikke væk fra, at der – uanset metoden – introduceres en mulighed for at fejl.

Under diskussionen fandt vi ud af, at typisk, er alle de oplysninger, vi har brug for til at bestemme den endelige klassifikation til rådighed i det øjeblik, dokumentet dannes. Hvis nu vi formår at komme hen ved dokumentets fødsel og opsamle informationen, er risikoen for fejl betragteligt mindre, end hvis vi senere i dokumentets livscyklus modtager dokumentet til klassifikation ude af kontekst. Nu handler det så om at kommer ud i forretningen og identificere de steder, hvor vi skal opsamle informationen og finde en form at opsamle det på. Noget vil helt sikkert være automatiseret opsamling, men noget må blive ved ganske basalt at få udfyldt en arkiveringsform. Men det bliver bedre og billigere – det er der ingen tvivl om.

Kigger man i ISO standarden for Records Management (ISO 15489), bliver man også overbevist om, at det i enhver henseende er bedre practice. Vi bør altså ofte overveje at søge upstream i dokumentprocessen for derved at få tingene foræret fremfor senere at forsøge at genskabe oplysningerne pba dokumenterne ude af kontekst.

If you liked this post, you are most welcome to share it.