Arkivere eller migrere?

Ved at skelne mellem to forskellige måder at flytte dokumenter fra et eksisterende system til et nyt, kan man gå mere nuanceret til værks og lette arbejdsburden betydeligt.
En kundesag demonstrerer pointen og de store mulige besparelser.

Hvorfor differentiere?

Vi vil i det følgende sammenligne og diskutere to forskellige måder at flytte dokumenter på. I mangel af en bedre navn, vil vi kalde dem migrering og arkivering. Den væsentligste forskel er, at dokumenterne ender i to forskellige tilstande, forberedt til to forskellige typer brug. Det arbejde, der lægges i at flytte et bestemt dokument, bør fokusere på at forberede det til den måde, dokumentet skal bruges på i fremtiden. Erfaringsmæssigt har det vist sig, at man på denne måde kan reducere arbejdsbyrden i forbindelse med flytning af dokumenter betydeligt.

Aktive og inaktive dokumenter

Det første skridt i opdelingen er at skelne mellem aktive og inaktive dokumenter.

Inaktiv angiver, at dokumenterne er i deres endelige form og ikke længere skal ændres. Aktive dokumenter derimod er levende, bruges og udvikler sig måske endda.
Et aktivt dokument kan være en gældende procedure eller en rapport eller en tegning fra et igangværende projekt. Eksempler på inaktive dokumenter kan være en kontrakt fra et afsluttet projekt eller en ikke længere gyldig procedure, der skal bevares af regulatoriske årsager.

I artiklen “Digitalt arkiv – hvad og hvordan?” argumenterer vi for, at arkivering bedst sker i et system, skræddersyet til formålet. Som regel betegnes det vi kalder inaktive dokumenter, som “records”. Håndteringen af records er en særskilt disciplin, med egne retningslinjer og procedurer.

Vi vil ikke gentage argumentationen her, men blot påpege, at kravene til brugen af aktive og inaktive dokumenter er helt forskellige. Aktive dokumenter skal fungere smidigt i et system, der understøtter den dokumentets forretningsgang. Dette kræver hurtig og nem fremfinding, redigering og en granuleret sikkerhedsmodel. Inaktive dokumenter derimod, skal kun sjældent findes og bruges, og fokus er mere på holdbarhed og opbevaring.

Migrering versus arkivering

Når vi foreslår at man skelner mellem migrering og arkivering, handler det først og fremmest om at skelne mellem aktive og inaktive dokumenter. Dermed kan man give dem den opmærksomhed, de har brug for, når de flyttes fra et system til et andet.

Migrering er et bredt begreb, der betyder at flytte dokumenter. Strengt taget er arkivering således en speciel migrering, hvor det modtagende system er et arkiv. Selv om arkivering som disciplin omfatter meget mere end blot flytning af dokumenter, anvender vi her de to udtryk, da de er de mest almindeligt anvendte:

Migrering

Flytning af dokumenter fra et forretningssystem til et andet.

Arkivering

Flytning af dokumenter fra et forretningssystem til et arkiv.

Eksempler fra det virkelige liv

En medicinalvirksomhed havde besluttet at flytte fra et gammelt forretningssystem (eDMS) til et nyt. Det blev hurtigt klart, at størstedelen af arbejdsbyrden i projektet bestod i at berige dokumenterne med metadata. Klassificering og indeksering af dokumenterne var en enorm opgave. Det er ret normalt, men man havde ikke været klar over omfanget på forhånd. Det resulterede i en ændring af planerne, hvor kun de dokumenter, der skulle forblive aktive, blev flyttet til det nye forretningssystem. “Alt andet” blev overført til arkivet.
Forskellen i arbejdsbyrden for de to veje var enorm. Hvis man havde valgt ikke at skelne og havde lagt alt over i det nye system, ville projektomkostningerne være eksploderet. Som en ekstra bonus endte det nye system i en langt bedre stand med pænt indekserede og relevante data uden forstyrrelser fra irrelevante data.

Data

Kundens eksisterende system indeholdt en masse vigtige dokumenter – lige knap 2 millioner. Systemet havde været i drift i mange år og havde undergået mange tilpasninger i årenes løb. Som følge heraf var dokumenterne lagret inkonsistent og med meget inkonsistente metadata. Dette er helt normalt og er snarere reglen end undtagelsen og bør ikke opfattes som manglende kontrol fra virksomhedens side. Verden udvikler sig trods alt, og det samme gør arbejdsmetoderne.

Migreringen

I det gamle system var dokumenterne ordnet pænt i en mappestruktur, bygget på slutbrugerlogik. Strukturen indeholdt bl.a. oplysninger om produktnavne. Metadata på dokumenterne indeholdt landoplysninger. Det betød, at vi som en del af migreringen var nødt til at trække data fra både mappestrukturen (f.eks. produktnavne) og dokumentmetadata (f.eks. land). Begge dele skulle ende som metadata i det nye system.
I teorien en simpel opgave, men dog meget tidskrævende.

Men da teorien blev til virkelighed, stødte vi på problemer på især to fronter:

Produktnavne

De produktnavne, i den gamle mappestruktur, viste sig at være en inkonsekvent blanding af kaldenavne, markedsføringsnavne, landespecifikke navne osv. Hvis man dertil lægger stavefejl og forskellige sprog, bliver den ellers enkle opgave hurtigt kompleks og omfangsrig. Da produktnavne blev betragtet som vigtige metadata, blev det besluttet, at de skulle ryddes op og indekseres.

Ved hjælp af en masse automatiserede regler og logik samt en stor mængde manuel indeksering, blev produktnavnene renset op og tilpasset virksomhedens masterdata. Det endte godt, men krævede en kæmpe arbejdsindsats.

Land

Oplysningerne om landene gav anledning til en anden type problemer. Disse skyldes forskellen i måden, det gamle og det nye system var opbygget på. Det gamle system havde lande gemt som metadata, og vi kunne derfor blot “oversætte” dem til de landenavne i masterdata, og indlæste dem i det nye system.

I det gamle system var landeoplysningerne imidlertid blot simple metadata til sortering og filtrering af dokumenter. Adgangen til dokumenter blev styret uafhængigt af land, og en bruger kunne fx have adgang til både dokumenter fra Danmark og Island. Dette var per design, og brugerne var vant til at have fælles dokumenter mærket med både det ene og det andet land. 
I det nye system blev landeoplysningen integreret i sikkerhedsmodellen og brugt til at styre adgangen. Danske brugere havde kun adgang til dokumenter mærket “Danmark” osv. Uden yderligere tiltag (og arbejde) ville islændinge ikke kunne få adgang til de dokumenter, de havde til fælles med danskerne. Ligesom med produktnavnet førte dette til ekstra og delvis “håndholdte” indsatser.

Arkiveringen

Alt, hvad der ikke blev overført til det nye system, blev lagt i arkivet. Det viste sig at være næsten 95 % af indholdet. Det betød, at man valgte at medtage alt i arkiveringen, frem for at filtrere de 95 % fra. Alternativt kunne vi have markeret de migrerede dokumenter så de let kunne filtreres fra. Dette blev imidlertid ikke gjort i dette projekt.

De fleste arkiveringssystemer gemmer indholdet i dedikerede “bokse”, og denne form for migration handler i høj grad om at granulere indholdet i de rigtige bokse og fastsætte opbevaringsdatoer. Selvfølgelig er metadata stadig vigtige, og i dette projekt skulle de arkiverede dokumenter også mærkes med både produktnavn og land. Den store forskel er, at når der er tale om et arkiv, kan vi bruge metadataene som de er. Da der kun sjældent er brug for arkivdata, kan det retfærdiggøres, at vi skal bruge lidt mere tid på at finde dem. For produktnavne brugte vi blandingen af kaldenavne, markedsføringsnavne og landespecifikke navne, som de var. De rettigheder, der lå i landefeltet, kunne der ses bort fra i arkivet, da dette har sin egen sikkerhedsmodel. 

Konklusion

Næsten 2 millioner dokumenter blev flyttet i forbindelse med projektet. Aktive dokumenter blev migreret til det nye system, resten blev arkiveret. Derudover blev mængden af data i det nye dokumenthåndteringssystem (kraftigt!) reduceret, og kvaliteten blev forbedret. Brugerne endte med at få ikke blot et nyt og opdateret system, men også berigede og opdaterede data, som er lettere at finde og administrere. 

Projektet understregede behovet for at rydde op og forbedre datakvaliteten. Ikke kun af hensyn til slutbrugerne, men også af hensyn til selve projektet. Migreringsindsatsen pr. dokument var en langt større end arkiveringsindsatsen. Man kan næsten sige, at de 5% migrering udgjorde 95% af arbejdet i projektet. Og med næsten 2 millioner dokumenter taler tallene for sig selv.