Misforstått standardisering

Jeg brukte litt tid på å se på Kunnskapsorganisasjon på anbudet paneldebatt på KORG-dagene 2017 med Jonas Svartberg Arntzen, Leder utviklingsavdelingen ved Deichmanske bibliotek; Unni Knutsen, Leder Seksjon for tilvekst og katalog, Universitetsbiblioteket, UiO; Jonny Edvardsen, Direktør Tilvekst og kunnskapsorganisering, Nasjonalbiblioteket; og Geirr Karlsen, Seksjonsleder, avdeling Utvikling, Drammensbiblioteket.

Litt bakgrunn om meg: jeg har jobbet et tiår med utvikling i bibliotek. Jeg jobber ikke lenger for et bibliotek, men som vanlig IT-konsulent, men jeg jobber gjerne hos bibliotek. De siste tre årene har jeg vært lead-utvikler for teamet som jobber med å utvikle tjenestene til til Deichmanske bibliotek.

Diskusjonen på KORG-dagene bære preg av det jeg ville kalt misforstått standardisering.

I bibliografisk beskrivelse følger man gjerne standarder som om disse var en form for beste praksis, når de er i realiteten glidemiddel for datautveksling eller en tilnærming til standardformatering for inndata slik at presentasjonsdata blir uniform.

Vi vet av erfaring at for all standardiseringen er bibliografisk data fortsatt forutsigbart uforutsigbar.

Den lange praksisen i bibliotek der MARC brukes som inndataskjema og databaseskjema blandet med forståelser av tiltak som RDA, ISBD, lokale valg og generell slingringsmonn skaper data som ikke kan utveksles på annet en generell grunnlag.

For at et databasesystem skal fungere forutsigbart må dataene valideres. Det meste av data som produseres i bibliografisk sammenheng blir til tekststrenger. Disse kan være hva som helst. Årstall er ikke årstall men strenger fordi “© 2008” er like god som “2012”.

Under debatten kom frem et syn som går ut på Deichmanske biblioteks vandring bort fra “standarder”. Dette er uheldig da jeg mener at vi som har utviklet det nye systemet for bibliografiske data har jobbet i herdig og måttet gjøre hardt arbeid for å muliggjøre at Deichmanske bibliotek kan fortsatt spille med andre basert på akkurat disse standardene som skal være så sentrale i biblioteks virksomhet.

At det fysiske databaseskjemaet til Deichmanske biblioteks biblioteksystem ikke lenger er en tro kopi av en av de mange MARC-dialektene er sant; det det er en databaseskjema som støtter de mange oppgavene som Deichmanske biblioteks systemer skal utføre. Blant disse er støtte for utveksling av data med andre bibliotek.

Utveksling av data i bibliotek i dag er basert på bruk av MARC-data og derfor produseres det fullverdige MARC-poster for hvert manifestasjon i Deichmans biblioteksystem. Dette kommer ikke frem fordi folk hører bare linked data og tenker at man ikke følger standardene.

I gammeldagse biblioteksystemer er standardene fulgt (i varierende grad) av bibliotekarene, hos Deichmanske bibliotek er standardene konfigurert i systemet. Legg merke til ordet konfigurert.

MARC21-postene som produseres av Deichmanske biblioteks nye system inneholder RDA-kompatible data. Grunnen til dette er enkelt: RDA ga noen enkle råd om hvordan media og format kunne representeres slik at overgangen fra NORMARC ikke var så tung. RDA ga også fleksibiliteten vi trengte flere andre steder. Det som ikke skjer er at vi noen stans spesifiserer RDA-verdier i metadataene, disse er automatisk produsert basert på konfigurasjonen. De eneste store kompromissene vi har måttet gjøre i RDF-data er å spesifisere at det finnes e.g. et hovedansvarlig slik at postens 100-felt kan populeres.

Slike enkle tiltak har gjort oss i stand til å kunne levere data til prosesser som da genererer andre formater enn den som er i databasen; dette er slik det skal være — utvekslingsformater som MARC skal være til kompatibilitet med andre og skal være utdatamål for systemet, ikke en del av selve systemet.

Det nye biblioteksystemet går lengre enn noen andre lignende system i å opprettholde kompatibilitet med andre systemer; det kan konfigureres til å produsere data i et hvilket som helst standardisert format helt automatisk gjennom kjerneontologien og noen mappinger for utdata.

Det ble nevnt BIBFRAME, fra utviklerens ståsted er det helt banalt å produsere BIBFRAME fra dagens system, men funksjonaliteten er ikke bestilt av oppdragsgiveren, selv om det hadde vært både lett og gøy å gjennomføre.

Et utfall av måten vi har jobbet med MARC er at vi har jobbet mer med å utvikle verktøy for bearbeiding av MARC-data enn jeg har gjort ellers i karrieren min. Gjennom arbeidet har vi avdekket mange rariteter og undringsmomenter. Blant disse, standardbibliotekene for MARC-prosessering mangler en grunnleggende, funksjonell sammenligningsfunksjon for valide MARC-poster.

Dette kanskje gjenspeiler tanken at standarden ikke er så standard likevel.

Advertisements
Posted in Uncategorized

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s