Datamodellering, strukturering og organisering
Vi er allerbedst til at skabe sikre data, skabe sammenhængende data og skabe værdi med data.
Emneord kan lede en på rette vej, og de kan inspirere en til at gå på opdagelse i nye materialer. Ved hjælp af emneord kan man surfe rundt på bibliotekernes digitale tjenester og finde det, man søger – eller måske det man ikke vidste, man søgte.
En stor del af bibliotekernes materialer har emneord, som beskriver indholdet. Men indtil videre har det ikke været muligt for biblioteksbrugerne at få overblik over, hvilke emneord man kan søge på, eller hvilke sammenhænge der er mellem emneordene.
Vi arbejder derfor på at udvikle et nyt hierarki for emneord – en såkaldt ontologi. Det skal gøre det nemt for bibliotekarer at finde og tildele relevante emneord til biblioteksmaterialer, og lettere for brugerne at søge og finde værdifuld information om et bestemt emne.
Der er omkring 20.000 emneord i ontologien, og flere kommer løbende til
Med ontologien – som er et meget komplekst hierarki – sættes emneordene ind i en logisk struktur, der skaber overblik, viser værdifulde sammenhænge mellem emneord og knytter relaterede emneord sammen. Hvert emneord bliver organiseret i et hierarki med overordnede, underordnede og beslægtede emneord.
Der kan for eksempel være mange forskellige måder at beskrive samme emne på, som ‘it’ og ‘informationsteknologi’. I ontologien samles forskellige betegnelser for det samme emne under én hat. Og emneord kan også være beslægtede, som for eksempel ‘hunde’ og ‘katte’, der begge er ‘kæledyr’. Det nye hierarki gør det enklere at navigere i emneordene og finde relaterede emneord.
Vi har ikke en dansk ontologi, så derfor bygger det nye hierarki på en eksisterende finsk ontologi kaldet YSO, der er lavet af det Finske Nationalbibliotek. YSO indeholder emneord på finsk, svensk og engelsk, så vi har maskinoversat de danske emneord til svensk og engelsk og på samme vis oversat emneordene i YSO til dansk. Efterfølgende har vi associeret emneordene med hinanden og skabt en dansk version af ontologien.
Men denne version er langt fra den endelige version. Ikke alle emneord har fundet sin rette plads i ontologien, og der er også relevante emneord, som af forskellige årsager ikke er blevet placeret automatisk. Derfor er en arbejdsgruppe i gang med at færdiggøre ontologien manuelt. Samtidig tester og kvalitetssikrer vi ontologien, så vi sørger for, at den er dækkende for brugernes behov.
Et hierarki for emneord er desuden et væsentligt skridt på vejen mod at automatisere processen med at tildele emneord.
Med udgangspunkt i ontologien – og ved hjælp af AI og sprogmodeller, der kan læse, forstå og skabe tekst – arbejder vi på et værktøj, som automatisk kan tildele emneord til tekster. Vi kalder værktøjet for AutoIndex.
AutoIndex skal være et supplement til den manuelle registrering af materialer. På sigt kan værktøjet også være en hjælp til at få tildelt emneord til materialer, der ellers ikke ville få emneord.