Werk in uitvoering: Analyse gestructureerde vocabulaires Rijksmuseum

Door Chris Dijkshoorn

Het Rijksmuseum gebruikt gestructureerde vocabulaires om de beschrijvingen van objecten consistent te houden. Er zijn meerdere vocabulaires, zoals materialen, technieken, plaatsen en personen. Het personen vocabulaire bevat bijvoorbeeld één concept voor Rembrandt, waar verschillende schrijfwijzen van de naam aan kunnen worden gerelateerd. Andere organisaties zoals The Getty Research Institute houden soortgelijke vocabulaires bij. Het concept voor Rembrandt heeft in het vocabulaire van het Getty bijvoorbeeld 175 verschillende schrijfwijzen!

Quinten van Langen, student informatiekunde aan de Vrije Universiteit Amsterdam, heeft de gestructureerde vocabulaires van het Rijksmuseum doorgelicht in het kader van zijn master thesis. Hierbij heeft hij gekeken naar hoeveel van de Rijksmuseum concepten ook voorkomen in andere vocabulaires en hoe de concepten zich tot elkaar verhouden. Gestructureerde vocabulaires kunnen namelijk hiërarchisch gestructureerd zijn, bijvoorbeeld door generieke concepten te relateren aan specifiekere concepten. Denk hierbij bijvoorbeeld aan het concept voor hout, wat een plantaardig materiaal is en als specifiekere concepten zachthout en hardhout onder zich heeft.De belangrijkste bevindingen van Quinten waren de volgende:

– Maar 8% van de Rijksmuseum concepten is gerelateerd aan een extern vocabulaire    (zoals het Getty)
– Maar 5% van de Rijksmuseum concepten is vertaald
– 29% van de Rijksmuseum concepten vormt geen deel van een hiërarchie

Om deze percentages te verhogen gaan we projectmatig aan de slag met het verbeteren van de thesaurus. Hout, uit de materialen thesaurus, is een eerste onderdeel waar we naar hebben gekeken. In overleg met de meubel conservator en gebaseerd op de structuur van de Getty thesauri, proberen we zo goed mogelijk structuur aan te brengen in dit gedeelte van de thesaurus.

foto Chris
Thesaurustak van hout

De bevindingen die we hierbij opdoen zullen we gebruiken om ook andere gedeeltes van de thesaurus te verbeteren en het toevoegen van nieuwe concepten beter aan te pakken.

Geef een reactie

Ontdek meer van The Art of Information

Abonneer je nu om meer te lezen en toegang te krijgen tot het volledige archief.

Lees verder