Het agentschap Onroerend Erfgoed zet al sinds 2009 in op kwalitatieve thesauri. Thesauri zijn hiërarchische woordenlijsten die gebruikt worden om terminologie te standaardiseren. Vanaf deze week kan iedereen onze thesauri gratis downloaden en, met bronvermelding, gebruiken voor eigen projecten.

Met thesauri indexeer je informatie, zodat je ze gemakkelijk kan terugvinden in bijvoorbeeld een databank. Wij maken er al jaren gebruik van. Telkens je in onze inventaris zoekt naar fonteinen of in de besluitendatabank naar opheffingsbesluiten maak je onbewust gebruik van deze achterliggende structuren. Onze grootste thesaurus is deze van de erfgoedtypes. Daarnaast hebben we ook thesauri voor dateringen, stijlen en culturen, materialen, gebeurtenissen, boomsoorten, erfgoedwaarden en besluittypes.

De Vlaamse overheid kiest resoluut voor open data. In het kader daarvan willen wij onze thesauri graag met iedereen delen. Dat kan op verschillende manieren.

  • Voor elk concept in de thesaurus bestaan er machineleesbare versies. Zo kan je een Turtle- of RDF/XML-bestand downloaden dat je alles vertelt over het concept fazantenhokken. Elk van deze bestanden bevat links naar andere concepten binnen de thesaurus. Soms zijn er ook links naar andere, internationale thesauri, zoals de Art & Architecture Thesaurus van het Getty of de Thesaurus of Monument Types van Historic England.
  • Wanneer je liever een thesaurus in zijn geheel overneemt, dan kan je gebruik maken van de downloads die we aanbieden. Ga hiervoor naar de thesaurus van je voorkeur en kies voor 'Full RDF/XML' of 'Full N3/Turtle'. Zo kan je vanaf de thesaurus 'erfgoedtypes' al onze definities voor alle types erfgoed downloaden. Deze bestanden zijn natuurlijk zwaarder dan de individuele bestanden, maar zo heb je alle informatie wel in één keer. Dat is gemakkelijk als je bijvoorbeeld je eigen RDF-triplestore of SPARQL-endpoint wil opzetten. Met andere woorden: wanneer je zelf iets wil doen met een lokale kopie van onze gegevens.
  • Wil je onze datasets rechtstreeks bevragen? Dat kan ook, met een gloednieuwe server: de LDF server voor Onroerend Erfgoed thesauri. We kozen voor deze server voor technologie van eigen bodem, namelijk Linked Data Fragments (LDF). Het werd gemaakt door UGent en Imec als alternatief voor de traditionele SPARQL-server. Het grote voordeel van LDF is dat het onze servers minder belast. We zijn er dan ook van overtuigd dat je als eigenaar data en gegevens gemakkelijker zal kunnen delen, zonder al te grote inspanningen. Op onze LDF-server kan je bijvoorbeeld alle waarden die in oudere erfgoeddecreten voorkwamen, terugvinden, alle erfgoedtypes die exact overeen komen met een concept in een andere thesaurus of alle voorkeurslabels voor gebeurtenissen.
  • De thesaurussite werd gebouwd met Atramhasis open source software, geprogrammeerd door het IT-team van Onroerend Erfgoed. Deze open source software laat toe dat ook andere organisaties op basis van onze gegevens eigen thesauri kunnen opmaken, beheren en ontsluiten. Iedereen, binnen en buiten de Vlaamse Overheid, kan de broncode downloaden van Github en er zelf mee aan de slag gaan.

We hopen dat zoveel mogelijk mensen onze thesauri hergebruiken in eigen projecten of eigen vocabularia ontwikkelen en die koppelen aan de onze. Ga je effectief aan de slag met onze gegevens, referereer dan aan ons met (c) agentschap Onroerend Erfgoed. Wij kiezen voor de licentie voor gratis hergebruik. Dat wil zeggen dat je onze thesauri mag hergebruiken zoals je wil zolang je maar een correcte bronvermelding toevoegt. Omdat onze thesauri levende gegevensbestanden zijn die regelmatig uitgebreid of gewijzigd worden, raden we je aan ook altijd te vermelden op welke datum je de thesaurus in kwestie verwerkt hebt.

Heb je nog vragen, contacteer ons gerust op Twitter (@vioe) of via ons contactformulier. We helpen je graag verder. 

Links