Metadata: versies, edities, updates, variaties van datasets (en services)

Leeswaarschuwing: beetje academische discussie

In de ISO 19115 standaard kun je op een aantal plaatsen iets aangeven over editie/versie/update van een dataset:

  • datum van de bron (CI_Date.date)
    Nb. creatie en/of publicatie en/of revisie
  • status (MD_DataIdentification.status)
  • herzieningsfrequentie (MD_MaintenanceInformation.maintenanceAndUpdateFrequency)
  • Datum volgende herziening (MD_MaintenanceInformation.dateOfNextUpdate)
  • versie (CI_Citation.edition)

(in Nederlands metadata profiel op ISO 19115 voor geografie versie 2.1.0 vind je de officiële NL uitleg)

Voor mijn gevoel zitten er afhankelijkheden tussen in ieder geval de eerste 4: denk aan gemeentegrenzen die een jaarlijkse herziening kennen (ik laat de tussentijdse update ivm Weesp bij A’dam even buiten beschouwing).
Als er een jaar géén grenswijziging is: wat is dan de actuele datum/status etc?

“versie” vind ik een buitenbeentje; wordt vaak gebruikt voor een opeenvolgende aanduiding (versie 2021, versie 2022) maar kan minstens net zo goed worden gebruikt voor nominale aanduidingen: gemeentegrenzen met water vs. gem.grenzen zonder water, gedetailleerde vs. gegeneraliseerde gemeentegrenzen, BRT-achtergrondkaart in 3 stijlen.
De NL-term versie suggereert iets opeenvolgends, terwijl de Engelse term “edition” voor mijn gevoel meer ruimt biedt voor “standaard edition”, “special edition” etc., dus meer iets als “variaties”
(of zou je dat in datasetseries bij elkaar kunnen houden?)

Tot zover mijn voorzet.
Ik ben benieuwd naar reacties hoe data-aanbieders hier mee om gaan, én hoe data-gebruikers hiermee om zouden willen gaan.

Gert-Jan

1 like

Interessant. Als data gebruiker zou ik verwachten dat “datum van de bron” de datum bevat van de “status” van de data. Alleen: Als ik naar die waardelijst MD_ProgressCode kijk, dan klopt dat semantisch niet met wat ik zou verwachten… Een ‘progress’ of voortgang vind ik iets anders dan een status.
Maar afgezien daarvan zou ik, als ik de laatste stand van zaken zou willen hebben, altijd op zoek gaan naar de meest recente datum van de bron, met een progress Completed. Hangt ook erg af van mijn eigen update frequentie natuurlijk.

In principe de datum van het vorige jaar met de status ‘completed’ (yuck: dat voelt semantisch niet goed, ik zou liever iets als ‘actueel’ of ‘current’ of ‘huidig’ of zoiets zien als status…). Alleen ga je dan het probleem krijgen dat de datum volgende herziening al verlopen is (als die is ingevuld uiteraard), maar omdat er geen herziening nodig was is de dataset niet veranderd, en dus zijn de datum van de bron en de status niet veranderd… de vraag is dan of je de metadata moet bijwerken als de data niet gewijzigd is - en of dat dan een wijziging van de data is of niet. Dat kan een interessante catch22 worden op die manier :wink:

Ik ben benieuwd naar inbreng van anderen eerlijk gezegd, vooral vanuit Geonovum.