In het kader van de consistentie (en hopelijk toekomstige integratie) van de Bestuurlijke Gebieden dataset, wilde ik graag het volgende nog even onder de aandacht brengen. Op dit moment kunnen de Bestuurlijke gebieden gedownload worden als GML en als GPKG. Als ik vervolgens kijk naar de properties van de elementen dan kom ik volgende verschillen tegen:
GML:
property ‘code’ is numeriek
properties zijn CamelCase (e.g. ligtInProvincieCode)
GPKG:
property ‘code’ is alphanumeriek (gaat een ‘0’ aan vooraf)
properties zijn snake_case (e.g. ligt_in_provincie_code)
Het lijkt me zinvol om dat gelijk te trekken.
Misschien hebben anderen hier ook nog een mening over. Mijn persoonlijke voorkeur gaat uit naar:
- een numerieke code
- snake_case (vanwege potentiële niet-hoofdletter-gevoelige zoek acties, en vanwege gebruikersperspectief.)
En als ik dan toch bezig ben zou ik de ligt_in properties sowieso laten vervallen omdat het voornamelijk leidt tot onnodige samenhang die door een beetje zichzelf respecterend GIS systeem zo ook wel opgelost wordt. Wat je nu krijgt is dat de provinciegrenzen niet overeen hoeven komen met de gemeente-properties, en die kruisverbanden wil ik in een dataset eigenlijk niet tegenkomen.
Er zou natuurlijk wel een samenhang kunnen zijn qua bestuur en die mag uiteraard best weergegeven worden, maar een dergelijke property moet dan wel geabstraheerd worden, dus liefst ook overdraagbaar zijn naar (en zin hebben voor) alle elementen in de dataset. Ik zie dus liever een property als:
valt_onder_gebied_code
En als we op (korte?) termijn bijvoorbeeld ook Waterschapgebieden gaan toevoegen dan kan een ligt_in property weer hele andere overwegingen met zich meebrengen. Misschien moet een ligt_in property dan een (komma-gesepareerde?) lijst zijn?