Data distributie do's and don'ts

Hallo allemaal,

Ik kreeg van een mede-lid van de Spatial Data on the Web werkgroep - uit Australië - een paar vragen over de do’s en don’ts van data distributie in Nederland. Hier op het forum zitten vast mensen die dit veel beter weten dan ik. Ook leuk dat mensen van de andere kant van de wereld ook in PDOK geïnteresseerd zijn, toch?

OK, here goes…

  1. Biedt PDOK een service waarbij je zelf data kan ‘uitknippen’ en naar je toe kan halen? Zij willen in Australië zoiets gaan bieden (a self service portal for clipping and shipping themed data) en evalueren nu een tool die Koordinates heet (https://koordinates.com).

  2. Zijn er in PDOK datasets waarin multi geometrieën zitten? Dus multipunt, multilijn, multivlak objecten? Volgens mij zitten die in ieder geval wel in de BGT. Of worden ze soms genormaliseerd? In Australië schijnen ze dit laatste van oudsher te doen, om dat ‘de klant dat wil’, maar inmiddels weet niemand meer wat de reden daarvan was.

  3. Hoe wordt data in PDOK gestructureerd, vooral data waarbij één object meerdere geometrieën kan hebben? In Australië bieden ze aparte tabellen voor de verschillende onderdelen d.w.z. inhoudelijke attributen, punten, lijnen en vlakken worden allemaal apart geleverd. Hier meen ik het antwoord wel op te weten: dit doet PDOK volgens mij niet, data wordt integraal geleverd in één bestand of één service.

Groeten Linda van den Brink, Geonovum

1 like

Dag Linda,

Hier zijn wat antwoorden op je vragen:

  1. PDOK biedt geen dienst waar je o.b.v. een eigen bounding box of polygon een gebied kan uitknippen. Wel zijn er verschillende downloadservices waarbij je eigen blokken kunt definiëren met een grootte tussen 2x2 en 64x64 km. Dit kan bij de BGT en Kadastrale Kaart.

  2. Meerdere zelfs. Inderdaad de BGT (bijv. panden en kunstwerken) en de BRT. Bij de laatste komt bij TOP10NL o.a. bij functionele, geografische en registratieve gebieden, alsmede plaatsen multipolygonen voor.

  3. Ook dit komt bij de BGT en TOP10NL voor. Bij de BRT heb je begroeid en onbegroeid terreindeel, wegdeel en ondersteunend wegdeel die allemaal een vlak en een kruinlijn hebben. Panden (multipolygonen) hebben ook nummeraanduidingen (punten), alhoewel je dit beter als een subfeature van panden kunt zien. Verder heb je bij de BGT zelfs openbareruimtelabels die van zichzelf geen geometrie hebben, maar meerdere subfeatures die wel punten hebben (de bijbehorende labelpunten). Bij de TOP10NL zijn er features die of punt en/of lijn en/of vlak kunnen zijn. Dit geldt voor o.a. inrichtingselementen, spoordelen, waterdelen en wegdelen. Wegdelen hebben naast een hoofdgeometrie (punt, lijn of vlak) ook een hartgeometrie (punt of lijn). De meeste TOP10NL features bevatten uiteindelijk maar een geometrie, maar wegdelen kunnen dus twee geometrieen bevatten.

4 likes
  1. Biedt PDOK een service waarbij je zelf data kan ‘uitknippen’ en naar je toe kan halen? Zoals Frank aangeeft, bij PDOK niet. Stond ooit wel in het ontwerp in 2011 maar is nooit geïmplementeerd. In andere portalen zoals het DINO Loket (www.dinoloket.nl) is dit wel geïmplementeerd mocht je een voorbeeld zoeken.

  2. Multipolygonen zijn vaak onhandig bij GIS analyses, met name bij ruimtelijke selecties. als je namelijk 1 polygoon van een multipolygoon selecteert, dan worden ze ineens allemaal geselecteerd, en dat is vaak niet wat je wilt. Bvb je hebt een buffer polygoon die snijdt (intersect) met 1 van de laten we zeggen 5 polygonen in een multipolygoon, dan worden ineens alle 5 polygonen geselecteerd, maar dat klopt ruimtelijk gezien niet. Vaak moet je om die reden eerst de multipolygon “exploden” (ook wel multipart to singlepart conversion genoemd ArcGIS Desktop) zodat deze uiteenvalt in individuele objecten voordat je je analyse uit kunt voeren. Om dat niet iedere keer te hoeven doen hebben ze waarschijnlijk besloten dat standaard te doen, dat zou de reden kunnen zijn.

  3. Bij de BRO data hebben we te maken met complex GML (GML met geneste structuur). Dit kan technisch gezien wel via WFS ontsloten worden, maar er is vervolgens geen GIS client die wat kan met complex GML. Daarom hebben we besloten om de complex GML te denormaliseren en als separate "platte"tabellen via WFS aan te bieden. Is begrijpelijker en een Desktop GIS kan daar wel wat mee.

2 likes

q1 Ha linda, nationaal georegister versie 2 had een functie om te clip-and-shippen (voor WFS services), helaas is deze functionaliteit er in versie 3.0 uitgevallen, hopelijk komt hij snel weer terug. Het product Georchestra heeft wel een aardige clip-and-ship tool. Voor geoserver zijn overigens diverse voorbeelden beschikbaar hoe je een WPS clip service in elkaar zet, als het puur om de service gaat.

q3 ik sluit me bij erik aan, het uitsplitsen van meerdere geometrie kolommen (en types) naar aparte tabellen/featuretypes doe je om eenvoudige gis clients te ondersteunen, vanuit data oogpunt is dit erg onhandig. Ik zou aanraden de brondata as is te ontsluiten (imgeo/inspire model), maar daarnaast uitgesplitste services aan te bieden voor eenvoudigere clients, bijvoorbeeld als database view op de brondata.

1 like