Ontsluiting datasets door (met name) kadaster

Beste forumgebruikers. Een onpopulaire mening op dit forum voor dataexperts/data engineers, maar:
De basisdatasets in Nederland zijn verschrikkelijk slecht ontsloten. Ik zal wat voorbeelden noemen:

  • De BAG bulkdownload is een mix van verschillende GML-formats en is niet door een regulier GIS programma in te lezen. De beloofde geopackage blijft uit, de klantenservice van het kadaster is dramatisch. Zelfs voor de WFS is een speciale plugin nodig in Qgis om dee goed in te lezen
  • Ruimtelijke plannen bevat belachelijk lange velden en een beschrijving om de data zo te filteren dat deze overeenkomt met wat je op ruimtelijke plannen ziet ontbreekt
  • In de bulkdownload van Ruimtelijke plannen (iig dubbelbestemmingen) zitten nu plotseling extra polygonen (de boundingboxes) overheen.
  • De kadastrale perceelsgegevens (bulk download) zitten vol met geometriefouten

En zo kan ik er nog een hele, hele lange lijst van maken. Als adviseur vraag ik mij af: Waarom? Waarom kan het CBS haar data zo ontsluiten dat het op meerdere manieren rechtsreeks in GIS-programma’s is in te laden, maar moet je voor data van het kadaster (de grootste ‘boosdoener’ in de lijst hierboven) een data engineer inhuren of de openbare data inkopen bij commerciĂ«le partijen die van de rommel iets werkbaars hebben weten te maken?

Ik heb deze vraag, meermaals en op verschillende manieren, aan het kadaster gesteld, maar ik krijg geen antwoord. Mischien kan iemand hier er een licht op schijnen?

2 likes

Gezien er veel vragen in je post staan, en die ook veel vraag doet oproepen, eens kijken of we dit kunnen beantwoorden.

Voor de goede orde, het is voor veel van die vragen niet aan mij om daar antwoord op te geven. Maar ik neem aan dat de ‘product-owners’ meelezen en hun reactie (uiteindelijk) kunnen geven.

Dus het is denk ik goed om een aantal dingen eerste verder helder te krijgen om je vragen beter te kunnen beantwoorden:

Kan je een voorbeeld geven? Ik ben bekent met de QGIS plugin voor WMS/WFS, maar niet met een mogelijk BAG ‘bulkdownload’ inlaad plugin

heb je ook hier een voorbeeld van?

Dit is een slechte zaak dat er niet voldoende/goed antwoord gegeven wordt op de vragen die jij hebt gesteld. Hopelijk dat we daar op deze manier wel beter gehoor aan kunnen geven.
(disclaimer: ik ken jou vragen niet, ik heb geen toegang tot de KCC, enz
 dus je zal je hier op het geoforum opnieuw moeten stellen)

Ik neem aan dat jij ook begrijpt dat niet 1 iemand hier direct antwoord op kan geven en dat er zeker enige tijd over zal gaan tot dat ‘alles’ is beantwoord.

De vragen die ik (en mijn collega’s bij PDOK) kan beantwoorden zijn van “technische aard”, vandaar (voor nu) mijn interesse in je opmerking naar voorbeelden.

disclaimer:
Om ook aan te geven als dit topic/reactie/enz
 lijkt te escaleren dan sluit ik het, dus het lijkt mij goed het allemaal netjes te houden.

3 likes

Hallo Martijn,

Als productowner van ondermeer LV Ruimtelijkeplannen.nl zal ik in gaan op enkele van jouw vragen welke op mijn voorziening betrekking hebben.
Je stelt een vraag over de lange namen. Heeft deze betrekking op een van de services van ruimtelijkeplannen.nl (herkenbaar aan ruimtelijkeplannen.nl in de url) of van een van de services van PDOK? Het klopt in ieder geval dat er regelmatig lange namen zijn. Dat is het gevolg van de complexiteit van de gegevens, de RO-standaarden maar soms ook vanwege ander verplichtingen, bv vanuit INSPIRE. Ik wil jou graag verder helpen, wellicht kun je anders nog wat details aanleveren? Dat mag via het contactformulier ( https://formulieren.kadaster.nl/contact_ruimtelijkeplannen_nl ) van ons KCC Ruimtelijkeplannen.nl ter attentie van mij, vermeld dan in ieder geval jouw naam en mailadres. Ik neem dan contact met jou op.
Wat betreft de boundingboxes in de dubbelbestemmingen van de bulk: betreft dit de atomfeed welke via PDOK beschikbaar wordt gesteld? Ook deze vraag zal ik volgende week nog even uitzoeken. Wellicht kun je ook wat meer info aanleveren hoe en sinds wanneer je hebt opgemerkt dat de boundingboxes er ineens overheen liggen.
Tot slot ben ik benieuwd op welke wijze je contact hebt gezocht met Kadaster. Weliswaar ben je daar nu niet mee geholpen maar wellicht kan ik wel aangeven waar het niet goed is gegaan of waar wellicht nig een en ander anders zou moeten.
Met vriendelijke groet,
Merijn Kerlen

2 likes

Beste Martijn,
Ik heb jouw bericht gelezen en ik vind jouw ervaring met het kadaster vervelend. Graag wil ik in contact met jou komen om eea op te helderen en daarmee jou te helpen.
Ik heb geen gegevens van jou en daarom vraag ik jou of jij mij via e-mail wil contacten.

Vriendelijke groet,

Fons Sanders
Product manager PDOK
Fons.Sanders@kadaster.nl

Hallo Wouter,

bedankt voor je antwoord. Voor mij is er eigenlijk maar 1 vraag: Waarom worden dit soort datasets niet in een bestandsvorm/wijze ontsloten waar gis-programma’s rechtstreeks mee overweg kunnen en zonder basisfouten zoals geometriefouten.

Verder:
Plugin voor Qgis: Dit stond in een antwoord van het KCC op de vraag hoe je aan een landelijke dataset moet komen. In de vraag stond terloops dat de wfs niet geschikt is voor een bulkdownload en dat er bij gebruik in Qgis met de standaard wfs-optie in Qgis nog wel eens panden ontbreken.

Geometriefouten: Ik heb de geometrieën in Qgis gerepareerd (dat lukte in FME niet eens) en daarna de brondata weggegooid om ruimte besparen. Ik kan niet heel snel een voorbeeld tevoorschijn toveren

Hallo Merijn,

Mijn opmerkingen hebben betrekking op de bulkdownload van PDOK. Sommige velden hierin hebben meer dan 500 tekens. Ik heb de bulkdownlaod gisteren gedaan en tot nu toe alleen de dubbelbestemmingen bekeken. Ik zal het contactformulier invullen.


whats gif

Om deze vraag toch even op te splitten:

Ik neem aan dat je dan doelt op de ‘extended’+CityGML/IMGEO/IMRO2012/enz
 Ik kan je hier alleen mijn persoonlijke mening/perspectief geven (dus als andere toevoegingen hebben/verbeter punten, vul aan of verbeter).

Dus vanuit mijn perspectief is dit een ‘probleem’ omdat deze modellen ondertussen vrij ‘oud’ zijn. Ze zijn bedacht/ontworpen soms meer dan 10 jaar geleden
 en de wereld ziet er nu ondertussen anders uit, dus ook in de manier waarin we verwachten te werken met (geo)data. Dit sluit niet meer ‘goed’ aan met de huidige realiteit. Het goede nieuws is dat dit probleem wel bekend/onderkend is door veel van deze bronhouders/landelijkevoorzieningen/enz
 en vanuit PDOK zijn we druk bezig met de voorbereidingen om weer ‘aansluiting’ te zoeken m.b.t. hoe data op een makkelijke manier ontsloten kan worden.

Zie ook sessies als: Kennissessie geodata uitwisselen in lichte formaten | Geonovum

Tja, “basisfouten”
 dit is ‘helaas’ een lastig onderwerp en is niet altijd zo zwart-wit. Vanuit ons (PDOK) perspectief doen wij ‘niks’ met de geometry ook al is deze ‘fout’. Omdat dit niet onze taak/verantwoordelijkheid is, gezien wij dan ‘officiele’ data zitten manipuleren. M.a.w. als wij ‘zomaar’ data wijzigen (ook al is het om te verbeteren) dan hebben wij (PDOK) iets uit te leggen

Dus wat is dan wel de ‘plek’ om dit soort ‘fouten’ te fixen, de LV o.i.d., de bronhouder? Met de huidige manier van ‘werken’ ligt de verantwoordelijkheid bij de bronhouder (een gemeente/provincie, “correct me if I’m wrong”) dit maakt het (helaas?) gefragmenteerd aanzien niet iedere gemeente werkt met dezelfde tools, en dat als je fouten tegenkomt uit moet zoeken wie de bronhouders en die daar op moet wijzen. We hebben voor de BAG/BRT/BGT hier de terugmeldvoorzien waar dit gemeld kan worden:

en bijvoorbeeld voor de BRT/BGT

Om de implicatie m.b.t. datafouten helder te krijgen: Als wij(PDOK, of iemand anders ‘verder’ in de keten) de geometrien zitten te herstellen betekent dat de brondhouder altijd ‘kapotte’ geometrien blijft aanleveren i.p.v. dat zijn (als bronhouder) deze stap aan het begin van de keten herstellen/verbeteren.

Dus samengevat:

  1. bestandvorm en ontsluiting naar applicaties: Historisch dingetje en ‘we’ zijn al bezig dit te verbeteren in samenwerking met Kadaster/Geonovum/BZK/LV’s/enz


  2. datafouten: Deze verantwoordelijkheid ligt (volgens mij
) bij de bronhouder, en fouten kunnen ook dan (nu) alleen hersteld worden door de betreffende bronhouder te direct te informeren of via bijv. verbeterdekaart.nl

1 like

Dit zou geen terloopse melding moeten zijn maar een dikgedrukte met een rode rand er omheen :slight_smile:

Dat de plugin dan gebouwen laat ontbreken komt omdat WFS maar een beperkte hoeveelheid doorlaat. Dat ligt niet aan de plugin, je haalt gewoon niet meer gegevens op dan het maximaal aantal objecten dat de WFS service toestaat.

Hallo Anton,

Excuses, ik was niet duidelijk. de WFS heeft inderdaad beperkingen, maar ook als je dara rekening mee houdt door op een klein gebied (bv 500 panden) inzoomd kunnen er met de standaard wfs-applicatie binnen Qgis panden ontbreken. Daarom schijnt er een speciale plugin gemaakt te zijn (ik heb die nog niet bekeken). Ik vind dit een beetje vreemd, zeker omdat het niet iets is wat algemeen bekend is.

Beste Wouter,

Bedankt voor het uitgebreide antwoord, dat maakt het voor mij al iets duidelijker. Wat geometriefouten betreft zaten er in ieder geval zelfkruisende polygonen in, ik neem aan dat er geen discussie is over of dit een geometriefout is of niet. Bij de volgende keer dat ik de analyse moet uitvoeren zal ik de dataset weer downloaden en hier wat voorbeelden zetten.

Hallo Martijn,
De rechthoeken in de dubbelbestemmingen kan ik niet reproduceren. Mogelijk dat er bij het verwerken in de GIS-applicatie (QGis) iets is misgegaan, mogelijk een geheugenprobleem. Oplossing kan bieden om de GML met ogr2ogr om te zetten naar een Geopackage (commando: ogr2ogr -f GPKG dubbelbestemming.gpkg dubbelbestemming.gml). Geopackages in QGis werken sowieso sneller dan de oorspronkelijke GML’s. Ogr2ogr is meegeleverd met QGis, zie bestand OSGeo4W.bat in QGis-folder. De gpkg-bestanden zijn ca 2/3 van het oorspronkelijke gml-bestand.
Wat betreft de lange velden, deze hebben betrekking op de velden verwijzingNaar zoals verwijzingenNaarIllustraties, verwijzingenNaarTekst en verwijzingNaarExternPlan. De inhoud van deze velden is afhankelijk van diverse factoren; RO-standaarden, gebruikte url bronhouder (gemeente, provincie of Rijk) in combinatie met Ruimtelijkeplannen.nl, verwerking door bronhouder, etc. Ook zijn er situaties dat er in 1 veld meerdere verwijzingen zijn opgenomen.
Hieraan kunnen wij niets doen, dit is de wijze waarop Ruimtelijkeplannen.nl aan de INSPIRE-verplichtingen moet voldoen (Europese wet- en regelgeving).

Wel zijn er enkele alternatieven;
Omzetten naar Geopackages, daarmee kan QGis betere en sneller overweg.
Ruimtelijkeplannen.nl beschikt over een eigen WFS (app:Besluitgebied) waarbij je altijd over de actuele situatie beschikt,. Echter ook deze bevat de lange veldgegevens maar is makelijker te omzeilen als je deze velden niet nodig hebt. De bulkbestanden worden namelijk maar 1x per maand ververst. Let er bij de WFS even op dat het op dit moment nog onduidelijk is wat hiermee gaat gebeuren bij inwerking treden Omgevingswet. Deze Omgevingswet staat voorlopig gepland voor 1 januari aanstaande. Let wel even op dat de bevragingen zijn beschermd tot maximaal 12.500 features per request.
Vanuit het DSO (Digitaal Stelsel Omgevingswet) hebben we een API voor de ruimtelijke plannen ontwikkeld;
https://aandeslagmetdeomgevingswet.nl/ontwikkelaarsportaal/api-register/
Ruimtelijke plannen opvragen - Ontwikkelaarsportaal

schermafdruk dubbelbestemingen;

1 like

Dit topic is 180 dagen na het laatste antwoord automatisch gesloten. Nieuwe antwoorden zijn niet meer toegestaan.