Ontbrekende postcodes in de BAG

Bij het werken met adres matching merkte ik dat er een niet te verwaarlozen aantal postcodes ontbreekt in de BAG. Een flink aantal bedrijven (Handelsregister, KvK) heeft postcode mismatches. Soms ligt dat aan de NHR, soms aan de BAG. Soms zijn ze in de BAG heel makkelijk aan te vullen, bijv. in flatgebouwen, maar er zijn natuurlijk flink wat adressen waarvoor geen postcode geldt, dus het blijft behelpen.
Aanvullen van ontbrekende postcodes is ook niet triviaal; denk aan zelfde kant van een weg naast kortste afstand. Geautomatiseerd zijn er fouten, en handmatig is het veel werk (voor de bronhouders).
De analyse die ik gedaan heb suggereert dat ruim 190000 adressen geen postcode hebben (atom feed december). Daarvan lijkt minstens de helft eenvoudig automatisch aan te vullen, zij het met risico op fouten.
De vragen, dan, tenslotte:

  1. wordt er al iets ondernomen op dit punt?
  2. Is er behoefte aan input (algoritme, tabel met aanvullingen etc.) tbv melding?
    Mocht die behoefte bestaat, kan ik een postgresql backup bestand beschikbaar stellen of een gecomprimeerde csv.
1 like

Volgens mij (want uit mijn hoofd):

  • De BAG is leidend dus adressen in het NHR zouden altijd uit de BAG moeten komen. Werkelijk bestaande adressen die niet in de BAG zitten zouden door de betreffende gemeente moeten worden toegevoegd. Je kunt hiervoor een terugmelding doen:
    Fout in BAG melden - Kadaster.nl zakelijk

  • In de BAG zitten geen postbus-adressen en in het NHR waarschijnlijk wel

  • Niet alle adressen (eigenlijk nummeraanduidlingen) in de BAG hoeven een postcode te hebben. Bijvoorbeeld een transformatorhuisje, waar niemand woont of werkt en waar geen post bezorgd hoeft te worden.
    Praktijkhandleiding BAG: Kunnen alle adresseerbare objecten een postcode krijgen?

Niemand kan/mag de landelijke BAG automatisch aanpassen, dat moet door alle bronhouders afzonderlijk worden gedaan. 190.000 lijkt me trouwens wel veel. Is dat inclusief historie? Ik heb even geen BAG database bij de hand nu. Misschien heb je wat voorbeelden van fouten?

bij 1e bullet: De relatie tussen gemeenten en postnl is in mijn beleving complexer. Zie Convenant inzake postcodes: overheid en PostNL continueren samenwerking bij postcodetoekenning | Basisregistraties | Geobasisregistraties en (daaruit) Publicatie Convenant inzake postcodes in Staatscourant 2014 - nr. 3779 | Convenant | Geobasisregistraties, met als citaat:
“De nieuwe werkwijze, zoals vastgelegd in het convenant, lijkt voorlopig veel op de
huidige informele werkwijze bij de postcodetoekenning. De gemeenten kennen
adressen toe aan adresseerbare objecten, conform de wet- en regelgeving BAG,
en leveren deze aan PostNL. PostNL kent aan deze adressen postcodes toe en
levert de postcodegegevens terug aan de gemeenten. Als PostNL een postcode
heeft toegekend dan moet de gemeente die in de BAG opnemen. Kortom PostNL
geeft de postcodes uit en niet de gemeenten.”

2e bullet: Ik heb vestigingsadressen gebruikt uit de NHR en ook de weinige postbusadressen die hier opgegeven waren verwijderd. Dus postbusadressen zijn niet de oorzaak.

3e bullet: dit is correct. Die query had ik nog niet gedaan, maar gebruiksdoel ‘overige gebruiksfunctie’ is is de overgrote meerderheid bij postcodeloze adressen. Als we deze adressen niet als postcode-waardig beschouwen, blijven er (minimaal) +_ 3500 adressen (met een menselijk gebruiksdoel, als ik zo mag uitdrukken) over.

Maar, dat is nog steeds veel voor individuele meldingen.
Zie Dropbox - geenpc.xlsx - Simplify your life, of als een excel bestand niet door de security komt, Dropbox - geenpc.csv - Simplify your life. Beide bestanden zijn kleiner dan 1 MB. Ze zijn gesorteerd op gemeente, woonplaats, openbareruimte enz. met vermelding van de nummeraanduiding identificatie.

In de BAG enkele adressen uit jouw lijst die in de gemeente Utrecht liggen gecheckt. Het viel me op, dat sommige adressen waren aangemerkt als ‘nevenadres’. Ook lag een adres in een pand met status ‘Bouwvergunning verleend’. Deze is misschien nog niet eens bekend bij PostNL. Misschien dat je op basis van die attributen een verklaring kan vinden voor het ontbreken van postcodes.

1 like

Heb er ook een paar bij mij in de buurt gecheckt. Een adres lag op een soort zorgcomplex en een andere in een “bouwvergunning verleend”. Verder zie ik veel huisnummertoevoegingen in je lijst, wat kan duiden op garageboxen en vakantiepark-woningen. Ik raad je aan de adressen op een kaart af te beelden om inzicht te krijgen in het probleem.

Waar heb je de postcodes eigenlijk voor nodig? Kun je niet koppelen op adres? Misschien heeft het NHR zelfs wel VBO id’s beschikbaar?

Los van objecten die nog in de pijplijn zitten (“bouwvergunning verleend”):
tussen ca. 2011 en 2014 was er gedoe tussen PostNL en Staat der Nederlanden over postcodes. Die zijn nl. intellectueel eigendom van PostNL die dat via dochter Cendric commercieel uitbaatte. Toen de Staat der Nederlanden die postcodes opnam in de BAG en die als open data ter beschikking stelde ontstond het gedoe.
In 2014 is dat opgelost met een nieuw convenant, maar in de periode 2011-2014 haperde de uitgifte af en toe. Dat is in 2014/2015 zoveel mogelijk alsnog rechtgezet, maar niet 100%.
Zou me dus niet verbazen als de ontbrekende postcodes uit die tijd stammen.

Ik vraag me ook af of de wijze waarop je postcodes bij adressen controleert wel klopt, of andersom: of het bij de BAG (WMS) wel goed gaat. Het kan zijn dat nevenadressen op diverse plekken geen postcode meekrijgen, terwijl ze die wel hebben: in bijvoorbeeld de WFS zouden niet alle nevenadressen mogen voorkomen bijvoorbeeld, dus daar zit al iets incompleets.

Als ik uit jouw lijst Fazantstraat 6 a Wieringerwerf (1911200000588474) check, dan geeft een GetFeatureInfo inderdaad geen postcode. Maar in diezelfde GetFeatureInfo response zit wel een rdf_seealso, met als inhoud http://bag.basisregistraties.overheid.nl/bag/id/nummeraanduiding/1911200000588474. En als ik die controleer, dan zie ik daar wel degelijk een Postcode ingevuld (1771CR). Het is ook een nevenadres, dus misschien geven de diverse services van nevenadressen geen postcode terug?
Voor de Sotaweg 29 A20 Roelofarendsveen zie ik hetzelfde gebeuren. Van het adres in Wieringerwerf weet ik dat het een voormalig bedrijfspand is, waarin appartementen zijn gebouwd voor tijdelijke werknemers zoals bollenplukkers en zo. Het pand aan de Sotaweg lijkt vergelijkbaar (maar ken ik niet ter plaatse).

Verder:

Dat is naar mijn mening wat te kort door de bocht. PostNL is inderdaad verantwoordelijk voor het toekennen van postcodes aan adresseerbare objecten, maar de gemeenten zijn verantwoordelijk voor 1. het aan PostNL doorgeven van adresseerbare objecten die in aanmerking komen voor een postcode en 2. het vastleggen van die postcode in de BAG. En Postcode is daar geen verplicht veld, die kan en mag leeg blijven. Dus als je in de BAG naar postcodes zoekt, dan zijn het de gemeenten die daarvoor verantwoordelijk zijn.

En ik ben het volledig eens met Raymond: De adressen uit de NHR moeten uit de BAG komen, en als het NHR een adres mist moeten ze dat melden via de BAG.

Huisnummertoevoegingen. Deze zijn ook vaak in gebruik in flatgebouwen. Aan de gebruiksdoelen is te zien dat alle adressen postcode-waardig zijn, denk bijv. aan het gestelde in de brief van (destijds) min IenM aan de gemeenten. Daar wordt het belang van postcodes voor diverse dienstverleningen zoals internet, digid e.a. genoemd. Het is dus niet juist om hier makkelijk langs heen te lopen in de veronderstelling dat het wel garageboxen zijn, als het gebruiksdoel duidelijk maakt dat dit niet het geval is.

Koppelen op adressen. Dit is een interessant punt. Het blijkt dat zowel straatnamen als woonplaatsnamen in de NHR niet 1 op 1 koppelen met de BAG. Ik heb voor beiden soorten namen een tussentabel gemaakt, maar die is niet gegarandeerd juist, al heb ik de woonplaatsen wel redelijk op orde. Natuurlijk koppel ik primair via postcode, huisnummer, huisletter etc., maar dat lukt niet altijd; omdat er ook aan beide zijden postcode problemen zijn, is het adres als consistentie check nuttig ook voor geslaagde koppelingen. BAG woonplaats namen dubbelen vrij vaak omdat ze maar zelden gebruik maken van bijv. een provincie-aanduiding.

NHR en VBO’s c.q. koppeling met de BAG. NHR heeft wel ergens gesteld dat de koppeling met de BAG klaar is (referentie moet ik opzoeken), maar geen enkel veld in mijn leveringen komt in aanmerking. Het veld vestigingsnummer (vgnr) lijkt op een BAG identificatie minus het woonplaatsdeel, maar dat werkte niet uit.

Kaart: ik heb de adressen op de kaart, uiteraard en ter informatie in een geopackage gezet.
Zie Dropbox - geenpc.gpkg - Simplify your life
Ik heb het kaartbeeld nog niet echt geanalyseerd, er zijn wel een paar opmerkelijke gevallen, zoals een grote concentratie op het Chemelot terrein (gem. Geleen) en bij Tata Steel (IJmuiden). Verder op het oog meer verspreid.

Deze Chemelot adressen liggen niet aan een openbare ruimte dus ik kan me wel voorstellen dat ze geen postcode hebben. Zelfde als geldt voor huisjes op een vakantiepark.

Verder zie ik veel puntjes in het gras of bouwput staan, dus dat zijn de “bouwvergunning verleend” gevallen. Ik denk dat de meeste wel verklaarbaar zijn, en de echte fouten kun je terugmelden.

Adressen in de NHR komen zeker niet systematisch uit de BAG, al kan de BAG wel incidenteel/frequent als hulpmiddel gebruikt zijn. De NHR is natuurlijk ook ouder en wordt, voor zover ik weet, niet systematisch herzien. (Woon)Plaatsnamen en straatnamen corresponderen slecht, bij straatnamen zijn diverse afkortingen gebruikt (str, ln, mgr etc), dat lijkt te maken te hebben met een fixed length fieldsize in NHR. Bij plaatsnamen geldt dat die vaak overeenkomen, maar dat NHR namen soms wat uitgebreider zijn (toegevoegde provincie of gemeente aanduiding). Het lijkt of er een dubbele standaard is, “officiĂ«le” naam die niet altijd gelijk is aan de BAG naam. Misschien ook een PostNL ding, ik weet het nog niet. Misschien heeft mijn opdrachtgever geen optimale uitvraag gedaan voor de NHR, dat kan ik nog eens navragen.

Adres controle, BAG WMS en WFS. Voor de grote queries ga ik uit van een atom feed (de meest recente als het goed is). Daar is idd geen sprake van een rdf_seealso, dat is nieuw voor mij. Wel ben ik van mening dat een postcode in het systeem moet staan en niet alleen in een ‘overigens’ mededeling.

Hoofd- en nevenadressen
De atom feed zet ik in postgresql en dan gelden de gebruikelijke relaties. Hoofdadres vs nevenadres volgt alleen uit de verblijfsobjecten (aangevuld met lig- en standplaatsen): of de nummeraanduiding gelijk is aan hoofdadresnummeraanduidingref of voorkomt in nevenadresnummeraanduidingref.

In de brief van IenM aan de gemeenten staat met zoveel woorden dat ook adresseerbare objecten zonder eigen postaal afgiftepunt in aanmerking komen voor een postcode; dat lijkt mij duidelijk te slaan op nevenadressen, wat vervolgens bevestigd wordt via bepalingen over gebruik huisletter en huisnummertoevoeging.
Een richtlijn voor postcode toekenning zou best helpen. Is de praktijkhandleiding BAG als bron hiervoor bruikbaar? (zoeken op postcode in) Praktijkhandleiding BAG: Zoek
 geeft mij een redelijk duidelijk beeld. Daarin worden alle ‘menselijke’ verblijfsobjecten (aangevuld met lig- en standplaatsen naar ik aanneem) als postcode-waardig bestempeld.

Gevoelsmatig ga ik uit van een reele behoefte aan openbare diensten, en dan denk ik aan woonadressen (hoofd en neven), ook op een vakantie park (waar ze m.i. als logies en niet als woonfuncties geboekt zouden moeten zijn tenzij de gemeente echt wonen bedoelt); bedrijven (in de NHR zijn slechts grofweg 300 van de 3,7 miljoen vestigingsadressen zonder postcode) dus industrie, kantoor, winkel, zeker als het een hoofdvestiging betreft; bijeenkomstfunctie niet persé, gezondheidszorg altijd, logies niet persé, onderwijs altijd, sport niet persé.

De ‘niet persé’ gevallen zal ik markeren. Bij bedrijven lukt nuancering naar vestigingstype nog onvoldoende, dus zonder nuance.
Wat status betreft, zal ik beperken tot status like ‘Verblijfsobject gevormd%’ (2x) or status = ‘Verbouwing gebruiksobject’ (geen adreswijziging). De praktijkhandleiding heeft diverse onderzoeken (postcodes en woonplaatsen), toegespitst op strijdigheden, met de tip om ook op recent te testen (4 weken) als tijd nodig voor het toekenningsproces.
Als gewenst, zal ik de resulterende lijst hier nog een keer neerzetten om een zo goed mogelijke respons (en geen irritatie) te bewerken.

Dank voor de reacties!

Misschien is je aanname onjuist dat het leveren van “openbare diensten” alleen mogelijk is op basis van een postcode?

En misschien is het NHR geen onderdeel van het stelsel van basisregistraties en daarom niet verplicht adressen en schrijfwijzen uit de BAG te gebruiken? (Ik ging er namelijk van uit dat dat wel zo is.)

De NHR is een basisregistratie, en moet van de BAG gebruik maken:

Vooral het kopje relaties op deze pagina is interessant in dit opzicht


1 like

Aanname postcode nodig voor openbare diensten.
Dit is geen aanname maar een citaat uit de brief van minIenM aan de gemeenten, zie genoemde brief met link in eerste (dacht ik) post: “Hiermee wordt erkend dat de postcode een dubbele functie in zich heeft: namelijk de functie voor de postbezorging en de functie voor publieke en private dienstverlening.”

NHR basisregistratie: zie Basisregistratie Handelsregister (HR),
kijk ook naar z.g. authentieke informatie (laatste woord uit herinnering), deze betreft de juridische aspecten en de adresgegevens (ruwweg).

Even zonder citaat: ik denk dat er een natuurlijk groeiproces gedacht is waarbij mutaties en nieuwe inschrijvingen aan eisen moeten voldoen. Omdat NHR van huis uit niet mijn stiel is, ben ik enigszins vaag.
Maar je vindt naast huisnummer een toevoeging (incl eventuele huisletter) die bijv voor allerlei doelen gebruikt is, zoals ‘t.o. 26’,
‘1e etage’, of ‘-5’ bij een huisnummer (bijv) 1. Nu trekken de uitzonderingen hier misschien onevenredig veel aandacht, maar daar gaat het werk in zitten. Je kan verschillende ideeen hebben, bij tests is KvK blij met (dacht ik) 99+% accuratesse, al betekent dat 20000 probleemgevallen. Op jacht naar nog wat verbetering in de matching kwam ik concrete postcode gaten in de BAG op het spoor en ben toen wat te snel van leer getrokken (al die gevallen met ‘overige gebruiksfunctie’); al doende leert men


1 like

Mijn verder afgeslankte resultaat, nu met een hoog gehalte aan standplaatsen, heb ik toegevoegd als laag in het eerder gelinkte geopackage. Ik heb ook pand status erbij gepakt, omdat soms ‘actieve’ verblijfsobjecten zich bevinden in een pand met ‘Sloopvergunning verleend’.
Verder Tata Steel en Chemelot er uit; standplaatsen aan het strand verwijderd en de redelijkheidstermijn van 4 weken toegepast op tijdstipregistratie.
Het aantal is nu 1421.
Ik heb er m.i. even genoeg tijd aan besteed.
csv in Dropbox - geenpc_selectie.csv - Simplify your life,
excel bestand in Dropbox - geenpc_selectie.xlsx - Simplify your life

beetje late reactie, maar weet dat de ‘geopackage’ geen nevenadressen heeft. Binnenhof 19 's-Gravenhage staat er bijvoorbeeld niet in, maar bestaat wel. Mogelijk is dat ook nog deel van het probleem.