BAG straatnamen en woonplaatsen plus verkortingen

Ik heb een dataset nodig met alle straatnamen en woonplaatsen inclusief officiële verkortingen, maar kan deze data niet vinden in de BAG 2.0 download.

Adriaan van Meerkaatsplein → A van Meerkaatspln
Jan van Luyendijkstraat → J van Luyendijkstr

Iemand die me op weg kan helpen?

Ik weet niet hoe de dataset werkt, maar met bag individuele bevragingen krijg ik bij het bevragen van een openbare ruimte de verkorte naam.

https://www.kadaster.nl/documents/1953498/2762071/Productbeschrijving+BAG+Extract.pdf/1e8310b9-9431-2cbe-7204-45cef7de4824?t=1601294551849

2.2.7 Verkorte schrijfwijze
De BAG bevat volledige straatnamen. Als de straatnaam langer is dan 24 posities is in BAG Extract de
verkorte schrijfwijze volgens NEN 5825 (adressen, definities uitwisselingsformaten) toegevoegd. Een verkorte
schrijfwijze wordt alleen geleverd als de naam van de openbare ruimte uit meer dan 24 karakters bestaat. De
verkorte schrijfwijze wordt geautomatiseerd bepaald in de LV BAG aan de hand van de regels van NEN5825.
Dit gegeven maakt geen onderdeel uit van de officiële BAG registratie

2 likes

Beste DeLorean,

In het BAG 2.0 Extract wordt de verkorte naam enkel meegeleverd als de openbare ruimte (lees: straatnaam) langer is dan 24 tekens. Deze gegevens zijn in het BAG 2.0 Extract opgenomen in de map met alle openbare ruimten (OPR) met de tag:

< nen5825:VerkorteNaamOpenbareRuimte><nen5825:verkorteNaam >P K Marechaussee</nen5825:verkorteNaam></nen5825:VerkorteNaamOpenbareRuimte></Objecten:verkorteNaam>

Met vriendelijke groet,
Nathalie Vos

Kadaster BAG

1 like

Beste DeLorean,

Ik weet niet of je met bovenstaande geholpen bent. Je wilt zoals ik zie een subset uit de hele BAG. De dataset zoals jij wilt bestaat niet als los bestand (AFAIK), zeker niet als je steeds een up-to-date versie (BAG verandert dagelijks) wilt hebben. Ik zie 3 opties:

  • verwerk de BAG Extract XML met software zoals NLExtract [1] en maak de selectie bijv naar CSV
  • vraag iemand hier om dat voor je te doen. helpt als je betaling aanbiedt
  • koop een kant en klaar BAG (CSV) Adressen bestand bij een aanbieder bijv bij [2] of [3] en doe selectie

[1] https://nlextract.nl
[2] https://geotoko.nl
[3] https://service.openinfo.nl/winkel/

1 like

Dank voor alle hulp! Heb inmiddels een download van https://extracten.bag.kadaster.nl/lvbag/extracten/Nederland%20LVC/ gepakt en ben nu bezig met het converteren van xml naar csv middels Python.

Alleen nog wat issues bij het inladen van het bestand naar SQL Oracle (utf-8 converteerd nog niet helemaal lekker). Volgende straatnamen zijn de enige die niet goed geconverteerd worden.

Bûtenweg
Bûterheideveld
Slotemaker de Bruïneweg
Cronj¿straat
¿s-Gravelandse Vaart
César Francklaan
Marga Klompéhof
Hÿndellaan
DrieA«rweg
Talmaplaats¿¿
Troelstraplaats¿¿
Willem Dreeserf¿¿
Kuypererf¿¿
Keierskant¿¿
Vormenmakerstraat¿¿
Huttenmeesterstraat¿¿
Smeltmeesterstraat¿¿
Pijpenklopperstraat¿¿
Indragerspad¿¿
Kristallaan¿¿
Spiegellaan¿¿
Wilhelmushof¿¿
Vloedsweg¿

Was even zoeken naar de juiste bestanden, maar ben goed op weg door jullie hulp!

https://github.com/lorenzkort/XML/blob/main/bag_straatnamen.py

Lijkt er op dat je character set in Oracle niet de juiste is, en dat daardoor de diacrieten en zo niet goed worden weergegeven als je ze weer uit Oracle haalt. wat levert dit op:

select * from nls_database_parameters where parameter=‘NLS_CHARACTERSET’;

?

Interessante code, ook met Pandas.
Bedenk dat in BAG XML de volledige historie zit, dus alle status/voorkomen wijzigingen voor ieder object. Er wordt nooit iets weggegooid. Dan lijkt het of je meerdere objecten van zelfde identificatie krijgt…

Dus een find() in de XML-boom geeft alle objecten, ook niet-meer bestaande en fout-ingevoerde objecten mogelijk ook met char-encoding issues. Dit zijn nu net de zaken die NLExtract oplost. Er is een hele reeks status-en om rekening mee te houden, sommige objecttype-specifiek bijv “Pand gesloopt”. Nu zal in straatnamen en woonplaatsen niet heel veel veranderen.

BAG zelf is in Windows encoding, uit m’n hoofd ISO 8559/Windows-1252. NLExtract zet dat om naar UTF-8 PostGIS-DB. Dan zorgen dat de DB-client ook in UTF-8 staat, dan gaat het goed. Zoiets moet ook voor Oracle kunnen.