Dank je Friese woudloper voor je uitgebreide antwoord.
Ik heb je workshop uitvoerig bekeken en ik merk dat ik veel basiskennis ontbeer, waaronder het werken met webservices, API’s, etc. waardoor ik er weer veel vragen bij heb gekregen.
Maar om te beginnen met jouw vraag, het betreft de open data va de overheid waar alle locaties van kinderopvang in Nederland in staan. Zie hier voor de CSV file met 43.000 regels, waarin alle locaties worden beschreven waar kinderopvang wordt aangeboden in Nederland. Download bestand
Uit jouw workshop begrip ik dat de PDOK locatieserver gebruikt kan worden om verschillende kenmerken van adres te achterhalen, waarvan voor mij binnen de free service: de provincienaam, centroide_ll, buurtnaam en wijknaam het meest relevant zijn.
Echter alle output verschijnt op basis van klassieke adresgegevens (straatnaam, huisnummer, postcode, woonplaats).
En zoals je kunt zien in de datafile met kinderopvanglocaties lijkt de kwaliteit van de adresgegevens tamelijk laag. Straatnamen lijken hier en daar naar eigen inzicht ingekort, de huisnummers zijn niet gescheiden van de huisnummer-toevoegingen en sommige locaties lijken dubbele huisnummers te hebben als het aangrenzende pand ook in gebruik is (“Hoek van Hollandstraat 3 4”). Uit jouw workshop begrijp ik dat de PDOK locatieserver ook met minder goed gespelde adres om kan gaan. Kun jij een inschatting geven hoe betrouwbaar de geocodering van deze adressen zou kunnen worden, als je een eerste blik werkt op de beschikbare data?
Ook in de excel van Jeroen Baltussen wordt huisnummer en postcode als uitgangspunt genomen voor het opvragen van gegevens. Ik begrijp dat als ik een adresseerbaarobject_id heb, dat ik dan ook gegevens op kan vragen uit PDOK, maar dat id zit niet in de dataset, enkel de BAG-id. Dus dat helpt me niet verder.
Dan is de vraag, mede naar aanleiding van de reactie van Pieter, of er wel een service is die vanuit Power BI benaderbaar is en on-the-spot voor zo’n groot aantal adressen de benodigde kenmerken kan aanleveren? Vaak zal de gebruiker naar een subset van de data kijken en niet naar alle 43.000 locaties tegelijk, maar dan nog is de vraag of dit wel online kan. Probleem is dat Power BI zelf vanaf de website van de overheid de meest actuele versie van het register met adressen ophaalt. Het is dus geen statische excelfile die lokaal op mijn computer staat. En elke keer als je het register online opvraagt kan en zal de inhoud weer (een beetje) anders zijn.
Is dan de enige oplossing om lokaal een lijst aan te leggen van geocodes (lat, lon), provincie, wijk en buurt als soort van “basislijst”, die handmatig periodiek bij te werken, in te lezen in Power BI en vervolgens voor de locaties die niet voorkomen in mijn lijst een online geocodeerservice aan te roepen? Die opzet lijkt me wat omslachtig.
Het voorstel van Peewee met een bestand met alle 9 miljoen adressen is op zich mooi, maar mijn computer verliet zich er danig in als hij voor 43.000 adressen in die 9 miljoen regels moet zoeken naar de juiste geocodes. En kinderopvang zit vaak in scholen en vaak in nieuwbouwwijken waar de school nog weleens op adresen staan die vrij ‘nieuw’ zijn. Dus dan moet ik telkens over de meest actuele lijst van 9 miljoen adressen beschikken. Dat lijkt me ook vrij omslachtig.
Verder raak ik praktisch en technisch gezien de weg even kwijt als ik probeer om de lessen uit jouw workshop, waarbij je o.b.v. een request in een URL een xml-antwoord krijgt wat in JSON formaat verschijnt in de browser, over te zetten naar Excel of Power BI. Dat zal aan mijn gebrek aan basiskennis liggen om een JSON-response goed op te vangen in excel of Power BI. De macro van Jeroen Baltussen helpt een beetje, maar zelf nadoen met de functies WEBSERVICE(url) en XMLFILTEREN(xml; xpath), lukt volstrekt niet. Laat staan dat ik het in Power BI weet te gebruiken. Heb je een goede tip waar ik online cursus of naslagmateriaal kan vinden om me dit eigen te maken?
Tot slot schrijf je iets over een eigen extensie voor Power BI maken. Afgezien van het feit dat ik ook geen ontwikkelaar ben en niets weet van JavaScript, Leaflet, etc., kan ik me ook functioneel niet eens een voorstelling maken wat zo’n extensie precies zou kunnen doen binnen mijn Power BI toepassing en waar het verschil dan ligt in de standaard kaart-visualisatie van Power BI. Kan je iets zeggen over wat jou precies tegenviel in de mogelijkheden van Power BI en wat je dan van zo’n extensie zou verwachten?
Intussen heb ik de applicatie QGIS gedownload om te onderzoeken op welke manier ik daar met bijv. de PDOK-plugins iets aan heb bij het geocoderen van de 40.000 adressen, o.b.v. adres, huissnr, postcode, plaats of ook wellicht toch via de BAG-id? En ook op welke manier de -hopelijk- te ontvangen lattitude, longitude, provincie, wijk en buurt in een apart (excel-)bestand is op te slaan of op een andere manier in Power BI ingebracht kan worden.
Wellicht stel ik teveel vragen, maar ik hoop dat je me nog even verder kunt helpen.
Alvast dank zover.