UTF-8 in de BAG Geocodeerservice?

Hi,

Voor DSO zijn we bezig met het integreren van de BAG Geocodeerservice, en nu zie ik antwoorden met diakrieten niet goed binnenkomen. Een voorbeeld:

$ curl -s 'https://geodata.nationaalgeoregister.nl/geocoder/Geocoder?zoekterm=Fiifh%C3%BAs' | xmlindent
<xls:GeocodeResponse xmlns:xls="http://www.opengis.net/xls" xmlns:gml="http://www.opengis.net/gml">
    <xls:GeocodeResponseList numberOfGeocodedAddresses="1">
        <xls:GeocodedAddress>
            <gml:Point srsName="EPSG:28992">
                <gml:pos dimension="2">166235.375 561062.5</gml:pos>
            </gml:Point>
            <xls:Address countryCode="NL">
                <xls:StreetAddress>
                    <xls:Street>Fiifhús</xls:Street>
                </xls:StreetAddress>
                <xls:Place type="MunicipalitySubdivision">Wolsum</xls:Place>
                <xls:Place type="Municipality">S�dwest-Frysl�n</xls:Place>
                <xls:Place type="CountrySubdivision">Friesland</xls:Place>
            </xls:Address>
        </xls:GeocodedAddress>
    </xls:GeocodeResponseList>
</xls:GeocodeResponse>

De straatnaam gaat wel goed, maar de gemeentenaam lijkt in een andere codering te staan.

Weet iemand wat hier fout gaat?

Groet,
Joost

Oei, die heb ik lang niet gezien… Da’s hoogstwaarschijnlijk een WIN-1252 encoding (standaard dBase IV encoding die Esri Shape-bestanden hebben), die als UTF-8 worden uitgegeven. Dit was een veelvoorkomend issue bij de Wijk- en Buurtkaart van CBS, maar die leveren nu netjes een .cpg-bestand mee, waarin de encoding wordt vermeld. Maar er wordt al heel lang gerept over een nieuwe geocodeer-service (van de Nationale Politie overgedragen gekregen). Dus wellicht binnenkort een verbetering op komst?

Yup, ik zit in de klankbordgroep van de nieuwe locatieserver. Als dit een dataprobleem is laten we het dan maar negeren, want hij is er al over een maand. Ik dacht, misschien zie ik iets over het hoofd…

Bedankt voor de uitleg!

Daar lijkt het wel op want het lijkt hierop: https://pdokforum.geonovum.nl/t/problemen-met-verwerken-diakrieten-in-bag-bestanden/226 Hoewel @PieterDijkstraBAG overtuigd is dat de data klopt. :slight_smile:

Het lijkt erop dat jullie een online presence krijgen → #locatieserver. :wink:

@jcassee @simeon Gemeenten zitten als objecttype niet in de BAG. Gemeenten zijn weliswaar bronhouder in de BAG maar in het datamodel is de woonplaats de grootste entiteit. Welke gemeente gebruikt wordt in de geocodeerservice is mij niet bekend.