Wat is de ID van de provincie Groningen?

Het nummer (ID?) van de provincie Groningen varieert op de verschillende schaalniveaus van de BRT; in de top 10 is het (1:14) (ik neem aan dus 14), in de top50 is het null in de top100 is het 14 en in de top 250, top500 en top1000 is het (1:NL200000) wat dan dus NL200000 wordt.
De andere provincies zijn ook niet consequent maar wel iets logischer: (1:21), 21 en (1:NL210000) zullen wel allemaal 21 moeten voorstellen.

Wat is de ‘correcte’ ID en wie bepaalt dat eigenlijk?

De BRT is trouwens ingeladen via de laatste datadumps van NLExtract.

SELECT nummer, naamnl FROM top10.registratiefgebied
where typeregistratiefgebied = 'provincie'
ORDER BY nummer ASC
“(1:14)” “(1:Groningen)”
“(1:21)” “(1:Fryslân)”
“(1:22)” “(1:Drenthe)”
“(1:23)” “(1:Overijssel)”
“(1:24)” “(1:Flevoland)”
“(1:25)” “(1:Gelderland)”
“(1:26)” “(1:Utrecht)”
“(1:27)” “(1:Noord-Holland)”
“(1:28)” “(1:Zuid-Holland)”
“(1:29)” “(1:Zeeland)”
“(1:30)” “(1:Noord-Brabant)”
“(1:31)” “(1:Limburg)”
SELECT nummer, naamnl FROM top50.registratiefgebied
where typeregistratiefgebied = 'provincie'
ORDER BY nummer ASC
null “Groningen”
null “Fryslân”
null “Drenthe”
null “Overijssel”
null “Flevoland”
null “Gelderland”
null “Utrecht”
null “Noord-Holland”
null “Zuid-Holland”
null “Zeeland”
null “Noord-Brabant”
null “Noord-Brabant”
null “Noord-Brabant”
null “Limburg”
SELECT nummer, naamnl FROM top100.registratiefgebied
where typeregistratiefgebied = 'provincie'
ORDER BY nummer ASC
“14” “Groningen”
“21” “Fryslân”
“22” “Drenthe”
“23” “Overijssel”
“24” “Flevoland”
“25” “Gelderland”
“26” “Utrecht”
“27” “Noord-Holland”
“28” “Zuid-Holland”
“29” “Zeeland”
“30” “Noord-Brabant”
“30” “Noord-Brabant”
“30” “Noord-Brabant”
“30” “Noord-Brabant”
“30” “Noord-Brabant”
“30” “Noord-Brabant”
“30” “Noord-Brabant”
“30” “Noord-Brabant”
“31” “Limburg”
SELECT nummer, naamnl FROM top250.registratiefgebied
where typeregistratiefgebied = 'provincie'
ORDER BY nummer ASC
“(1:NL200000)” “(1:Groningen)”
“(1:NL210000)” “(1:Friesland)”
“(1:NL220000)” “(1:Drenthe)”
“(1:NL230000)” “(1:Overijssel)”
“(1:NL240000)” “(1:Flevoland)”
“(1:NL250000)” “(1:Gelderland)”
“(1:NL260000)” “(1:Utrecht)”
“(1:NL270000)” “(1:Noord-Holland)”
“(1:NL280000)” “(1:Zuid-Holland)”
“(1:NL290000)” “(1:Zeeland)”
“(1:NL300000)” “(1:Noord-Brabant)”
“(1:NL310000)” “(1:Limburg)”
SELECT nummer, naamnl FROM top500.registratiefgebied
where typeregistratiefgebied = 'provincie'
ORDER BY nummer ASC
“(1:NL200000)” “(1:Groningen)”
“(1:NL210000)” “(1:Friesland)”
“(1:NL220000)” “(1:Drenthe)”
“(1:NL230000)” “(1:Overijssel)”
“(1:NL240000)” “(1:Flevoland)”
“(1:NL250000)” “(1:Gelderland)”
“(1:NL260000)” “(1:Utrecht)”
“(1:NL270000)” “(1:Noord-Holland)”
“(1:NL280000)” “(1:Zuid-Holland)”
“(1:NL290000)” “(1:Zeeland)”
“(1:NL300000)” “(1:Noord-Brabant)”
“(1:NL310000)” “(1:Limburg)”
SELECT nummer, naamnl FROM top1000.registratiefgebied
where typeregistratiefgebied = 'provincie'
ORDER BY nummer ASC
“(1:NL200000)” “(1:Groningen)”
“(1:NL210000)” “(1:Friesland)”
“(1:NL220000)” “(1:Drenthe)”
“(1:NL230000)” “(1:Overijssel)”
“(1:NL240000)” “(1:Flevoland)”
“(1:NL250000)” “(1:Gelderland)”
“(1:NL260000)” “(1:Utrecht)”
“(1:NL270000)” “(1:Noord-Holland)”
“(1:NL280000)” “(1:Zuid-Holland)”
“(1:NL290000)” “(1:Zeeland)”
“(1:NL300000)” “(1:Noord-Brabant)”
“(1:NL310000)” “(1:Limburg)”
1 like

Hallo @stvno,
Het provincienummer van Groningen is “20”.

Door jouw vraag hebben we gezien dat in TOP10NL het provincienummer fout wordt weergegeven. Waarschijnlijk is het verward met dhet nummer van de gemeente Groningen (het gemeentenummer van de gemeente Groningen is “0014”).
Dit wordt in de BRT levering van februari 2019 verbeterd.
Ook zal voor dan gekeken worden naar het gemeentenummer in TOP50NL en naar de naloop-nullen in TOP250, TOP500 en TOP1000.

2 likes

Hoi Steven, de aanduiding “(1:14)” komt omdat in het TOP10NL schema versie 1.2.0 het nummer-attribuut met maxOccurs=“unbounded” gedefinieerd, dus het nummer kan in theorie meerdere keren voorkomen. Hetzelfde geldt ook voor het attribuut naamnl.

In NLExtract worden dit soort velden allemaal met -fieldTypeToString StringList ingelezen (via OGR), wat in deze syntax resulteert.

We zouden dit wel kunnen aanpassen in gevallen waar het onwaarschijnlijk is dat er meerdere voorkomens zijn, maar eigenlijk zou dit in het schema aangepast moeten worden. Bij NLExtract wordt er met name op gelet dat er tijdens het inlezen geen data verloren gaat. Meerdere configs en dus ook meerdere dumps onderhouden zou in theorie kunnen, maar daar hebben Just en ik onvoldoende tijd voor.