GML.Next: uitkomsten 1e sessie 17 juli 2018
Welke open standaard(en) verdient/verdienen een plek in de Nederlandse SDI als alternatief naast GML? Om die vraag draaide het in de werkbijeenkomst GML.Next op dinsdagochtend 17 juli. Reden voor de vraag is dat GML – ondanks een aantal sterke eigenschappen - ook kritiek krijgt: de bestandsgrootte loopt snel op, de ondersteuning in commerciële software is niet altijd even volledig en het is minder goed bruikbaar in webtoepassingen. Met het oog op het ontsluiten van geodata voor een brede groep gebruikers is het daarom tijd om te bekijken of er goede alternatieven zijn voor GML en in hoeverre die alternatieven gestandaardiseerd kunnen / moeten worden. Tijdens de bijeenkomst zijn de nodige voorbeelden van belemmeringen rond het gebruik van GML besproken.
De belangrijkste inzichten uit de sessie:
1. Afbakening / scope: alternatieven naast GML voor ontsluiting door service providers
Het eerste belangrijke resultaat van de werkbijeenkomst is de strakkere afbakening van de toepassingen van GML waarvoor alternatieven denkbaar zijn. In de keten tussen bronhouders en gebruikers vindt op meerdere plaatsen uitwisseling plaats: van bronhouder naar landelijke voorziening / informatiehuis / centrale data laag, van die centrale voorziening naar een service provider (die aan de lat staat voor ontsluiting van de data – denk aan PDOK, ArcGIS Online, NL Extract, etc.) en van service providers naar de verschillende gebruikers.
In de eerste stap (het aanleveren) van data is valideerbaarheid van cruciaal belang en daarom staat het gebruik van GML hier niet ter discussie. In de tweede stap (van centrale voorziening naar service provider) bestaat meer vrijheid; de service provider zal er meestal vanuit gaan dat de domeinspecialisten van de centrale voorziening instaan voor de kwaliteit van de data. Het uitwisselformaat zal hier eerder gekozen worden op basis van criteria als verwerkingssnelheid en -gemak. Omdat het in veel gevallen gaat om gesloten uitwisseling (tussen een bekende verzender en ontvanger) is standaardisatie hier minder noodzakelijk; betrokken partijen kunnen gezamenlijk afspraken maken. In de derde en laatste stap (van serviceproviders naar gebruikers) is de behoefte aan alternatieven naast GML het grootst.
2. Gooi het kind niet met het badwater weg: blijf GML aanbieden
De tweede belangrijke constatering van alle aanwezigen is dat GML voor specifieke toepassingen (waarin het gaat om gegarandeerde juistheid / gebruik van het ‘authentieke’ gegeven) het meest geschikt is. In andere woorden: blijf data in GML ontsluiten, omdat een aantal use cases die rechtvaardigt.
3. Geïdentificeerde alternatieven
In de sessie zijn een aantal alternatieven voor GML geïdentificeerd:
- GeoPackage voor bulk download: voor de use cases waarin een gebruiker een (selectie op een) dataset (bijvoorbeeld de BGT van een bepaalde wijk) lokaal wil gebruiken in bijv. een GIS-pakket, is GeoPackage een goed alternatief. GeoPackage is een open standaard, wordt goed ondersteund in open source en commerciële software en blijkt in de praktijk (o.a. bij PDOK voor uitwisseling tussen data aanbieders en service providers) goed te werken. Aandachtspunten bij uniforme toepassing liggen op heel praktische zaken als de naamgeving van kolommen (de vertaling van een informatiemodel naar de opslagstructuur).
- Database dumps voor bulk download: in de sessie zijn database dumps (bijv. in de vorm van PostGIS dumps) ook besproken, waarbij werd geconstateerd dat hierbij vaker versie-problemen optreden. Hoewel het een krachtig mechanisme is, lijkt het voor SDI-toepassingen niet de meest geschikte standaard.
- Vector tiling voor online toepassingen: voor de use cases waarbij online data geserveerd wordt, is vector tiling (o.b.v. Mapbox vector tiling) een veelbelovende methode. De vector tiles zijn snel op te bouwen en bieden goede performance. Voor veel toepassingen zou het serveren van data o.b.v. vector tiling, waarbij de exacte / volledige geometrie van een feature vervolgens via bijv. JSON opgevraagd kan worden, een goed presterende oplossing zijn. Mapbox vector tiling is nu de de facto standaard. Internationaal zien we dat het OGC bij meer W…S-standaarden kijkt naar uitbreiding met vector tiling. Voor standaardisatie is het dus nog onduidelijk met welk ‘label’ de standaard aangeduid moet worden, maar inhoudelijk lijkt de specificatie redelijk vast te staan. Met best practices (“hoe ontsluit ik data online o.b.v. vector tiling?”) zou je implementatie van deze oplossing kunnen bevorderen, voordat je overgaat tot standaardisatie.
- JSON / GeoJSON voor online toepassingen: in de praktijk zien we verschillende aanpakken rond GeoJSON, al dan niet gecombineerd met JSON om ook ComplexFeatures vast te kunnen leggen. Het lijkt te vroeg om nu al uitspraken te doen over de beste of gewenste aanpak om die vervolgens te standaardiseren. Beter lijkt het om nu de verschillende implementaties te verzamelen en te delen als (best) practices.
4. Bijvangst: vraagt lichtere ontsluiting om lichtere datamodellen?
Vanuit de praktijkervaring dat iedereen die werkt met lichtere alternatieven voor GML het onderliggende informatiemodel vereenvoudigd (“plat slaat”), kwam de discussie op of huidige informatiemodellen te complex zijn om implementeerbaar te zijn. GML en ISO 19107 zijn zeer breed (bijv. drie manieren om arcs te definiëren); dat is ondoenlijk om allemaal te implementeren. SimpleFeatures zijn vaak te doen, maar ComplexFeatures geven problemen. De vraag is nu of het haalbaar en wenselijk is om modellen te versimpelen, of dat de complexe werkelijkheid geen andere mogelijkheid biedt dan informatiemodellen soms ook wat van die complexiteit te laten reflecteren. De vraag is dan of je de wijze van platslaan zou kunnen ‘standaardiseren’. Een pakket als Shapechange biedt de functionaliteit, dus zou je de onderliggende regels generiek kunnen beschrijven? Aan dat platslaan zit onvermijdelijk een bepaalde mate van informatieverlies, maar voor een groot deel van de toepassingen hoeft dat geen probleem te zijn. Uniforme “plat-sla-regels” zouden dan kunnen helpen bij het versimpelen voor die use cases, waarbij data conform het volledige model gebruikt worden voor die toepassingen waarin het echt draait om de authentieke data. Ook op dit gebied lijkt het slim om best practices te gaan verzamelen.
Vervolg
De komende periode willen we gebruiken om best practices, ideeën en meningen op te halen over:
- Inzet van GeoPackage als GML-alternatief voor bulk download (topic GeoPackage)
- Inzet van Vector tiling als GML-alternatief voor online toepassingen (topic Vector tiling)
- Inzet van JSON/GeoJSON als GML-alternatief voor online toepassingen (topic JSON/GeoJSON)
- Methoden om informatiemodellen te vereenvoudigen / plat te slaan voor lichtere toepassingen (topic “Platslaan”)
Voor deze vier specifieke onderdelen zijn aparte topics aangemaakt op het Geoforum (onder Standaardisatie).
Heb je vragen of opmerkingen? Laat het weten! Ook aanvullingen op mijn verslag worden gewaardeerd!
Met dank aan de aanwezigen:
Jan van Gelder, Paul Janssen, Edward McGillavry, Steven Ottens, Friso Penninga (verslag), Frank Steggink, Wijnand van Riel, Marcel de Rink en Wouter Visscher (en Wim van den Bosse voor zijn input per E-mail).