GML.Next: Doe mee met de Geonovumverkenning naar GML-alternatieven op 17 juli

Op dinsdag 17 juli organiseert Geonovum een werkbijeenkomst die draait om de vraag: welke open standaard(en) verdient/verdienen een plek in de Nederlandse SDI als alternatief voor GML? Voor deze werkbijeenkomst zijn we op zoek naar iedereen die praktijkervaring heeft met alternatieven -denk aan GeoPackage, JSON, GeoJSON, CItyJSON etc. - die ons kan helpen bij het beantwoorden van bovenstaande vraag, door zijn of haar eigen ervaringen en visie in te brengen. Aanmelden kan met een mail aan Friso Penninga (f.penninga@geonovum.nl). Meer informatie over de werksessie vind je hieronder.

GML wordt als uitwisselformaat op veel plaatsen toegepast in de Nederlandse SDI: bij downloads, in berichtenverkeer en als output van OGC webservices als WFS en van APIā€™s. Dat is niet voor niets, want GML heeft een aantal sterke eigenschappen (zie ook de white paper Geostandaarden). Maar GML krijgt ook kritiek: de bestandsgrootte loopt snel op, de ondersteuning in commerciĆ«le software is niet altijd even volledig en het is minder goed bruikbaar in webtoepassingen. Met het oog op het ontsluiten van geodata voor een brede groep gebruikers is het daarom tijd om te bekijken of er goede alternatieven zijn voor GML en in hoeverre die alternatieven gestandaardiseerd kunnen / moeten worden om eenduidig toegepast te kunnen worden in de Nederlandse SDI. In het werkveld genoemde alternatieven zijn bijvoorbeeld GeoPackage en JSON / GeoJSON / CityJSON.

Op 17 juli organiseren wij een werksessie bij Geonovum waarin we alternatieven van GML willen verkennen. Kan jij ervaring in brengen (in een korte to-the-point presentatie, van maximaal 10 minuten) met GeoPackage, JSON of een ander alternatief Ć©n wil je met ons meedenken over hoe we geschikte alternatieven naast GML in de Nederlandse SDI kunnen standaardiseren, dan ben je van harte welkom bij de werkbijeenkomst GML.Next. Meld je uiterlijk 13 juli aan bij Friso Penninga en geef kort aan welke ervaring je in wilt brengen.

3 likes

GML.Next: uitkomsten 1e sessie 17 juli 2018

Welke open standaard(en) verdient/verdienen een plek in de Nederlandse SDI als alternatief naast GML? Om die vraag draaide het in de werkbijeenkomst GML.Next op dinsdagochtend 17 juli. Reden voor de vraag is dat GML ā€“ ondanks een aantal sterke eigenschappen - ook kritiek krijgt: de bestandsgrootte loopt snel op, de ondersteuning in commerciĆ«le software is niet altijd even volledig en het is minder goed bruikbaar in webtoepassingen. Met het oog op het ontsluiten van geodata voor een brede groep gebruikers is het daarom tijd om te bekijken of er goede alternatieven zijn voor GML en in hoeverre die alternatieven gestandaardiseerd kunnen / moeten worden. Tijdens de bijeenkomst zijn de nodige voorbeelden van belemmeringen rond het gebruik van GML besproken.

De belangrijkste inzichten uit de sessie:

1. Afbakening / scope: alternatieven naast GML voor ontsluiting door service providers
Het eerste belangrijke resultaat van de werkbijeenkomst is de strakkere afbakening van de toepassingen van GML waarvoor alternatieven denkbaar zijn. In de keten tussen bronhouders en gebruikers vindt op meerdere plaatsen uitwisseling plaats: van bronhouder naar landelijke voorziening / informatiehuis / centrale data laag, van die centrale voorziening naar een service provider (die aan de lat staat voor ontsluiting van de data ā€“ denk aan PDOK, ArcGIS Online, NL Extract, etc.) en van service providers naar de verschillende gebruikers.
In de eerste stap (het aanleveren) van data is valideerbaarheid van cruciaal belang en daarom staat het gebruik van GML hier niet ter discussie. In de tweede stap (van centrale voorziening naar service provider) bestaat meer vrijheid; de service provider zal er meestal vanuit gaan dat de domeinspecialisten van de centrale voorziening instaan voor de kwaliteit van de data. Het uitwisselformaat zal hier eerder gekozen worden op basis van criteria als verwerkingssnelheid en -gemak. Omdat het in veel gevallen gaat om gesloten uitwisseling (tussen een bekende verzender en ontvanger) is standaardisatie hier minder noodzakelijk; betrokken partijen kunnen gezamenlijk afspraken maken. In de derde en laatste stap (van serviceproviders naar gebruikers) is de behoefte aan alternatieven naast GML het grootst.

2. Gooi het kind niet met het badwater weg: blijf GML aanbieden
De tweede belangrijke constatering van alle aanwezigen is dat GML voor specifieke toepassingen (waarin het gaat om gegarandeerde juistheid / gebruik van het ā€˜authentiekeā€™ gegeven) het meest geschikt is. In andere woorden: blijf data in GML ontsluiten, omdat een aantal use cases die rechtvaardigt.

3. GeĆÆdentificeerde alternatieven
In de sessie zijn een aantal alternatieven voor GML geĆÆdentificeerd:

  • GeoPackage voor bulk download: voor de use cases waarin een gebruiker een (selectie op een) dataset (bijvoorbeeld de BGT van een bepaalde wijk) lokaal wil gebruiken in bijv. een GIS-pakket, is GeoPackage een goed alternatief. GeoPackage is een open standaard, wordt goed ondersteund in open source en commerciĆ«le software en blijkt in de praktijk (o.a. bij PDOK voor uitwisseling tussen data aanbieders en service providers) goed te werken. Aandachtspunten bij uniforme toepassing liggen op heel praktische zaken als de naamgeving van kolommen (de vertaling van een informatiemodel naar de opslagstructuur).
  • Database dumps voor bulk download: in de sessie zijn database dumps (bijv. in de vorm van PostGIS dumps) ook besproken, waarbij werd geconstateerd dat hierbij vaker versie-problemen optreden. Hoewel het een krachtig mechanisme is, lijkt het voor SDI-toepassingen niet de meest geschikte standaard.
  • Vector tiling voor online toepassingen: voor de use cases waarbij online data geserveerd wordt, is vector tiling (o.b.v. Mapbox vector tiling) een veelbelovende methode. De vector tiles zijn snel op te bouwen en bieden goede performance. Voor veel toepassingen zou het serveren van data o.b.v. vector tiling, waarbij de exacte / volledige geometrie van een feature vervolgens via bijv. JSON opgevraagd kan worden, een goed presterende oplossing zijn. Mapbox vector tiling is nu de de facto standaard. Internationaal zien we dat het OGC bij meer Wā€¦S-standaarden kijkt naar uitbreiding met vector tiling. Voor standaardisatie is het dus nog onduidelijk met welk ā€˜labelā€™ de standaard aangeduid moet worden, maar inhoudelijk lijkt de specificatie redelijk vast te staan. Met best practices (ā€œhoe ontsluit ik data online o.b.v. vector tiling?ā€) zou je implementatie van deze oplossing kunnen bevorderen, voordat je overgaat tot standaardisatie.
  • JSON / GeoJSON voor online toepassingen: in de praktijk zien we verschillende aanpakken rond GeoJSON, al dan niet gecombineerd met JSON om ook ComplexFeatures vast te kunnen leggen. Het lijkt te vroeg om nu al uitspraken te doen over de beste of gewenste aanpak om die vervolgens te standaardiseren. Beter lijkt het om nu de verschillende implementaties te verzamelen en te delen als (best) practices.

4. Bijvangst: vraagt lichtere ontsluiting om lichtere datamodellen?
Vanuit de praktijkervaring dat iedereen die werkt met lichtere alternatieven voor GML het onderliggende informatiemodel vereenvoudigd (ā€œplat slaatā€), kwam de discussie op of huidige informatiemodellen te complex zijn om implementeerbaar te zijn. GML en ISO 19107 zijn zeer breed (bijv. drie manieren om arcs te definiĆ«ren); dat is ondoenlijk om allemaal te implementeren. SimpleFeatures zijn vaak te doen, maar ComplexFeatures geven problemen. De vraag is nu of het haalbaar en wenselijk is om modellen te versimpelen, of dat de complexe werkelijkheid geen andere mogelijkheid biedt dan informatiemodellen soms ook wat van die complexiteit te laten reflecteren. De vraag is dan of je de wijze van platslaan zou kunnen ā€˜standaardiserenā€™. Een pakket als Shapechange biedt de functionaliteit, dus zou je de onderliggende regels generiek kunnen beschrijven? Aan dat platslaan zit onvermijdelijk een bepaalde mate van informatieverlies, maar voor een groot deel van de toepassingen hoeft dat geen probleem te zijn. Uniforme ā€œplat-sla-regelsā€ zouden dan kunnen helpen bij het versimpelen voor die use cases, waarbij data conform het volledige model gebruikt worden voor die toepassingen waarin het echt draait om de authentieke data. Ook op dit gebied lijkt het slim om best practices te gaan verzamelen.

Vervolg
De komende periode willen we gebruiken om best practices, ideeƫn en meningen op te halen over:

Voor deze vier specifieke onderdelen zijn aparte topics aangemaakt op het Geoforum (onder Standaardisatie).

Heb je vragen of opmerkingen? Laat het weten! Ook aanvullingen op mijn verslag worden gewaardeerd!

Met dank aan de aanwezigen:
Jan van Gelder, Paul Janssen, Edward McGillavry, Steven Ottens, Friso Penninga (verslag), Frank Steggink, Wijnand van Riel, Marcel de Rink en Wouter Visscher (en Wim van den Bosse voor zijn input per E-mail).

3 likes

Interessant, goed bezig! :muscle:

Ik blijf graag op de hoogte en denk graag mee!

@FrisoPenninga

Deze site bevat erg veel informatie over de proā€™s en cons van de verschillende formaten:

Het is mogelijk om eigen bevindingen en argumenten aan de site toe te voegen, misschien interessant voor jullie.

1 like

Ha Friso, als alternatieve formaten zat ik nog te denken aan:

  • CSV (wordt al door de meeste WFS servers ondersteund, populair in open data kringen)
  • HTML (zie ook de wfs 3 draft specificatie)
  • RDF (ben benieuwd hoe dat eruit zou zien (zowel aan client als server zijde))

Moeten we ook een vergelijkbaar initiatief starten voor Coverages (WCS)?

Een aspect wat misschien ook past in dit verhaal is het uitwisselen van updates. Ik krijg vaak de vraag hoe mensen hun locale dataset kunnen updaten tegen een centrale bron zonder de hele dataset over te halen. OGC is bezig met een PubSub standaard, maar ik weet niet exact of dat deze use case dekt.

is er al nieuws over het downloaden van kaartbladen in een ander formaat dan GML? Geopackage zou inderdaad heel bruikbaar zijn.