Utrechtse onderneming zet in op combinatie van open datasets
Het in Utrecht gevestigde Webmapper bestaat in 2020 vijftien jaar en in die tijd heeft het bedrijf een groot aantal interactieve kaarten en datavisualisaties uitgewerkt door cartografie, webtechnologie en geo te combineren. Het kernwoord is daarbij telkens open, of dit nu over open source-software gaat, open data of open standaarden. Edward Mac Gillavry, directeur bij Webmapper, vertelt hierover.
Door Lambert-Jan Koops
“Webmapper is begonnen in 2005 en bestaat dit jaar dan ook vijftien jaar. Op het moment dat we begonnen met het bedrijf was beschikbaarheid van locatie-informatie van een heel andere orde dan het tegenwoordig is. De smartphone bestond nog niet. Om foto’s en video op locatie te ontsluiten gebruikten we PDA’s met ingebouwde GPS, waarbij wij als Webmapper met name applicaties maakten rond het thema van Nederlands erfgoed. Enige tijd later zijn we ook betrokken geraakt bij het maken en bijhouden van de BRT-Achtergrondkaart voor het Kadaster, iets wat we tot 2015 hebben gedaan.”
Het eindproduct van informatie is voor veel traditionele partijen nog steeds een gedrukte of in ieder geval af te drukken kaart, stelt Mac Gillavry. Dat is dan ook iets waar de BRT voor is ingericht. Zelf wil hij kaarten tegenwoordig echter fundamenteel anders gebruiken dan als referentiekaart. “We richten ons op echt interactieve kaarten en datavisualisaties, en gebruiken daarvoor een combinatie van OpenStreetMap en geografische basisregistraties zoals BGT, BAG en BRT. De keuze voor OpenStreetMap heeft te maken met straatnamen. In de BRT werden namelijk tot twee jaar geleden alleen straat- en andere namen opgenomen waar ze visueel op de kaart konden worden weergegeven. Een straat die niet breed of lang genoeg was om de tekst van de straatnaam te bevatten of waar het kaartbeeld al druk is, was dan naamloos in de BRT. Totdat deze weergave werd aangepast, was de kaart dus nog vrij onduidelijk en dat is de reden waarom we destijds gebruikmaakten van OpenStreetMap, waarmee we de hiaten konden vullen. Omdat we veel ervaring hebben met OpenStreetMap, gebruiken we deze nu nog steeds voor onze producten.”
Themakaarten
Een van de zaken die Mac Gillavry en zijn collega´s hebben ontwikkeld, is Cartiqo. Deze interactieve kaart combineert meerdere open datasets en maakt het voor eindgebruikers mogelijk om referentiekaarten in een eigen huisstijl te creëren. De onderliggende technologie van dit product is vector-tile-technologie van Google, waarmee het mogelijk is om snel in en uit te zoomen en kaarten in browsers veel sneller zijn weer te geven dan met traditionele technieken. “De belangrijkste reden voor ons om te kiezen voor deze techniek was dat Mapbox een open standaard heeft ontwikkeld voor de vector-tile-technologie van Google. Een standaard die ook is omarmd door Esri en daarmee een gangbare technologie is die op veel platforms te gebruiken is, zowel voor online als desktop-GIS. Cartiqo maakt gebruik van open data, zoals de BRT, BAG en BGT van het Kadaster, de Wijk- en Buurtkaart van het CBS, OpenStreetMap en data van Natural Earth.”
Voor Cartiqo werkt Webmapper samen met het Zwitserse MapTiler. Mac Gillavry: “We hadden de datasets en de technologie zelf in huis, maar hadden daarnaast ook nog dienstverlening zoals betalingsafhandeling en een stabiel platform nodig. Het leek ons een stap te ver om dat zelf te doen, vandaar dat we op zoek zijn gegaan naar een partner die dat kon aanbieden. MapTiler benaderde ons om Cartiqo te hosten en het bedrijf heeft bovendien een historie met betrekking tot erfgoeddata, zodat een samenwerking een natuurlijke keuze was.”
Ontsluiting van data
In Nederland is momenteel veel aandacht voor de visualisatie en vormgeving van data, en dat is dan ook datgene wat Webmapper met Cartiqo wil aanbieden. “Data zijn er genoeg, het gaat om de ontsluiting van die data en de manier waarop deze worden gebruikt. PDOK is bijvoorbeeld honderd procent een doorleverancier van bestanden, die zelf geen redactie doet en alleen datasets ontsluit. Dus wanneer iemand op zoek is naar gegevens over spoorlijnen, dan kan diegene niet zo maar één definitief bestand opvragen met alle relevante informatie. In dat geval dienen verschillende bronnen te worden gecombineerd en moet een geïnteresseerde vooral ook zelf bedenken welke bronnen relevant zijn voor zijn uiteindelijke dataset.”
In het vinden van de juiste data zit hem dus de crux, zo stelt Mac Gillavry. “Waar kan ik welke data vinden? Ervaren mensen weten waar ze info moeten zoeken, maar voor nieuwe mensen in het vakgebied is het heel erg lastig. Het wordt allemaal stukje bij beetje wel toegankelijker, maar de geo-wereld is best in zichzelf gekeerd en het gaat nog niet heel erg hard. Ik zou het dan ook toejuichen als er door verschillende instanties stappen worden ondernomen om data gebruiksvriendelijker te ontsluiten, zodat anderen het makkelijker kunnen integreren.”
Compleet en correct
Bij Cartiqo voeren de medewerkers van Webmapper redactie over de bronnen. Zij bepalen welke gegevens worden toegevoegd en voeren een consistente naamgeving door. Het doel is daarbij om duidelijke, complete en zo correct mogelijke datasets te creëren, waarvan de brongegevens weer makkelijk te verifiëren zijn. “Voor dit laatste hebben we de elementen-ID’s van de oorspronkelijke datasets behouden”, legt Mac Gillavry uit. “We hebben het weliswaar teruggebracht naar één datamodel, maar bij bijvoorbeeld een BAG-pand is het altijd nog mogelijk om de link te leggen naar de API van het Kadaster. Het contact met de bron blijft zo bewaard en alle onderliggende gegevens zijn dan weer te achterhalen.”
Het contact met de oorspronkelijke bronnen voor de datasets is met name nuttig als een dataset onverwachte problemen geeft door fouten in de oorspronkelijke bron. Mac Gillavry geeft een voorbeeld uit de praktijk. “Voor HIER Klimaatbureau werkten we in 2015 aan de campagnesite Hierverwarmt.nl, die voorlichting geeft over het aardgasloos maken van woningen. Omdat de opdrachtgever wilde visualiseren wat het gasverbruik op dat moment was, vroegen wij de gegevens hiervan op bij het CBS. Die leverde de buurtkaart echter aan op centimeterniveau en dat is echt te gedetailleerd voor een goede visualisatie. Om de juiste weergave te kunnen maken, schreven we een algoritme voor het verwerken van de data en toen we dat gingen testen, viel het ons op dat er iets niet in de haak was met de Architectenbuurt-Zuid in Amersfoort: de hele buurt viel als het ware uit ons overzicht, alsof er helemaal geen gasverbruik plaatsvond. Dat leek ons niet te kloppen en bij nadere inspectie van de brondata bleek dat er in die buurt iets niet klopte met de geometrie. Dit hebben we gemeld bij de gemeente en die gaf vervolgens aan dat er gegevens waren verwisseld van Architectenbuurt-Zuid met Architectenbuurt-Oost. Dat stond echter al wel twee jaar lang verkeerd genoteerd in de database van het CBS. We hebben het toen zelf maar aangepast in onze eigen dataset, en het CBS en de gemeente Amersfoort het onderling laten oplossen.”
Controlerende bijdrage
Omdat de medewerkers van Webmapper de gegevens uit diverse bronnen vaak net even anders gebruiken dan de bronhouders zelf gewend zijn, komen ze wel vaker onregelmatigheden tegen. Het bedrijf levert daarmee opeens ook een controlerende bijdrage. “De grote, internationale datasets worden gebruikt door heel veel en heel grote gebruikers en dankzij hun terugkoppeling zijn die sets dus al behoorlijk opgeschoond”, vertelt Mac Gillavry.
“Voor veel Nederlandse databases zitten we nog midden in dit proces en daar werken we als Webmapper graag aan mee. Perfecte databases zijn denk ik een illusie, maar ze worden wel steeds beter en dat is een goede zaak voor een breder gebruik van de data. Met de mogelijkheden die dat biedt, zou je kunnen zeggen dat de digitalisering nu pas echt begint.”