Toename hoeveelheid data maakt potentieel duidelijk
Tegenwoordig gebruikt vrijwel iedereen, bewust of onbewust, een zekere vorm van Machine Learning. Ook in de geospatial-wereld is deze techniek aanwezig, alhoewel het gebruik ervan in deze sector nog wel in de kinderschoenen staat.
Door Wim Bozelie & Tieme de Jonge
Of het nu gaat om het uitvoeren van een inspectie met satellietbeelden of simpelweg het op de bank zitten kijken van video’s op YouTube, Machine Learning is overal. Denk hierbij bijvoorbeeld aan de werking van Google, Facebook of LinkedIn, waarvan de zoekfuncties door verschillende Machine Learning-algoritmen worden ondersteund. Hetzelfde geldt voor Netflix of Spotify, waarbij series, films en muziek worden aanbevolen op basis van eerder gemaakte keuzes van de kijker. Zelfs op telefoons is Machine Learning aanwezig: bij het gebruik van bijvoorbeeld Siri, Google Assistent of Alexa, wordt Machine Learning ingezet voor spraakherkenning of zoekopdrachten.
Veel van dit soort functionaliteiten is gemaakt om de gebruikerservaring beter te maken, maar het kan ook de andere kant op gaan. Facebook beëindigde een Artificial Intelligence Programma, nadat de ontwikkelaars ontdekten dat het programma een eigen taal had gecreëerd die ze zelf niet begrepen. Onderzoekers van het ‘Facebook AI Research Lab’ (FAIR) ontdekten dat chatbots afweken van het script en dat zij communiceerden in een nieuwe taal, zonder menselijke inbreng.
Relevantie Machine Learning
Ongeacht de onvoorziene aard van dit voorbeeld, is het potentieel van Machine Learning heel duidelijk zichtbaar en heeft zich dat al goed laten zien. Het is inmiddels een gevestigd fenomeen en wordt de laatste jaren steeds meer binnen het geografische domein gebruikt. In 2018 bracht Hexagon Geospatial nieuwe releases uit die Machine Learning- en Deep Learning-analyses mogelijk maakt op geografische data. De allereerste Machine Learning-algoritmen zijn echter al meer dan zestig jaar oud, zo leert een blog van Nvidia. De vraag die daarmee opkomt, is dan ook: wat is de reden dat Machine Learning momenteel zo belangrijk en relevant is? Het antwoord is simpelweg ‘data’.
In deze snel veranderende wereld worden de hoeveelheden data steeds groter. Al deze data hebben een steeds groter wordende hoeveelheid aan dataopslag, computerkracht en expertise nodig om ze te kunnen structureren. Het gebruik van Machine Learning is hiervoor onvermijdelijk. Het concept van Machine Learning houdt in dat statistieken en wiskundige technieken worden gebruikt waardoor computers kunnen leren zonder dat elke stap expliciet hoeft te worden geprogrammeerd. Tegenwoordig is er veel mogelijk met Machine Learning binnen het geospatial-domein. Dit wordt bijvoorbeeld beschikbaar gemaakt met de ‘Spatial Modeler’ binnen ERDAS IMAGINE of GeoMedia van Hexagon’s Geospatial-divisie en dat is terug te zien in toepassingen bij verschillende gebruikers.
Alledaagse taken
Een mooi voorbeeld van Machine Learning die wordt toegepast in locatie-intelligentie-oplossingen is te zien bij waterschappen. Net als veel andere overheidsorganisaties zijn waterschappen druk bezig met het digitaliseren van tijdrovende processen. De inspectie van waterwegen, ook wel de schouw, is een dergelijk proces. Deze kan gedeeltelijk worden geautomatiseerd door kunstmatige intelligentie te integreren in de verwerking van data, die met name bestaat uit satellietbeelden.
Machine Learning-technieken worden toegepast om de waterwegen op satellietbeelden te classificeren voor geautomatiseerde kwalificatie. De integratie van algoritmen in analysemodellen maakt het mogelijk geautomatiseerd afwijkingen in watergangen te detecteren, zonder dat een medewerker daadwerkelijk in het veld ter plaatse moet zijn voor de inspectie. En dit is slechts één voorbeeld uit de veelheid van mogelijkheden die beschikbaar zijn met Machine Learning.
Deze techniek is gevormd tot de oplossing Schouw M.App, een managementsysteem dat door verschillende waterschappen wordt ingezet bij hun schouwinspectieprocessen. Onder meer Waterschap Drents Overijsselse Delta zet deze oplossing in om de schouw uit te voeren vanachter de bureaus. Inspecties worden veel gerichter uitgevoerd, waardoor de inzet van mankracht, tijd en geld efficiënter wordt.
Het belang van data
Data zijn de sleutel voor een effectieve en nauwkeurige implementatie. Een belangrijke voorwaarde hiervan is dat de ingevoerde data wel correct zijn. Als de basisdata die in analyses gestopt worden niet correct zijn, krijgt de gebruiker van die data ook geen juiste resultaten. Meer dan ooit is het daarom cruciaal dat brondata ‘ABC’ zijn: actueel, betrouwbaar en compleet. Als er binnen een bepaald beheergebied (zoals de ligging van watergangen in een waterschap) de data niet kloppen, kan dat een flink foutpercentage tot gevolg hebben.
Daarom moeten eerst zulke fouten worden gecorrigeerd. Met een aantal specifieke modellen binnen de mutatiesignaleringoplossing DELTA kan een gebruiker geautomatiseerd afwijkingen opsporen en voorleggen aan een beheerder. Door deze analyses geautomatiseerd over een geheel areaal uit te voeren, weet een beheerder precies waar de afwijkingen zitten en kan hij of zij gericht werken aan het corrigeren en actualiseren. Deze techniek kan ook toegepast worden in het detecteren van veranderingen in verschillende basis- en kernregistraties.
De volgende stap
Hoewel de hiervoor genoemde voorbeelden al worden gebruikt binnen verschillende organisaties, staan we nog aan het begin van de inzet van Machine Learning. Dat biedt perspectief, want de technologie staat binnen het geospatial-domein echt nog in de kinderschoenen en zal zich blijven ontwikkelen en verbeteren, want de mogelijkheden zijn eindeloos. Ook binnen IMAGEM zijn de ontwikkelingen volop bezig en zijn er interessante technologieën te gebruiken.
What’s the Difference Between Artificial Intelligence, Machine Learning and Deep Learning?