Ga door naar hoofdcontent
ArtikelenWorden AI-modellen ‘vanzelf’ beter?

Worden AI-modellen ‘vanzelf’ beter?

Vrijdag 6 december 2024

Waarom wordt er gesproken over GeoAI? Wat is het verschil tussen ChangeMapp, Segment Anything en ChatGPT? Worden AI-modellen ‘vanzelf’ beter? Waarom slagen sommige GeoAI-projecten en mislukken andere?

AI (artificial intelligence, of in het Nederlands: kunstmatige intelligentie) wordt tegenwoordig voornamelijk gebruikt als verzamelnaam voor een grote set aan modellen met een gemeenschappelijk kenmerk: het zoeken of leren van verbanden met een bak data als basis. Het verschil tussen AI en niet-AI is dat een AI-model zelf het verband zoekt, in plaats van dat de ontwikkelaar het verband voorschrijft. Het proces van het zoeken en vinden, van het optimale verband leggen tussen de input en output in data, is het proces dat het AI model ‘zelf’ uitvoert. Dit is in de handen van een ingenieur een handig stuk gereedschap. Want als er een verband bestaat, is het niet altijd eenvoudig om dat verband goed gedefinieerd op te schrijven. Het mooie aan de geowereld is dat deze vol zit met dergelijke verbanden, en daarmee een perfect toepassingsgebied vormt voor AI. Dit leidt tot prachtige toepassingen, briljante mislukkingen en mislukkingen die je aan kon zien komen.

Geowereld en AI-toepassingen

De set aan modellen die doorgaans bedoeld worden als er over AI wordt gesproken, en de modellen waarmee Geronimo.AI werkt, zijn modellen die (voornamelijk) input vormen voor een plaatje of beeld. Een plaatje is ook te zien als een tabel met als rijen en kolommen de resolutie (bijvoorbeeld 1024 x 768) en op elke cel een rode, groene of blauwe waarde (de RGB-waarden). In de praktijk resulteert dit in rood, groen en blauw in een tabel van dezelfde afmeting. In deze datastructuur kan elke afbeelding worden opgeslagen. AI-modellen maken gebruik van dergelijke tabellen (of matrixen) als input, waarbij de specifieke vorm van de input (aantal rijen, kolommen, dimensies) niet zoveel uit maakt. Zolang een probleem in deze datastructuur gegoten kan worden kan de gereedschapskist van AI ingezet worden. Figuur 1 illustreert dit.

Figuur 1. Generieke illustratie van de AI-aanpak. Een plaatje krijgt de vorm van een tabel, het model analyseert deze tabel en komt uiteindelijk tot output. 

Geo-AI

Kaarten, luchtfoto’s, puntwolken en basisregistraties zijn eenvoudig in deze datastructuur te gieten. Sterker nog, ze hebben deze datastructuur vaak standaard al. In veel gevallen kan AI dus direct toegepast worden. Het is dan ook correcter te spreken over het toepassen van AI op geodata, dan over GeoAI. Oftewel: GeoAI is het toepassen van AI op geodata. Er is eigenlijk vrij weinig fundamenteel verschil tussen het herkennen van een kat op een foto en het vergelijken van een kaart en een luchtfoto. Net als dat er vrij weinig fundamenteel verschil is tussen GeoAI en ChatGPT (ook tekst kun je in tabelvorm opschrijven). Daarentegen verschillen de toepassing, technische details, en de inspanning die het kost om een model te trainen dat voldoende performance behaalt enorm.

Geronimo.AI

Geronimo.AI (opgericht in 2019) is gespecialiseerd in het toepassen van AI in het geautomatiseerd beheer van de basisregistraties BAG, BGT, BOR en WOZ. Onder de noemer ChangeMapp worden de modellen van Geronimo.AI inmiddels toegepast in de processen van zo’n honderd bronhouders.

Trainen van AI-model

Een veelgebruikte toepassing van AI op geodata is het detecteren van zonnepanelen op een luchtfoto. Hierbij zijn er al verschillende keuzes te maken afhankelijk van de precieze vraagstelling: gaat het om de oppervlakte van de panelen, om het aantal panelen, om de groei van het aantal panelen binnen een bepaald gebied zoals een wijk, of de toekenning per pand? In de praktijk ligt hier vaak een fout op de loer: AI wordt geassocieerd met een ‘slim’ model. Dit kan ertoe leiden tot minder goed stilstaan bij de exacte vraagstelling en (onbewuste) aannames. De vraag ‘vind alle zonnepanelen’ kan bijvoorbeeld opgelost worden door een groot vierkant te tekenen dat de gehele luchtfoto bedekt. Dit is een correct antwoord op de vraag, maar het is niet de wenselijke uitkomst.

Voor een succesvolle AI-oplossing – waarmee bedoeld wordt: een AI-oplossing die na de innovatiefase daadwerkelijke waarde toevoegt in een proces – is het essentieel om vooraf de exacte vraagstelling en benodigde performance duidelijk te hebben. Nadat de vraagstelling goed gedefinieerd is, kan de data verzameld worden. Oftewel een verzameling van input met de bijbehorende output, in voldoende aantallen (dit wordt vaak onderschat) en kwaliteit (dit wordt soms overschat). Figuur 2 toont een dergelijke dataset en de start van de trainingscyclus van een AI-model. In de kolommen zijn zes stukjes data, of trainingssamples, te zien. Elk sample bestaat uit input (de eerste rij), de bijbehorende output (tweede rij) en de voorspelde output door het AI-model (derde rij). Als de onderste rij overeenkomt met de tweede rij heeft het AI-model het juiste verband geleerd. Zoals is te zien, voorspelt het model elke keer hetzelfde resultaat. Het model doet dus nog niks met de input en weet niet wat zonnepanelen zijn.

Gaandeweg lukt het het model steeds beter om het gewenste gedrag uit te voeren. Zoals te zien is in figuur 3 is er een moment in de trainingsscyclus waarop het model al behoorlijk gewenst gedrag vertoont, maar nog wel de fout ingaat zoals bijvoorbeeld in de linkerkolom is te zien. Wellicht betrekt het model de context te weinig bij een groep pixels die op een zonnepaneel lijkt?

Figuur 2. Trainingsdata en modelresultaten voor de start van het trainen van een AI-model.
Figuur 3. Trainingsdata en modelresultaten tijdens het trainen van het AI-model.
Figuur 4. Trainingsdata en modelresultaten na het trainen van het AI-model.

Optimum bereikt

Vanaf dit moment is het model statisch, en vindt er geen verbetering meer plaats. Het model heeft een optimum bereikt en de training is stopgezet. Verdere verbetering vraagt een verandering/vergroting van de dataset, of een verandering van technische details met betrekking tot modelarchitectuur of het trainingsproces. Modellen worden dus niet ‘vanzelf’ beter. Vanuit het startpunt gaat het model op zoek naar een minimum. Waarom is er sprake van een minimum en niet van een maximum? Het optimale verband wordt gedefineerd als het verband dat zo dicht mogelijk bij het perfecte verband zit, ofwel: het verband met zo min mogelijk afstand tot het perfecte verband.

Figuur 5. Illustratie van een model op zoek naar het optimale verband.

Modellen Geronimo.ai

Alle modellen van Geronimo.AI hebben momenteel een dergelijk minimum. Er wordt natuurlijk hard gewerkt aan verbeteringen, maar dit vraagt inspanning van de ingenieurs en gaat niet vanzelf. Het zonnepanelenmodel is een voorbeeld van een segmentatiemodel, oftewel het opdelen van de luchtfoto in meerdere groepen zoals ‘solar panels’ en ‘background’. Dit model laat zien waar objecten zich bevinden en voert ook een classificatie uit. Figuur 6 toont de toepassing van het openbare model SAM2 (SegmentAnything van Meta/Facebook) op een luchtfoto. De luchtfoto wordt (enigszins) succesvol opgesplitst in objecten, echter ontbreekt de relatie tussen de groepen en het type object dat deze vertegenwoordigen. Zo is niet duidelijk dat het blauw/paarse object in de rechterbovenhoek zonnepanelen zijn.

Enthousiast geworden? Pas op!

AI, en het media- of openbare beeld dat hieromheen gecreëerd is, kan de illusie geven dat alles mogelijk is. De praktijk is vaak anders. Het is een grote uitdaging om een goed genoeg afgebakend proces te vinden waar AI geschikt voor is. Er moet vervolgens voldoende data beschikbaar zijn en de automatisering moet voldoende waarde opleveren om een AI-investering te verantwoorden. Daarnaast liggen er vrijwel altijd technische complicaties op de loer. AI-modellen doen het niet zomaar, en het toepassen van one-size-fits-allmodellen, of een generieke oplossing die niet specifiek ontwikkeld is voor een bepaald toepassing, leidt vrijwel altijd tot teleurstellende resultaten. Tegelijkertijd is Geronimo.AI erg enthousiast en gepassioneerd over AI, het toepassen van AI op geodata en de ontwikkelingen. Het vormt tenslotte de kern van ons bedrijf. We zouden graag zien dat er een realistisch beeld wordt geschapen over de mogelijkheden en beperkingen van GeoAI, en zijn van mening dat dit uiteindelijk tot een bloeiender werkveld leidt met meer succesvolle projecten en producten.

Figuur 6. Toepassing van SAM2 op een luchtfoto.

Auteur

Afbeelding voor Tom van Loef

Tom van Loef

Reacties

    Plaats een reactie

    Je e-mailadres wordt niet gepubliceerd.Vereiste velden zijn gemarkeerd met *