Vertrouw op de machine: hij weet wat hij doet

Machine learning, wanneer gebruikt in de klimaatwetenschap, bouwt een daadwerkelijk begrip van het klimaatsysteem op. Dit betekent dat we machine learning kunnen vertrouwen en de toepassingen ervan in de klimaatwetenschap kunnen bevorderen, zeggen de auteurs.

Mens of machine

Grote, complexe klimaatmodellen zijn vaak onpraktisch om mee te werken, omdat ze maanden op supercomputers moeten draaien. Als alternatief bestuderen klimaatwetenschappers vaak vereenvoudigde modellen.

Over het algemeen worden twee verschillende benaderingen gebruikt om klimaatmodellen te vereenvoudigen: Een top-down benadering waarbij klimaatexperts inschatten welke impact weggelaten functies zullen hebben op de onderdelen die in het gereduceerde model worden bewaard. En een bottom-up benadering, waarbij klimaatgegevens een machine learning-programma krijgen, dat vervolgens het klimaatsysteem simuleert.

De twee methoden leveren vergelijkbare resultaten op. Het is echter een uitdagend probleem om datagestuurde (bottom-up) benaderingen fysiek te begrijpen om ze volledig te vertrouwen. Begrijpen machine learning-programma's dat ze te maken hebben met een complex dynamisch systeem, of zijn ze gewoon goed in het statistisch raden van de juiste antwoorden?

Intelligente oplossing

Nu bewijst een groep wetenschappers analytisch en met behulp van computersimulaties dat een machine learning-programma genaamd Empirical Model Reduction (EMR) in feite weet wat het doet. Uit het onderzoek blijkt dat dit computerprogramma vergelijkbare resultaten behaalt als de top-down reducties van grotere modellen, omdat machine learning zijn eigen versie van een klimaatmodel in zijn software construeert.

"Ik denk dat we in dit onderzoek een soort fysiek bewijs leveren van waarom dit specifieke datagestuurde protocol werkt. En dat is voor mij heel zinvol, want de methode bestaat al heel lang in de atmosferische wetenschappen. Toch waren er nog behoorlijk wat hiaten in het begrip van de methodieken”, zegt Ph.D. student Manuel Santos Gutierrez.

Bemoedigend en nuttig

De studie geeft aan dat de machine learning-methode dynamisch en fysiek solide is en robuuste simulaties oplevert. Dit zou volgens de auteurs de aanzet moeten zijn tot verdere inzet van datagedreven methoden in zowel de klimaatwetenschap als andere wetenschappen.

“Het is een zeer bemoedigende stap. Omdat het in zekere zin betekent dat de datagestuurde methode intelligent is. Het is geen emulator van gegevens. Het is een model dat de dynamische processen vastlegt. Het is in staat om te reconstrueren wat er achter de data zit. En dat geeft aan dat deze theoretische afleidingen je een object opleveren dat algoritmisch bruikbaar is', zegt Valerio Lucarini, hoogleraar statistische mechanica aan de Universiteit van Reading.

Het resultaat is belangrijk op een aantal terreinen: toegepaste wiskunde, statistische fysica, gegevens wetenschap, klimaatwetenschap en complexe systeemwetenschap. En het zal implicaties hebben in een reeks industriële contexten, waar complexe, dynamische systemen worden bestudeerd maar slechts gedeeltelijke informatie toegankelijk is, zoals de engineering van vliegtuigen, schepen, windturbines, of in verkeersmodellering, energienetwerken, distributienetwerken.

Vertrouw op de machine - hij weet wat hij doet