Come posso prepararmi per qualcosa che ancora non conosco?

Aggiornamento: 28 aprile 2021
Come posso prepararmi per qualcosa che ancora non conosco?

Come posso prepararmi per qualcosa che ancora non so?

Scienziati dell'Università tecnica di Monaco (TUM) e del Fritz Haber Institute Of Berlin hanno affrontato questa questione quasi filosofica nel contesto dell'apprendimento automatico.

L'apprendimento non è altro che prendere nuove decisioni sulla base dell'esperienza precedente. Per affrontare una nuova situazione in questo modo, è necessario aver già affrontato situazioni più o meno simili. Nell'apprendimento automatico, ciò significa corrispondentemente che un algoritmo di apprendimento deve essere stato esposto a dati più o meno simili.

Ma cosa possiamo fare se esiste una quantità quasi infinita di possibilità in modo che sia semplicemente impossibile generare dati che coprano tutte le situazioni? Questo problema diventa una sfida importante quando si ha a che fare con un numero infinito di possibili molecole candidate.

I semiconduttori organici abilitano importanti tecnologie future come celle solari portatili o display arrotolabili. Per tali applicazioni, è necessario scoprire molecole organiche migliorate, che costituiscono questi materiali. Compiti di questa natura utilizzano sempre più metodi di apprendimento automatico, durante l'addestramento sui dati provenienti da simulazioni o esperimenti al computer.

Tuttavia, si stima che il numero di piccole molecole organiche potenzialmente possibili sia dell'ordine di 1033. Questo numero enorme di possibilità rende praticamente impossibile generare dati sufficienti per riflettere una diversità materiale così ampia. Inoltre, molte di queste molecole non sono nemmeno adatte per semiconduttori organici. Si sta essenzialmente cercando il proverbiale ago in un pagliaio.

Il team del Prof. Karsten Reuter, Direttore del Dipartimento di Teoria del Fritz-Haber-Institute, e del Dr. Harald Oberhofer, Heisenberg Scholar presso la Cattedra di Chimica Teorica, ha affrontato questo problema utilizzando il cosiddetto apprendimento attivo. Invece di apprendere dai dati esistenti, l'algoritmo di apprendimento automatico decide iterativamente da solo di quali dati ha effettivamente bisogno per conoscere il problema.

Gli scienziati eseguono prima simulazioni su alcune molecole più piccole e ottengono dati relativi alla conduttività elettrica delle molecole, una misura della loro utilità quando si esaminano i possibili materiali delle celle solari.

Sulla base di questi dati, l'algoritmo decide se piccole modifiche a queste molecole potrebbero già portare a proprietà utili o se è incerto a causa della mancanza di dati simili. In entrambi i casi, richiede automaticamente nuove simulazioni, si migliora attraverso i dati appena generati, considera nuove molecole e continua a ripetere questa procedura.

Nel loro lavoro, gli scienziati mostrano che questo approccio è significativamente più efficiente degli algoritmi di ricerca alternativi e come nuove e promettenti molecole possono essere identificate in questo modo mentre l'algoritmo continua la sua esplorazione nel vasto spazio molecolare. Ogni settimana propone nuove molecole che potrebbero inaugurare la prossima generazione di celle solari e l'algoritmo continua a migliorare sempre di più.