Comment puis-je me préparer à quelque chose que je ne sais pas encore?

Mise à jour: 28 avril 2021
Comment puis-je me préparer à quelque chose que je ne sais pas encore?

Comment puis-je me préparer à quelque chose que je ne sais pas encore?

Des scientifiques de l'Université technique de Munich (TUM) et de l'Institut Fritz Haber de Berlin ont abordé cette question presque philosophique dans le contexte de l'apprentissage automatique.

L'apprentissage n'est rien d'autre que de tirer de nouvelles décisions sur l'expérience antérieure. Afin de faire face à une nouvelle situation de cette manière, il faut avoir déjà traité des situations à peu près similaires. En apprentissage automatique, cela signifie en conséquence qu'un algorithme d'apprentissage doit avoir été exposé à des données à peu près similaires.

Mais que pouvons-nous faire s'il existe une quantité presque infinie de possibilités de sorte qu'il est tout simplement impossible de générer des données qui couvrent toutes les situations? Ce problème devient un défi majeur lorsqu'il s'agit d'un nombre infini de molécules candidates possibles.

Les semi-conducteurs organiques permettent des technologies futures importantes telles que les cellules solaires portables ou les écrans enroulables. Pour de telles applications, des molécules organiques améliorées - qui composent ces matériaux - doivent être découvertes. Les tâches de cette nature utilisent de plus en plus des méthodes d'apprentissage automatique, tout en s'entraînant sur des données issues de simulations ou d'expériences informatiques.

Le nombre de petites molécules organiques potentiellement possibles est cependant estimé à l'ordre de 1033. Ce nombre écrasant de possibilités rend pratiquement impossible de générer suffisamment de données pour refléter une aussi grande diversité matérielle. De plus, bon nombre de ces molécules ne conviennent même pas aux semi-conducteurs organiques. On cherche essentiellement l'aiguille proverbiale dans une botte de foin.

L'équipe autour du professeur Karsten Reuter, directeur du département de théorie de l'Institut Fritz-Haber, et du Dr Harald Oberhofer, chercheur Heisenberg à la chaire de chimie théorique, a abordé ce problème en utilisant ce que l'on appelle l'apprentissage actif. Au lieu d'apprendre à partir des données existantes, l'algorithme d'apprentissage automatique décide de manière itérative pour lui-même des données dont il a réellement besoin pour connaître le problème.

Les scientifiques effectuent d'abord des simulations sur quelques molécules plus petites et obtiennent des données relatives à la conductivité électrique des molécules - une mesure de leur utilité lors de l'examen d'éventuels matériaux de cellules solaires.

Sur la base de ces données, l'algorithme décide si de petites modifications de ces molécules pourraient déjà conduire à des propriétés utiles ou si elles sont incertaines en raison d'un manque de données similaires. Dans les deux cas, il demande automatiquement de nouvelles simulations, s'améliore grâce aux données nouvellement générées, considère de nouvelles molécules et répète cette procédure.

Dans leurs travaux, les scientifiques montrent que cette approche est nettement plus efficace que les algorithmes de recherche alternatifs et comment de nouvelles molécules prometteuses peuvent être identifiées de cette manière alors que l'algorithme poursuit son exploration dans le vaste espace moléculaire. Chaque semaine, il propose de nouvelles molécules qui pourraient inaugurer la prochaine génération de cellules solaires et l'algorithme ne cesse de s'améliorer.