Como posso me preparar para algo que ainda não conheço?

Atualização: 28 de abril de 2021
Como posso me preparar para algo que ainda não conheço?

Como posso me preparar para algo que ainda não conheço?

Cientistas da Universidade Técnica de Munique (TUM) e do Instituto Fritz Haber de Berlim abordaram essa questão quase filosófica no contexto do aprendizado de máquina.

Aprender nada mais é do que extrair novas decisões com base na experiência anterior. Para lidar com uma nova situação dessa maneira, é necessário ter lidado com situações mais ou menos semelhantes antes. No aprendizado de máquina, isso significa que um algoritmo de aprendizado precisa ter sido exposto a dados aproximadamente semelhantes.

Mas o que podemos fazer se houver uma quantidade quase infinita de possibilidades de modo que seja simplesmente impossível gerar dados que cubram todas as situações? Este problema se torna um grande desafio ao lidar com um número infinito de moléculas candidatas possíveis.

Os semicondutores orgânicos possibilitam tecnologias futuras importantes, como células solares portáteis ou telas roláveis. Para tais aplicações, moléculas orgânicas aprimoradas - que compõem esses materiais - precisam ser descobertas. Tarefas dessa natureza estão usando cada vez mais métodos de aprendizado de máquina, enquanto treinam com dados de simulações ou experimentos de computador.

O número de pequenas moléculas orgânicas potencialmente possíveis é, no entanto, estimado em cerca de 1033. Esse número esmagador de possibilidades torna praticamente impossível gerar dados suficientes para refletir uma diversidade de materiais tão grande. Além disso, muitas dessas moléculas nem mesmo são adequadas para semicondutores orgânicos. A pessoa está essencialmente procurando a proverbial agulha em um palheiro.

A equipe em torno do Prof. Karsten Reuter, Diretor do Departamento de Teoria do Fritz-Haber-Institute, e do Dr. Harald Oberhofer, Heisenberg Scholar na Cátedra de Química Teórica, abordou esse problema usando a chamada aprendizagem ativa. Em vez de aprender com os dados existentes, o algoritmo de aprendizado de máquina decide iterativamente por si mesmo quais dados ele realmente precisa para aprender sobre o problema.

Os cientistas primeiro realizam simulações em algumas moléculas menores e obtêm dados relacionados à condutividade elétrica das moléculas - uma medida de sua utilidade ao observar possíveis materiais de células solares.

Com base nesses dados, o algoritmo decide se pequenas modificações nessas moléculas já podem levar a propriedades úteis ou se é incerto devido à falta de dados semelhantes. Em ambos os casos, ele solicita automaticamente novas simulações, aprimora-se por meio dos dados recém-gerados, considera novas moléculas e repete o procedimento.

Em seu trabalho, os cientistas mostram que essa abordagem é significativamente mais eficiente do que algoritmos de busca alternativos e como moléculas novas e promissoras podem ser identificadas dessa forma, enquanto o algoritmo continua sua exploração no vasto espaço molecular. A cada semana, ele propõe novas moléculas que podem inaugurar a próxima geração de células solares, e o algoritmo está cada vez melhor.