Machine Learning-applicaties hebben minder gegevens nodig dan werd aangenomen

Update: 31 juli 2021
Machine Learning-applicaties hebben minder gegevens nodig dan werd aangenomen

Onderzoekers van de Universiteit van British Columbia en de Universiteit van Alberta hebben ontdekt dat in ieder geval sommige machine learning-toepassingen van veel minder voorbeelden kunnen leren dan werd aangenomen. De groep beschrijft tests die ze hebben uitgevoerd met machine learning-applicaties die zijn gemaakt om bepaalde soorten moleculaire processen te voorspellen. structuren.

Machine learning kan in een breed scala aan toepassingen worden gebruikt. Een van de bekendste is het leren herkennen van mensen of objecten op foto's. Dergelijke toepassingen vereisen doorgaans enorme hoeveelheden gegevens voor training. Bij deze nieuwe poging hebben de onderzoekers ontdekt dat machine learning-toepassingen in sommige gevallen niet zulke grote hoeveelheden gegevens nodig hebben om bruikbaar te zijn.

De onderzoekers waren in eerste instantie op zoek naar manieren om de structuur van illegale designerdrugs te voorspellen. Dit zou medische onderzoekers helpen zich erop voor te bereiden als mensen die ze consumeren op de spoedeisende hulp van ziekenhuizen verschijnen. Het team besefte dat hun werk veel eenvoudiger zou zijn als ze een machine learning-applicatie konden gebruiken; Helaas zijn er slechts 1,700 bekende designermedicijnen die kunnen worden gebruikt om een ​​dergelijk systeem te trainen. Onverschrokken vroegen de onderzoekers zich af of het mogelijk zou zijn om erachter te komen hoeveel gegevens er nodig zouden zijn om een ​​dergelijk systeem bruikbaar te maken, of dat er misschien een manier zou zijn om een ​​algoritme of de gegevens die gebruikt werden om het te trainen zo aan te passen dat voor minder beschikbare gegevens.

Om daar achter te komen, creëerden de onderzoekers 8,500 modellen en trainden ze elk van deze op datasets van verschillende grootte, afkomstig van de 500,000 moleculen in het vereenvoudigde regelinvoersysteem met moleculaire invoer. Vervolgens gebruikten ze de modellen om mogelijke moleculaire typen te voorspellen. Daarbij ontdekten ze dat veel van de modellen redelijk goed werkten met de beperkte dataset. Ze ontdekten ook dat de meesten van hen na slechts 10,000 tot 20,000 jaar hun voorspellende vaardigheden begonnen te stabiliseren. gegevens records. Toen ze de best presterende modellen gebruikten om hun eerste onderzoek uit te voeren, ontdekten ze dat de resultaten ongeveer 50% van de tijd correct waren.