AI leert menselijk gedrag uit video's te voorspellen

Update: 9 december 2023

Voorspellen wat iemand gaat doen op basis van zijn lichaamstaal is voor mensen vanzelfsprekend, maar niet voor computers. Wanneer we een andere persoon ontmoeten, kunnen ze ons begroeten met een hallo, een handdruk of zelfs een vuiststoot. We weten misschien niet welk gebaar zal worden gebruikt, maar we kunnen de situatie lezen en gepast reageren.

In een nieuwe studie onthullen onderzoekers van Columbia Engineering een AI vision-techniek om machines een intuïtiever gevoel te geven voor wat er daarna zal gebeuren, door gebruik te maken van associaties op een hoger niveau tussen mensen, dieren en objecten.

Algoritme is een stap in de richting van machines die betere voorspellingen kunnen doen over menselijk gedrag, en zo hun acties beter kunnen afstemmen op de onze en het aantal mogelijkheden voor samenwerking tussen mens en robot, autonome voertuigen en ondersteunende systemen. technologie.

Het is de meest nauwkeurige methode tot nu toe om video-actiegebeurtenissen tot enkele minuten in de toekomst te voorspellen, zeggen de onderzoekers. Na duizenden uren aan films, sportgames en shows zoals 'The Office' te hebben geanalyseerd, leert het systeem honderden activiteiten te voorspellen, van handen schudden tot vuiststoten. Wanneer het de specifieke actie niet kan voorspellen, vindt het het concept op een hoger niveau dat hen verbindt, in dit geval het woord 'begroeting'.

Eerdere pogingen in voorspellende machine learning, waaronder die van het team, waren gericht op het voorspellen van slechts één actie tegelijk. De algoritmen beslissen of de actie wordt geclassificeerd als een knuffel, high five, handdruk of zelfs een niet-actie zoals 'negeren'. Maar wanneer de onzekerheid groot is, kunnen de meeste machine learning-modellen geen overeenkomsten vinden tussen de mogelijke opties.

Onderzoekers besloten het voorspellingsprobleem op langere termijn vanuit een andere hoek te bekijken. Niet alles in de toekomst is voorspelbaar, aldus onderzoekers. Wanneer een persoon niet precies kan voorzien wat er zal gebeuren, spelen ze op veilig en voorspellen ze op een hoger abstractieniveau. Ons algoritme is de eerste die dit vermogen leert om abstract te redeneren over toekomstige gebeurtenissen.”

Onderzoekers moeten vragen in de wiskunde opnieuw bekijken die dateren uit de oude Grieken. Op de middelbare school leren leerlingen de bekende en intuïtieve regels van de meetkunde: rechte lijnen gaan recht, evenwijdige lijnen kruisen elkaar nooit. De meeste machine learning-systemen houden zich ook aan deze regels. Maar andere geometrieën hebben echter bizarre, contra-intuïtieve eigenschappen; rechte lijnen buigen en driehoeken puilen uit. Onderzoekers gebruikten deze ongebruikelijke geometrieën om AI-modellen te bouwen die concepten op hoog niveau organiseren en menselijk gedrag in de toekomst voorspellen.

Voorspelling is de basis van menselijke intelligentie, wetenschapper aan het Massachusetts Institute of Technology en mededirecteur van het MIT-IBM Watson AI Lab, een expert in AI en menselijke cognitie die niet betrokken was bij het onderzoek. “Machines maken fouten die mensen nooit zouden maken, omdat ze niet in staat zijn om abstract te redeneren. Dit werk is een cruciale stap om deze technologische kloof te overbruggen.”

Het door de onderzoekers ontwikkelde wiskundige raamwerk stelt machines in staat om gebeurtenissen te organiseren op basis van hoe voorspelbaar ze in de toekomst zijn. We weten bijvoorbeeld dat zwemmen en hardlopen beide vormen van beweging zijn. De nieuwe techniek leert deze activiteiten zelfstandig te categoriseren. Het systeem is zich bewust van onzekerheid en biedt meer specifieke acties als er zekerheid is en meer generieke voorspellingen als die er niet zijn.

De techniek zou computers dichter bij het kunnen brengen van een situatie en een genuanceerde beslissing kunnen brengen, in plaats van een voorgeprogrammeerde actie, zeggen de onderzoekers. Het is een cruciale stap in het opbouwen van vertrouwen tussen mensen en computers. "Vertrouwen komt voort uit het gevoel dat de robot mensen echt begrijpt", legde hij uit. "Als machines ons gedrag kunnen begrijpen en erop kunnen anticiperen, kunnen computers mensen naadloos helpen bij dagelijkse activiteiten."

Hoewel het nieuwe algoritme nauwkeurigere voorspellingen doet over benchmarktaken dan eerdere methoden, zijn de volgende stappen om te verifiëren dat het buiten het laboratorium werkt. Als het systeem in verschillende omgevingen kan werken, zijn er veel mogelijkheden om machines en robots in te zetten die onze veiligheid, gezondheid en beveiliging, zeggen de onderzoekers. De groep is van plan de prestaties van het algoritme te blijven verbeteren met grotere datasets en computers, en andere vormen van geometrie.

Menselijk gedrag is vaak verrassend en de algoritmen maken het mogelijk machines om beter te anticiperen op wat ze gaan doen.”

De studie is getiteld "Leren van de voorspelbaarheid van de toekomst."