L'intelligenza artificiale impara a prevedere il comportamento umano dai video

Aggiornamento: 9 dicembre 2023

Prevedere ciò che qualcuno sta per fare in base al linguaggio del corpo è naturale per gli umani, ma non per i computer. Quando incontriamo un'altra persona, potrebbe salutarci con un saluto, una stretta di mano o persino un pugno. Potremmo non sapere quale gesto verrà utilizzato, ma possiamo leggere la situazione e rispondere in modo appropriato.

In un nuovo studio, i ricercatori della Columbia Engineering svelano un AI tecnica di visione per dare alle macchine un senso più intuitivo di ciò che accadrà dopo sfruttando associazioni di livello superiore tra persone, animali e oggetti.

L'algoritmo è un passo avanti verso la capacità delle macchine di fare previsioni migliori sul comportamento umano, e quindi coordinare meglio le loro azioni con le nostre e il numero di possibilità di collaborazione uomo-robot, veicoli autonomi e sistemi di assistenza. la tecnologia.

È il metodo più accurato fino ad oggi per prevedere eventi di azione video fino a diversi minuti nel futuro, affermano i ricercatori. Dopo aver analizzato migliaia di ore di film, giochi sportivi e programmi come "The Office", il sistema impara a prevedere centinaia di attività, dalla stretta di mano al pugno. Quando non è in grado di prevedere l'azione specifica, trova il concetto di livello superiore che li collega, in questo caso la parola "saluto".

I precedenti tentativi di apprendimento automatico predittivo, compresi quelli del team, si sono concentrati sulla previsione di una sola azione alla volta. Gli algoritmi decidono se classificare l'azione come abbraccio, batti cinque, stretta di mano o anche non azione come "ignora". Ma quando l'incertezza è alta, la maggior parte dei modelli di apprendimento automatico non è in grado di trovare punti in comune tra le possibili opzioni.

I ricercatori hanno deciso di esaminare il problema della previsione a lungo raggio da un'angolazione diversa. Non tutto in futuro è prevedibile, hanno affermato i ricercatori. Quando una persona non può prevedere esattamente cosa accadrà, gioca sul sicuro e prevede a un livello di astrazione più elevato. Il nostro algoritmo è il primo ad apprendere questa capacità di ragionare in modo astratto su eventi futuri".

I ricercatori devono rivisitare domande in matematica che risalgono agli antichi greci. Al liceo, gli studenti imparano le regole familiari e intuitive della geometria: le linee rette vanno dritte, le linee parallele non si incrociano mai. Anche la maggior parte dei sistemi di machine learning obbedisce a queste regole. Ma altre geometrie, tuttavia, hanno proprietà bizzarre e controintuitive; le linee rette si piegano e i triangoli si gonfiano. I ricercatori hanno utilizzato queste geometrie insolite per costruire modelli di intelligenza artificiale che organizzano concetti di alto livello e prevedono il comportamento umano in futuro.

La previsione è alla base dell'intelligenza umana, scienziato del Massachusetts Institute of Technology e co-direttore del MIT-IBM Watson AI Lab, esperto di intelligenza artificiale e cognizione umana che non è stato coinvolto nello studio. “Le macchine commettono errori che gli umani non farebbero mai perché mancano della nostra capacità di ragionare in modo astratto. Questo lavoro è un passo fondamentale per colmare questo divario tecnologico”.

Il quadro matematico sviluppato dai ricercatori consente alle macchine di organizzare eventi in base alla loro prevedibilità in futuro. Ad esempio, sappiamo che il nuoto e la corsa sono entrambe forme di esercizio. La nuova tecnica impara da sola a classificare queste attività. Il sistema è consapevole dell'incertezza, fornendo azioni più specifiche quando c'è certezza e previsioni più generiche quando non c'è.

La tecnica potrebbe avvicinare i computer alla capacità di valutare una situazione e prendere una decisione sfumata, invece di un'azione pre-programmata, affermano i ricercatori. È un passo fondamentale nella costruzione della fiducia tra umani e computer, "La fiducia deriva dalla sensazione che il robot capisca davvero le persone", ha spiegato. "Se le macchine possono comprendere e anticipare i nostri comportamenti, i computer saranno in grado di assistere senza problemi le persone nelle attività quotidiane".

Sebbene il nuovo algoritmo esegua previsioni più accurate sulle attività di benchmark rispetto ai metodi precedenti, i passaggi successivi sono verificare che funzioni al di fuori del laboratorio. Se il sistema può funzionare in diverse impostazioni, ci sono molte possibilità per distribuire macchine e robot che potrebbero migliorare il nostro sicurezza, salute e sicurezza, dicono i ricercatori. Il gruppo prevede di continuare a migliorare le prestazioni dell'algoritmo con set di dati e computer più grandi e altre forme di geometria.

Il comportamento umano è spesso sorprendente e gli algoritmi consentono macchine per anticipare meglio cosa faranno dopo”.

Lo studio si intitola "Imparare la prevedibilità del futuro".