ИИ учится предсказывать поведение человека по видео

Прогнозирование того, что кто-то собирается делать дальше на основе его языка тела, естественно для людей, но не для компьютеров. Когда мы встречаемся с другим человеком, он может приветствовать нас приветствием, рукопожатием или даже ударом кулака. Мы можем не знать, какой жест будет использоваться, но мы можем прочитать ситуацию и отреагировать соответствующим образом.

В новом исследовании исследователи Columbia Engineering представили AI техника видения, позволяющая машинам более интуитивно понимать, что произойдет дальше, за счет использования ассоциаций более высокого уровня между людьми, животными и объектами.

Алгоритм — это шаг к тому, чтобы машины могли лучше прогнозировать поведение человека и, таким образом, лучше координировать свои действия с нашими, а также ряд возможностей для сотрудничества человека и робота, автономных транспортных средств и вспомогательных средств. technology.

Исследователи утверждают, что на сегодняшний день это самый точный метод прогнозирования событий видео действия на несколько минут в будущем. После анализа тысяч часов фильмов, спортивных игр и шоу, таких как «Офис», система учится предсказывать сотни действий, от рукопожатия до ударов кулаками. Когда он не может предсказать конкретное действие, он находит концепцию более высокого уровня, которая их связывает, в данном случае слово «приветствие».

Предыдущие попытки прогнозирующего машинного обучения, в том числе предпринятые командой, были сосредоточены на прогнозировании только одного действия за раз. Алгоритмы решают, следует ли классифицировать действие как объятие, дай пять, рукопожатие или даже бездействие, такое как «игнорирование». Но когда неопределенность высока, большинство моделей машинного обучения неспособны найти общие черты между возможными вариантами.

Исследователи решили взглянуть на проблему долгосрочного прогнозирования под другим углом. По мнению исследователей, не все в будущем можно предсказать. Когда человек не может точно предвидеть, что произойдет, он перестраховывается и предсказывает на более высоком уровне абстракции. Наш алгоритм первым научился этой способности абстрактно рассуждать о будущих событиях ».

Исследователям приходится возвращаться к вопросам математики, восходящим к древним грекам. В старших классах ученики изучают знакомые и интуитивно понятные правила геометрии: прямые линии идут прямо, а параллельные никогда не пересекаются. Большинство систем машинного обучения также подчиняются этим правилам. Но другие геометрии, однако, обладают причудливыми, противоречащими интуиции свойствами; прямые изгибаются, а треугольники выпирают. Исследователи использовали эту необычную геометрию для создания моделей искусственного интеллекта, которые организуют концепции высокого уровня и предсказывают поведение человека в будущем.

Прогнозирование - это основа человеческого интеллекта, ученый из Массачусетского технологического института и содиректор лаборатории искусственного интеллекта MIT-IBM Watson AI Lab, эксперт в области искусственного интеллекта и человеческого познания, не принимавший участия в исследовании. «Машины совершают ошибки, которых люди никогда не сделают, потому что им не хватает нашей способности рассуждать абстрактно. Эта работа является важным шагом на пути к преодолению этого технологического разрыва ».

Математическая основа, разработанная исследователями, позволяет машинам организовывать события в зависимости от того, насколько они предсказуемы в будущем. Например, мы знаем, что плавание и бег - это формы упражнений. Новая методика сама по себе учит классифицировать эти действия. Система осведомлена о неопределенности, предлагая более конкретные действия, когда есть определенность, и более общие прогнозы, когда ее нет.

По словам исследователей, этот метод может приблизить компьютеры к способности оценивать ситуацию и принимать взвешенное решение вместо заранее запрограммированных действий. Это важный шаг в построении доверия между людьми и компьютерами. «Доверие возникает из чувства, что робот действительно понимает людей», - пояснил он. «Если машины смогут понимать и предвидеть наше поведение, компьютеры смогут беспрепятственно помогать людям в повседневной деятельности».

Хотя новый алгоритм делает более точные прогнозы для тестовых задач, чем предыдущие методы, следующие шаги - убедиться, что он работает за пределами лаборатории. Если система может работать в различных настройках, есть много возможностей для развертывания машин и роботов, которые могут улучшить нашу безопасность, здоровье и безопасность, говорят исследователи. Группа планирует продолжать улучшать производительность алгоритма с помощью больших наборов данных и компьютеров, а также других форм геометрии.

Человеческое поведение часто удивляет, а алгоритмы позволяют и машины всегда новые для производства лучших продуктов. чтобы лучше предвидеть, что они собираются делать дальше ».

Исследование называется «Изучение предсказуемости будущего».