AI는 비디오에서 인간 행동을 예측하는 방법을 배웁니다.

업데이트: 9년 2023월 XNUMX일

신체 언어를 기반으로 누군가가 다음에 무엇을하려고하는지 예측하는 것은 인간에게는 자연 스럽지만 컴퓨터에게는 그렇지 않습니다. 우리가 다른 사람을 만날 때, 그들은 우리에게 인사, 악수, 심지어 주먹을 부딪히는 소리로 우리를 맞이할 수도 있습니다. 어떤 제스처가 사용 될지 모를 수도 있지만 상황을 읽고 적절하게 대응할 수 있습니다.

새로운 연구에서 Columbia Engineering 연구원들은 AI 사람, 동물, 사물 간의 더 높은 수준의 연관성을 활용하여 다음에 일어날 일에 대해 기계에게 보다 직관적인 감각을 제공하는 비전 기술입니다.

알고리즘은 기계가 인간 행동에 대해 더 나은 예측을 할 수 있도록 한 단계 나아가 인간의 행동과 인간의 행동을 더 잘 조정하고 인간-로봇 협업, 자율 차량 및 보조 보조 장치에 대한 가능성을 높입니다. technology.

연구진은 이것이 앞으로 몇 분 동안 비디오 액션 이벤트를 예측하는 가장 정확한 방법이라고 말합니다. 수천 시간 분량의 영화, 스포츠 게임 및 "The Office"와 같은 프로그램을 분석 한 후 시스템은 핸드 셰이 킹에서 주먹 부딪힘에 이르기까지 수백 가지 활동을 예측하는 방법을 학습합니다. 특정 행동을 예측할 수없는 경우이를 연결하는 상위 개념,이 경우 "인사"라는 단어를 찾습니다.

팀의 시도를 포함하여 예측 기계 학습에 대한 과거의 시도는 한 번에 하나의 작업 만 예측하는 데 초점을 맞추 었습니다. 알고리즘은 동작을 포옹, 하이 파이브, 악수 또는 "무시"와 같은 비 동작으로 분류할지 여부를 결정합니다. 그러나 불확실성이 높으면 대부분의 기계 학습 모델은 가능한 옵션 간의 공통점을 찾을 수 없습니다.

연구원들은 다른 각도에서 장거리 예측 문제를보기로 결정했습니다. 미래의 모든 것이 예측 가능한 것은 아닙니다. 사람이 정확히 어떤 일이 일어날 지 예측할 수 없을 때, 그들은 안전하게 플레이하고 더 높은 수준의 추상화에서 예측합니다. 우리의 알고리즘은 미래의 사건에 대해 추상적으로 추론하기 위해이 기능을 처음으로 배우는 것입니다.”

연구자들은 고대 그리스로 거슬러 올라가는 수학 문제를 다시 검토해야합니다. 고등학교에서 학생들은 직선이 똑바로 가고 평행선이 절대 교차하지 않는다는 친숙하고 직관적 인 기하학 규칙을 배웁니다. 대부분의 기계 학습 시스템도 이러한 규칙을 따릅니다. 그러나 다른 기하학은 기이하고 반 직관적 인 속성을 가지고 있습니다. 직선이 구부러지고 삼각형이 부풀어 오른다. 연구원들은 이러한 특이한 기하학을 사용하여 높은 수준의 개념을 구성하고 미래의 인간 행동을 예측하는 AI 모델을 구축했습니다.

예측은 인간 지능의 기초이며 Massachusetts Institute of Technology의 과학자이자 연구에 참여하지 않은 AI 및 인간인지 전문가 인 MIT-IBM Watson AI Lab의 공동 책임자입니다. “기계는 추상적으로 추론 할 수있는 능력이 부족하기 때문에 인간이 절대하지 않을 실수를합니다. 이 작업은 이러한 기술 격차를 해소하기위한 중추적 인 단계입니다. "

연구자들이 개발 한 수학적 프레임 워크를 통해 기계는 미래의 예측 가능성에 따라 이벤트를 구성 할 수 있습니다. 예를 들어, 우리는 수영과 달리기가 모두 운동의 형태라는 것을 알고 있습니다. 새로운 기술은 이러한 활동을 자체적으로 분류하는 방법을 배웁니다. 시스템은 불확실성을 인식하여 확실성이있을 때보다 구체적인 조치를 제공하고 그렇지 않을 때보다 일반적인 예측을 제공합니다.

이 기술은 사전에 프로그래밍 된 행동 대신에 상황을 파악하고 미묘한 결정을 내릴 수있는 능력에 더 가깝게 컴퓨터를 움직일 수 있다고 연구원들은 말한다. 인간과 컴퓨터 간의 신뢰를 구축하는 데 중요한 단계입니다. "신뢰는 로봇이 사람을 진정으로 이해한다는 느낌에서 비롯됩니다."라고 그는 설명했습니다. "기계가 우리의 행동을 이해하고 예측할 수 있다면 컴퓨터는 일상 활동에서 사람들을 원활하게 지원할 수있을 것입니다."

새로운 알고리즘은 이전 방법보다 벤치 마크 작업에 대해 더 정확한 예측을하지만 다음 단계는 실험실 외부에서 작동하는지 확인하는 것입니다. 연구원들은 안전, 건강 및 보안을 말합니다. 이 그룹은 더 큰 데이터 세트와 컴퓨터 및 기타 형태의 지오메트리를 통해 알고리즘의 성능을 지속적으로 개선 할 계획입니다.

인간의 행동은 종종 놀랍고 알고리즘은 기계 그들이 다음에 무엇을할지 더 잘 예상하기 위해서.”

이 연구의 제목은 "미래의 예측 가능성 학습"입니다.