AIはビデオから人間の行動を予測することを学ぶ

更新日: 9 年 2023 月 XNUMX 日

ボディランゲージに基づいて誰かが次に何をしようとしているのかを予測することは、人間には自然に起こりますが、コンピューターにはそうではありません。 私たちが他の人に会うとき、彼らは挨拶、握手、あるいはこぶしでさえ私たちに挨拶するかもしれません。 どのジェスチャが使用されるかわからない場合がありますが、状況を読み取って適切に対応することはできます。

新しい研究で、コロンビアエンジニアリングの研究者は、 AI 人、動物、物体間の高次の関連性を活用することで、次に何が起こるかをより直感的に機械に認識させるためのビジョン技術。

アルゴリズムは、機械が人間の行動についてより適切に予測できるようになるための一歩であり、その結果、人間の行動と人間の行動をより適切に調整できるようになり、人間とロボットのコラボレーション、自動運転車、支援機器の可能性が数多く広がります。 テクノロジー.

これは、将来数分までのビデオアクションイベントを予測するためのこれまでで最も正確な方法であると研究者らは述べています。 何千時間もの映画、スポーツゲーム、「The Office」などの番組を分析した後、システムは、ハンドシェイクからフィストバンプまで、何百ものアクティビティを予測することを学習します。 特定のアクションを予測できない場合、それらをリンクするより高いレベルの概念、この場合は「挨拶」という単語を見つけます。

チームによるものを含む、予測機械学習の過去の試みは、一度にXNUMXつのアクションのみを予測することに焦点を当ててきました。 アルゴリズムは、アクションをハグ、ハイタッチ、ハンドシェイク、または「無視」などの非アクションとして分類するかどうかを決定します。 しかし、不確実性が高い場合、ほとんどの機械学習モデルは、可能なオプション間の共通点を見つけることができません。

研究者たちは、より長距離の予測問題を別の角度から見ることにしました。 将来のすべてが予測できるわけではない、と研究者達は言った。 人が何が起こるかを正確に予測できない場合、彼らはそれを安全にプレイし、より高いレベルの抽象化で予測します。 私たちのアルゴリズムは、将来のイベントについて抽象的に推論するこの機能を最初に学習したものです。」

研究者は、古代ギリシャ人にまでさかのぼる数学の質問を再検討する必要があります。 高校では、学生は、直線はまっすぐになり、平行線は決して交差しないという、おなじみの直感的な幾何学の規則を学びます。 ほとんどの機械学習システムもこれらのルールに従います。 ただし、他のジオメトリには、奇妙で直感に反する特性があります。 直線が曲がり、三角形が膨らみます。 研究者は、これらの珍しい形状を使用して、高レベルの概念を整理し、将来の人間の行動を予測するAIモデルを構築しました。

予測は、人間の知性の基礎であり、マサチューセッツ工科大学の科学者であり、研究に関与しなかったAIと人間の認知の専門家であるMIT-IBMワトソンAIラボの共同ディレクターです。 「機械は、抽象的に推論する能力がないため、人間が決して犯さないような間違いを犯します。 この作業は、この技術的なギャップを埋めるための極めて重要なステップです。」

研究者によって開発された数学的フレームワークにより、マシンはイベントを将来の予測可能性に応じて整理できます。 たとえば、水泳とランニングはどちらも運動の形態であることがわかっています。 新しい手法では、これらのアクティビティを独自に分類する方法を学習します。 システムは不確実性を認識しており、確実性がある場合はより具体的なアクションを提供し、そうでない場合はより一般的な予測を提供します。

この技術は、事前にプログラムされた行動の代わりに、コンピューターを状況のサイズを大きくし、微妙な決定を下すことができるように近づける可能性がある、と研究者らは述べています。 これは、人間とコンピューターの間に信頼を築く上で重要なステップです。「信頼は、ロボットが本当に人を理解しているという感覚から生まれます」と彼は説明しました。 「機械が私たちの行動を理解して予測できれば、コンピューターは人々の日常の活動をシームレスに支援できるようになります。」

新しいアルゴリズムは以前の方法よりもベンチマークタスクでより正確な予測を行いますが、次のステップはそれがラボの外で機能することを確認することです。システムがさまざまな設定で機能する場合は、マシンやロボットを展開して、安全性、健康、およびセキュリティ、研究者は言います。 このグループは、より大きなデータセットやコンピューター、およびその他の形式のジオメトリを使用して、アルゴリズムのパフォーマンスを引き続き改善することを計画しています。

人間の行動はしばしば驚くべきものであり、アルゴリズムは 彼らが次に何をしようとしているのかをよりよく予測するためです。」

この研究のタイトルは「未来の予測可能性を学ぶ」です。