AI เรียนรู้ที่จะทำนายพฤติกรรมของมนุษย์จากวิดีโอ

อัปเดต: 9 ธันวาคม 2023

การคาดคะเนสิ่งที่ใครบางคนกำลังจะทำต่อไปโดยพิจารณาจากภาษากายของพวกเขานั้นเป็นเรื่องปกติสำหรับมนุษย์ แต่ไม่ใช่สำหรับคอมพิวเตอร์ เมื่อเราพบคนอื่น พวกเขาอาจทักทายเราด้วยการทักทาย การจับมือ หรือแม้แต่การกระแทก เราอาจไม่รู้ว่าจะใช้ท่าทางใด แต่เราสามารถอ่านสถานการณ์และตอบสนองได้อย่างเหมาะสม

ในการศึกษาใหม่ นักวิจัยของ Columbia Engineering เปิดเผยถึง AI เทคนิคการมองเห็นเพื่อให้เครื่องจักรเข้าใจสิ่งที่จะเกิดขึ้นต่อไปโดยอาศัยการเชื่อมโยงในระดับที่สูงกว่าระหว่างคน สัตว์ และวัตถุ

อัลกอริธึมเป็นขั้นตอนหนึ่งที่ทำให้เครื่องจักรสามารถคาดการณ์ได้ดีขึ้นเกี่ยวกับพฤติกรรมของมนุษย์ และด้วยเหตุนี้จึงประสานการกระทำของพวกเขาเข้ากับเราและความเป็นไปได้ในการทำงานร่วมกันระหว่างมนุษย์กับหุ่นยนต์ ยานพาหนะที่เป็นอิสระ และการช่วยเหลือต่างๆ ได้ดียิ่งขึ้น เทคโนโลยี.

นักวิจัยกล่าวว่าเป็นวิธีที่แม่นยำที่สุดในการคาดการณ์เหตุการณ์การกระทำของวิดีโอในอนาคตหลายนาที หลังจากวิเคราะห์ภาพยนตร์ เกมกีฬา และรายการต่างๆ นับพันชั่วโมง เช่น "The Office" ระบบเรียนรู้ที่จะคาดเดากิจกรรมนับร้อย ตั้งแต่การจับมือกันจนถึงการชก เมื่อไม่สามารถคาดเดาการกระทำเฉพาะได้ ก็จะพบแนวคิดระดับสูงที่เชื่อมโยงพวกเขา ในกรณีนี้คือคำว่า "การทักทาย"

ความพยายามในอดีตในแมชชีนเลิร์นนิงเชิงคาดการณ์ ซึ่งรวมถึงการทดลองโดยทีม ได้มุ่งเน้นที่การคาดการณ์เพียงการดำเนินการครั้งละหนึ่งรายการ อัลกอริธึมตัดสินใจว่าจะจัดประเภทการกระทำเป็นการกอด จูบมือ จับมือ หรือแม้แต่การไม่ดำเนินการ เช่น "ละเว้น" แต่เมื่อความไม่แน่นอนสูง โมเดลการเรียนรู้ของเครื่องส่วนใหญ่จะไม่พบสิ่งที่เหมือนกันระหว่างตัวเลือกที่เป็นไปได้

นักวิจัยตัดสินใจพิจารณาปัญหาการทำนายระยะยาวจากมุมที่ต่างออกไป นักวิจัยกล่าวว่าไม่ใช่ทุกสิ่งในอนาคตที่สามารถคาดเดาได้ เมื่อบุคคลไม่สามารถคาดการณ์ล่วงหน้าได้ว่าจะเกิดอะไรขึ้น พวกเขาจะเล่นอย่างปลอดภัยและคาดการณ์ในระดับนามธรรมที่สูงขึ้น อัลกอริธึมของเราเป็นรายแรกในการเรียนรู้ความสามารถนี้ในการให้เหตุผลเชิงนามธรรมเกี่ยวกับเหตุการณ์ในอนาคต”

นักวิจัยต้องทบทวนคำถามในวิชาคณิตศาสตร์ที่ย้อนไปถึงสมัยกรีกโบราณ ในโรงเรียนมัธยมศึกษาตอนปลาย นักเรียนจะได้เรียนรู้กฎของเรขาคณิตที่คุ้นเคยและเป็นธรรมชาติ—เส้นตรงที่ตัดกันเป็นเส้นตรง เส้นขนานไม่เคยตัดกัน ระบบการเรียนรู้ของเครื่องส่วนใหญ่จะปฏิบัติตามกฎเหล่านี้ด้วย แต่รูปทรงอื่นๆ มีคุณสมบัติที่แปลกประหลาดและตอบโต้ได้ง่าย เส้นตรงโค้งงอและสามเหลี่ยมนูน นักวิจัยใช้รูปทรงเรขาคณิตที่ผิดปกติเหล่านี้เพื่อสร้างแบบจำลอง AI ที่จัดระเบียบแนวคิดระดับสูงและทำนายพฤติกรรมของมนุษย์ในอนาคต

การทำนายคือพื้นฐานของความฉลาดของมนุษย์ นักวิทยาศาสตร์จากสถาบันเทคโนโลยีแมสซาชูเซตส์ และผู้อำนวยการร่วมของ MIT-IBM Watson AI Lab ผู้เชี่ยวชาญด้าน AI และความรู้ความเข้าใจของมนุษย์ซึ่งไม่ได้เกี่ยวข้องกับการศึกษานี้ “เครื่องจักรทำผิดพลาดที่มนุษย์ไม่เคยทำเพราะขาดความสามารถในการให้เหตุผลอย่างเป็นนามธรรม งานนี้เป็นก้าวสำคัญในการเชื่อมช่องว่างทางเทคโนโลยีนี้”

กรอบทางคณิตศาสตร์ที่พัฒนาขึ้นโดยนักวิจัยทำให้เครื่องสามารถจัดระเบียบเหตุการณ์ต่างๆ ได้โดยคาดการณ์ว่าจะเป็นไปได้อย่างไรในอนาคต ตัวอย่างเช่น เรารู้ว่าว่ายน้ำและวิ่งเป็นการออกกำลังกายทั้งสองรูปแบบ เทคนิคใหม่นี้เรียนรู้วิธีจัดหมวดหมู่กิจกรรมเหล่านี้ด้วยตัวเอง ระบบจะตระหนักถึงความไม่แน่นอน โดยให้การดำเนินการที่เฉพาะเจาะจงมากขึ้นเมื่อมีความแน่นอน และการคาดการณ์ทั่วไปมากขึ้นเมื่อไม่มี

เทคนิคนี้สามารถเคลื่อนย้ายคอมพิวเตอร์ให้เข้าใกล้ความสามารถในการปรับขนาดสถานการณ์และตัดสินใจได้อย่างเหมาะสม แทนที่จะเป็นการกระทำที่ตั้งโปรแกรมไว้ล่วงหน้า นักวิจัยกล่าว เป็นขั้นตอนสำคัญในการสร้างความไว้วางใจระหว่างมนุษย์กับคอมพิวเตอร์ "ความไว้วางใจมาจากความรู้สึกที่หุ่นยนต์เข้าใจคนจริงๆ" เขาอธิบาย “หากเครื่องจักรสามารถเข้าใจและคาดการณ์พฤติกรรมของเราได้ คอมพิวเตอร์จะสามารถช่วยเหลือผู้คนในกิจกรรมประจำวันได้อย่างราบรื่น”

แม้ว่าอัลกอริธึมใหม่จะคาดการณ์งานเปรียบเทียบได้แม่นยำกว่าวิธีก่อนหน้า ขั้นตอนต่อไปคือการตรวจสอบว่าทำงานนอกห้องปฏิบัติการหรือไม่ หากระบบสามารถทำงานในการตั้งค่าที่หลากหลาย มีความเป็นไปได้มากมายที่จะปรับใช้เครื่องจักรและหุ่นยนต์ที่อาจช่วยปรับปรุง นักวิจัยกล่าวว่าความปลอดภัย สุขภาพ และความมั่นคง กลุ่มวางแผนที่จะปรับปรุงประสิทธิภาพของอัลกอริทึมต่อไปด้วยชุดข้อมูลและคอมพิวเตอร์ที่ใหญ่ขึ้น และรูปทรงเรขาคณิตอื่นๆ

พฤติกรรมของมนุษย์มักจะน่าประหลาดใจและอัลกอริทึมก็เปิดใช้งานได้ เครื่อง เพื่อคาดเดาสิ่งที่พวกเขาจะทำต่อไปได้ดีขึ้น”

การศึกษานี้มีชื่อว่า “การเรียนรู้การทำนายอนาคต”