แอปพลิเคชันการเรียนรู้ของเครื่องต้องการข้อมูลน้อยกว่าที่คาดการณ์ไว้

อัปเดต: 31 กรกฎาคม 2021
แอปพลิเคชันการเรียนรู้ของเครื่องต้องการข้อมูลน้อยกว่าที่คาดการณ์ไว้

นักวิจัยจากมหาวิทยาลัยบริติชโคลัมเบียและมหาวิทยาลัยอัลเบอร์ตาพบว่าอย่างน้อยแอปพลิเคชันการเรียนรู้ด้วยเครื่องบางตัวสามารถเรียนรู้จากตัวอย่างที่น้อยกว่าที่คาดไว้ กลุ่มนี้อธิบายการทดสอบที่พวกเขาดำเนินการด้วยแอปพลิเคชันการเรียนรู้ด้วยเครื่องที่สร้างขึ้นเพื่อทำนายโมเลกุลบางประเภท โครงสร้าง

แมชชีนเลิร์นนิงสามารถใช้ในแอปพลิเคชันต่างๆ ได้หลากหลาย หนึ่งในโปรแกรมที่เป็นที่รู้จักมากที่สุดคือการเรียนรู้ที่จะระบุบุคคลหรือวัตถุในภาพถ่าย แอปพลิเคชันดังกล่าวมักต้องการข้อมูลจำนวนมากสำหรับการฝึกอบรม ในความพยายามครั้งใหม่นี้ นักวิจัยพบว่าในบางกรณี แอปพลิเคชันการเรียนรู้ของเครื่องไม่จำเป็นต้องมีข้อมูลจำนวนมากจึงจะมีประโยชน์

ในขั้นต้นนักวิจัยกำลังมองหาวิธีที่จะทำนายโครงสร้างของยาที่ออกแบบโดยผิดกฎหมาย การทำเช่นนี้จะช่วยให้นักวิจัยทางการแพทย์เตรียมพร้อมสำหรับพวกเขาหากผู้ที่บริโภคพวกเขาเริ่มปรากฏตัวในห้องฉุกเฉินของโรงพยาบาล ทีมงานตระหนักดีว่างานของพวกเขาจะง่ายขึ้นมากหากพวกเขาใช้แอปพลิเคชันการเรียนรู้ของเครื่อง น่าเสียดายที่มียาดีไซเนอร์ที่รู้จักกันดีเพียง 1,700 ตัวที่สามารถใช้ในการฝึกอบรมระบบดังกล่าวได้ ไม่สะทกสะท้าน นักวิจัยสงสัยว่าอาจเป็นไปได้ที่จะคิดออกว่าต้องใช้ข้อมูลมากน้อยเพียงใดเพื่อให้ระบบดังกล่าวมีประโยชน์ หรืออาจมีวิธีแก้ไขอัลกอริทึมหรือข้อมูลที่ใช้ในการฝึกให้อนุญาต สำหรับข้อมูลที่มีอยู่น้อย

เพื่อหาคำตอบ นักวิจัยได้สร้างแบบจำลอง 8,500 แบบจำลองและฝึกฝนแต่ละชุดเกี่ยวกับชุดข้อมูลขนาดต่างๆ ที่นำมาจากโมเลกุล 500,000 โมเลกุลในระบบป้อนเข้าของโมเลกุลแบบง่าย จากนั้นจึงใช้แบบจำลองเพื่อทำนายประเภทโมเลกุลที่เป็นไปได้ ในการทำเช่นนั้น พวกเขาพบว่าโมเดลจำนวนมากทำงานได้ดีกับชุดข้อมูลที่จำกัด พวกเขายังพบว่าส่วนใหญ่เริ่มมีระดับความสามารถในการทำนายหลังจากผ่านไปเพียง 10,000 ถึง 20,000 ข้อมูล บันทึก เมื่อพวกเขาใช้แบบจำลองที่มีประสิทธิภาพดีที่สุดเพื่อทำการวิจัยเบื้องต้น พวกเขาพบว่าผลลัพธ์นั้นถูกต้องประมาณ 50% ของเวลาทั้งหมด