تحتاج تطبيقات التعلم الآلي إلى بيانات أقل مما تم افتراضه

التحديث: 31 يوليو 2021
تحتاج تطبيقات التعلم الآلي إلى بيانات أقل مما تم افتراضه

وجد باحثون من جامعة كولومبيا البريطانية وجامعة ألبرتا أن بعض تطبيقات التعلم الآلي على الأقل يمكن أن تتعلم من أمثلة أقل بكثير مما كان مفترضًا ، وتصف المجموعة الاختبار الذي أجروه باستخدام تطبيقات التعلم الآلي التي تم إنشاؤها للتنبؤ بأنواع معينة من الجزيئات الهياكل.

يمكن استخدام التعلم الآلي في مجموعة متنوعة من التطبيقات - ومن أكثر التطبيقات شهرة هو تعلم التعرف على الأشخاص أو الأشياء في الصور الفوتوغرافية. تتطلب مثل هذه التطبيقات عادةً كميات هائلة من البيانات للتدريب. في هذا الجهد الجديد ، وجد الباحثون أنه في بعض الحالات ، لا تحتاج تطبيقات التعلم الآلي إلى مثل هذه الكميات الضخمة من البيانات لتكون مفيدة.

كان الباحثون في البداية يبحثون عن طرق للتنبؤ بهيكل العقاقير غير القانونية المصممة. سيساعد القيام بذلك الباحثين الطبيين على الاستعداد لهم إذا بدأ الأشخاص الذين يستهلكونهم في الظهور في غرف الطوارئ بالمستشفى. أدرك الفريق أن وظيفتهم ستكون أسهل بكثير إذا تمكنوا من استخدام تطبيق التعلم الآلي ؛ لسوء الحظ ، لا يوجد سوى 1,700 دواء مصمم معروف يمكن استخدامها لتدريب مثل هذا النظام. تساءل الباحثون بشجاعة عما إذا كان من الممكن معرفة مقدار البيانات المطلوبة لمثل هذا النظام ليكون مفيدًا ، أو ما إذا كانت هناك طريقة لتعديل خوارزمية أو البيانات التي تم استخدامها لتدريبها للسماح للحصول على بيانات أقل المتاحة.

لمعرفة ذلك ، أنشأ الباحثون 8,500 نموذجًا ودربوا كل منها على مجموعات بيانات مختلفة الحجم مأخوذة من 500,000 جزيء في نظام إدخال خط الإدخال الجزيئي المبسط. ثم استخدموا النماذج للتنبؤ بالأنواع الجزيئية المحتملة. وبذلك ، وجدوا أن العديد من النماذج تعمل جيدًا مع مجموعة البيانات المحدودة. ووجدوا أيضًا أن معظمهم بدأوا في الاستقرار في قدراتهم التنبؤية بعد 10,000 إلى 20,000 فقط البيانات السجلات. عندما استخدموا أفضل النماذج أداءً لإجراء أبحاثهم الأولية ، وجدوا أن النتائج كانت صحيحة تقريبًا بنسبة 50٪ من الوقت.