تحتاج تطبيقات التعلم الآلي إلى بيانات أقل مما كان مفترضًا

تحتاج تطبيقات التعلم الآلي إلى بيانات أقل مما تم افتراضه

وجد باحثون من جامعة كولومبيا البريطانية وجامعة ألبرتا أن بعض تطبيقات التعلم الآلي على الأقل يمكن أن تتعلم من أمثلة أقل بكثير مما كان مفترضًا ، وتصف المجموعة الاختبار الذي أجروه باستخدام تطبيقات التعلم الآلي التي تم إنشاؤها للتنبؤ بأنواع معينة من الجزيئات الهياكل.

يمكن استخدام التعلم الآلي في مجموعة متنوعة من التطبيقات - ومن أكثر التطبيقات شهرة هو تعلم التعرف على الأشخاص أو الأشياء في الصور الفوتوغرافية. تتطلب مثل هذه التطبيقات عادةً كميات هائلة من البيانات للتدريب. في هذا الجهد الجديد ، وجد الباحثون أنه في بعض الحالات ، لا تحتاج تطبيقات التعلم الآلي إلى مثل هذه الكميات الضخمة من البيانات لتكون مفيدة.

كان الباحثون في البداية يبحثون عن طرق للتنبؤ بهيكل العقاقير غير القانونية المصممة. سيساعد القيام بذلك الباحثين الطبيين على الاستعداد لهم إذا بدأ الأشخاص الذين يستهلكونهم في الظهور في غرف الطوارئ بالمستشفى. أدرك الفريق أن وظيفتهم ستكون أسهل بكثير إذا تمكنوا من استخدام تطبيق التعلم الآلي ؛ لسوء الحظ ، لا يوجد سوى 1,700 دواء مصمم معروف يمكن استخدامها لتدريب مثل هذا النظام. تساءل الباحثون بشجاعة عما إذا كان من الممكن معرفة مقدار البيانات المطلوبة لمثل هذا النظام ليكون مفيدًا ، أو ما إذا كانت هناك طريقة لتعديل خوارزمية أو البيانات التي تم استخدامها لتدريبها للسماح للحصول على بيانات أقل المتاحة.

لمعرفة ذلك ، أنشأ الباحثون 8,500 نموذجًا ودربوا كل منها على مجموعات بيانات مختلفة الحجم مأخوذة من 500,000 جزيء في نظام إدخال خط الإدخال الجزيئي المبسط. ثم استخدموا النماذج للتنبؤ بالأنواع الجزيئية المحتملة. وبذلك ، وجدوا أن العديد من النماذج تعمل جيدًا مع مجموعة البيانات المحدودة. ووجدوا أيضًا أن معظمهم بدأوا في الاستقرار في قدراتهم التنبؤية بعد 10,000 إلى 20,000 فقط البيانات السجلات. عندما استخدموا أفضل النماذج أداءً لإجراء أبحاثهم الأولية ، وجدوا أن النتائج كانت صحيحة تقريبًا بنسبة 50٪ من الوقت.

تحتاج تطبيقات التعلم الآلي إلى بيانات أقل مما تم افتراضه