نماذج وخوارزميات رياضية جديدة لمعالجة الصور الذكية

تحديث: 2 يونيو 2021
نماذج وخوارزميات رياضية جديدة لمعالجة الصور الذكية

باستخدام القشرة البصرية كنموذج في الدماغ البشري ، طورت مجموعة البحث بقيادة توماس بوك الحائز على جائزة ERC نماذج رياضية وخوارزميات جديدة كأساس لبرامج معالجة الصور أسرع وأكثر ذكاءً.

يمكن للقشرة البصرية لدينا التقاط الصور والتعرف على الأشياء في جزء من الثانية ، حتى لو كانت بالكاد مرئية أو مجزأة فقط. أحد أسباب هذا الأداء الرائع هو بنية الطبقة الهرمية عالية الكفاءة للقشرة البصرية. يقوم بتصفية المعلومات المرئية ، والتعرف على الاتصالات ، وإكمال الصورة باستخدام أنماط مألوفة. العملية الكامنة وراء هذا لا تزال غير مفهومة بالكاد من حيث تعقيدها. صحيح أن خوارزميات التعلم العميق موجودة الآن يمكنها أن تتطابق أو ، في بعض الحالات ، تتجاوز الأداء البشري في مهام معينة للتعرف على الأنماط. ومع ذلك ، فإن أحد عيوب هذه الخوارزميات هو أنه من الصعب فهم ما تعلموه ، وكيف يعملون ، أو عندما يرتكبون أخطاء.

توماس بوك من معهد رسومات الحاسوب والرؤية بجامعة غراتس تكنولوجيا (TU Graz) كان يسير على درب هذه المعرفة كجزء من مشروع منحة البدء الخاص بـ ERC HOMOVIS (النماذج السابقة عالية المستوى لرؤية الكمبيوتر). لقد عمل بشكل مكثف على مسألة كيفية حساب طرق تشغيل القشرة البصرية المعروفة باستخدام النماذج الرياضية ونقلها إلى تطبيقات معالجة الصور. بعد خمس سنوات من البحث، و41 منشورًا، وبراءة اختراع واحدة لاحقًا، اكتسب الباحث وفريقه البحثي معرفة واسعة تتيح خوارزميات معالجة الصور الجديدة لمجموعة واسعة من التطبيقات.

استخدم المؤسس الرئيسي لعلم نفس الجشطالت هذه القوانين لمحاولة شرح عملية الرؤية البشرية ، والتي يتم فيها تجميع المحفزات والانطباعات الحسية معًا لتشكيل وحدة كبيرة. "يمكن للإنسان بالفعل التعرف بشكل صحيح على الأشياء الجزئية أو غير المكتملة على أساس نقاط مفردة أو حدود ذاتية (خطوط خادعة). يملأ الدماغ البشري تلقائيًا معلومات الصورة المفقودة. على سبيل المثال ، من خلال توصيل النقاط عبر منحنيات سلسة قدر الإمكان ، "كما يقول بوك. وصف بوك وفريقه ظاهرة اكتشاف الشكل هذه لأول مرة باستخدام نماذج رياضية تعتمد على منحنيات أويلر المرنة - وهي معادلة شهيرة لعالم الرياضيات ليونارد أويلر يمكن استخدامها لحساب منحنيات الحد الأدنى للانحناء.

التمثيل في فضاء عالي الأبعاد

بناءً على منحنيات أويلر المرنة ، طورت مجموعة بوك خوارزميات جديدة لحل بعض مشاكل معالجة الصور المعتمدة على الانحناء. وبالتالي ، يكون الحل أسهل إذا تم تمثيل الصور (ثنائية الأبعاد) وخصائصها كنقاط بيانات في مساحة ثلاثية الأبعاد. يوضح بوك: "في البعد الثالث ، نحصل على متغير إضافي مع اتجاه حواف الكائن". تم تصميم هذا أيضًا على أساس الرؤية البشرية ويعود إلى العمل الرائد لاثنين من الحائزين على جائزة نوبل ، ديفيد هوبل وتورستن ويزل ، اللذين أثبتا في عام 2 أن القشرة البصرية تتكون من طبقات حساسة للتوجيه.

من وجهة نظر الرياضيات وعلوم الكمبيوتر ، فإن أكبر ميزة لهذا التضمين ثلاثي الأبعاد هي أنه يمكن حل مشاكل معالجة الصور باستخدام خوارزميات تحسين محدبة. في التحسين الرياضي ، تعتبر الحدود بين التحسين المحدب وغير المحدب بمثابة الحاجز الكبير الذي يميز المشكلات القابلة للحل عن المشكلات غير القابلة للحل. "وبالتالي ، نضمن أن نكون قادرين على حساب أفضل صورة لجميع صور الإدخال المحددة - بالطبع ، فقط فيما يتعلق بالنموذج الرياضي المستخدم ،" يقول بوك.

نظرة مستقبلية

الآن ، يعمل بوك وفريقه على نماذج محسنة تجمع بين الخصائص الهيكلية المعروفة للقشرة البصرية التعلم العميق الخوارزميات. الهدف هو تطوير النماذج التي تؤدي بالإضافة إلى خوارزميات التعلم العميق الحالية ، ولكنها تسمح أيضًا بفهم أعمق للهياكل المكتسبة. لقد تم بالفعل تحقيق نجاحات أولية في إعادة بناء صور التصوير المقطعي بالكمبيوتر وصور الرنين المغناطيسي. "باستخدام الخوارزميات المطورة حديثًا ، أصبح من الممكن الآن إعادة بناء الصور بأعلى جودة على الرغم من تسجيل بيانات أقل. ويوضح بوك أن هذا يوفر الوقت وقوة الحوسبة ، وبالتالي التكاليف أيضًا.