يعالج مخطط تريليون حافة بدون لمس الذاكرة الرئيسية

التحديث: 7 مايو 2021

كلمة "تطوير" هي الكلمة المهمة هنا ، حيث يغطي البحث شحذ الخوارزميات على مجموعات البيانات الاصطناعية بدلاً من البيانات الكبيرة الحقيقية.

قال كايست: "تُستخدم الرسوم البيانية على نطاق واسع لتمثيل وتحليل كائنات العالم الحقيقي في العديد من المجالات مثل الشبكات الاجتماعية وذكاء الأعمال وعلم الأحياء وعلم الأعصاب". "عند تطوير واختبار الخوارزميات لرسم بياني واسع النطاق ، عادةً ما يتم استخدام الرسم البياني التركيبي بدلاً من الرسم البياني الحقيقي. وذلك لأن مشاركة واستخدام الرسوم البيانية الحقيقية واسعة النطاق محدودة للغاية نظرًا لكونها مملوكة أو من المستحيل عمليًا جمعها ".

تقليديًا ، وفقًا لكايست ، يتم تطوير واختبار خوارزميات الرسم البياني من خلال النهج التالي المكون من خطوتين:

تقوم الخطوة الأولى بإنشاء رسم بياني اصطناعي وتخزينه على أقراص. عادةً ما يتم إنشاء الرسم البياني إما عن طريق التوليد المستند إلى المعلمات أو توسيع نطاق الرسم البياني - يستخرج الأول عددًا صغيرًا من المعلمات التي يمكن أن تلتقط بعض خصائص الرسم البياني الحقيقي المعين وتولد الرسم البياني التركيبي مع المعلمات ، أما الأخير فيرفع المقاييس a إعطاء رسم بياني حقيقي لرسم بياني أكبر وذلك للحفاظ على خصائص الرسم البياني الحقيقي الأصلي قدر الإمكان.

تقوم الخطوة الثانية بتحميل الرسم البياني المخزن في الذاكرة الرئيسية لمحرك معالجة الرسم البياني ، مثل Apache GraphX ​​، وتنفذ خوارزمية رسم بياني معينة على المحرك. قال كايست: "نظرًا لأن الرسم البياني أكبر من أن يتناسب مع الذاكرة الرئيسية لجهاز كمبيوتر واحد ، فإن محرك الرسم البياني يعمل عادةً على مجموعة من عدة عشرات أو مئات من أجهزة الكمبيوتر ، وبالتالي فإن تكلفة النهج التقليدي المكون من خطوتين مرتفعة . "

لا يقوم الفريق الكوري بإنشاء وتخزين رسم بياني اصطناعي واسع النطاق.

بدلاً من ذلك ، يقوم بتحميل الرسم البياني الحقيقي الصغير الأولي في الذاكرة الرئيسية. بعد ذلك ، باستخدام تقنية يطلق عليها T-GPS (محاكاة معالجة الرسم البياني بمقياس تريليون) ، واجهت خوارزمية الرسم البياني الرسم البياني الحقيقي الصغير كما لو كان الرسم البياني التركيبي الواسع النطاق الذي يجب إنشاؤه من الرسم البياني الحقيقي موجودًا في الذاكرة الرئيسية ، كما قال كايست ، مضيفًا أنه بعد الانتهاء من الخوارزمية ، يُرجع T-GPS نفس النتيجة مثل النهج التقليدي المكون من خطوتين.

"الفكرة الأساسية لـ T-GPS هي إنشاء جزء فقط من الرسم البياني التركيبي الذي تحتاجه الخوارزمية للوصول إليه سريعًا وتعديل محرك معالجة الرسم البياني للتعرف على الجزء الذي تم إنشاؤه أثناء الطيران كجزء من الرسم البياني التركيبي الذي تم إنشاؤه بالفعل ، قال كايست.

عالج T-GPS رسمًا بيانيًا من تريليون حافة على جهاز كمبيوتر واحد ، بينما احتاج النهج التقليدي المكون من خطوتين إلى مجموعة من 43 جهاز كمبيوتر من نفس المواصفات لمعالجة رسم بياني بمليار حافة. لا تحتاج إلى الوصول إلى الشبكة ، كان T-GPS أسرع بما يصل إلى XNUMX مرة من النهج التقليدي الذي يحتوي على قدر كبير من الاتصالات.

تم تقديم العمل في مؤتمر IEEE ICDE 2021 باعتباره "محاكاة معالجة الرسوم البيانية بمقياس تريليون استنادًا إلى رفع مستوى الرسم البياني من أعلى إلى أسفل".