<<

مقابلة مع المستشار: نحو منصة حوسبة فائقة السرعة للجميع—ThinkX وجامعة توهوكو تتخيلان الحوسبة الفائقة باستخدام الذكاء الاصطناعي وFPGA: مقابلة مع الأستاذ ماسانوري هارياما

19 فبراير 2025

ماسانوري هارياما، أستاذ أنظمة التكامل الذكي، كلية الدراسات العليا لعلوم المعلومات، جامعة توهوكو

في هذه المرة، تحدثنا مع الأستاذ ماسانوري هارياما من مجال الأنظمة المتكاملة الذكية في جامعة توهوكو، وهو خبير رائد في أبحاث التطبيقات لأشباه الموصلات FPGA (مصفوفة البوابات القابلة للبرمجة الميدانية)، وهي نوع من الدوائر المتكاملة للحوسبة الفائقة، ومستشار لـThinkX.
كازوكي أوتسوكا (المشار إليه فيما بعد بـ أوتسوكا) اليوم، نتحدث مع البروفيسور ماسانوري هارياما من جامعة توهوكو، وهو متعاون ومستشار في مشروع ThinkX 'نظام المسرّع الديناميكي*1 لتحليل البيانات الضخمة في الوقت الحقيقي في الأبحاث المتقدمة'—أو، بمعنى أبسط، 'حاسوب فائق مدعوم بالذكاء الاصطناعي وأشباه موصلات متخصصة'.

يتم تطوير هذا المشروع كوظيفة رئيسية لسحابة VN Machine Cloud، وهي منصة حوسبة للأبحاث المتقدمة. الهدف هو جعل معالجة البيانات المعقدة متاحة للجميع. فكر في مهام مثل التعامل مع تدفقات الصور اللامتناهية من التلسكوبات العملاقة (تخيل تيرابايت من بيانات النجوم)، التحليل في الوقت الحقيقي للكيمياء الكمية وتسلسل الحمض النووي. حاليًا، يقوم الخبراء ببناء هذه الحلول حسب الطلب، لكن هدفنا هو فتح هذا الباب على مصراعيه. تخيل باحثين بدون خبرة في الحوسبة ينهون حسابات تستغرق ستة أشهر في ثلاثة أيام فقط أو يقللون تكاليف الكهرباء إلى النصف. نعتقد أن هذا الحل يحمل قيمة خاصة للتحديات واسعة النطاق وعابرة للتخصصات مثل نمذجة المناخ أو الطاقة المستدامة.
للبدء، أستاذ هارياما، هل يمكنك أن تخبرنا عن مجال خبرتك ومشاريعك الأخيرة؟
البروفيسور ماسانوري هارياما (المشار إليه فيما بعد بـ هارياما) تخصصي هو الحواسيب الفائقة المخصصة للتطبيقات باستخدام FPGA. FPGA تعني Field-Programmable Gate Arrays. إنه نوع من أشباه الموصلات التي يمكن إعادة برمجتها بعد التصنيع عن طريق تغيير دوائرها أو وظائفها الحسابية من خلال البرمجة. هذه المرونة تجعلها مفيدة عندما تحتاج، على سبيل المثال، إلى تسريع عمليات معينة أو تقليل استهلاك الطاقة. علاوة على ذلك، من خلال تغيير البرنامج، يمكن لـFPGA التكيف مع تطبيقات متنوعة، مما يسمح بإنتاج كميات كبيرة من نوع واحد من الرقائق، مما يقلل تكاليف التصنيع بشكل كبير.
من أمثلة تطويراتنا حلول للتلدين الكمي، محاكاة الحواسيب الكمية القائمة على البوابات، معالجة اللغة الطبيعية، وأجهزة تسلسل الحمض النووي.
على الرغم من أن FPGA تقدم هذه المزايا، إلا أن تصميم الدوائر المُحسّنة لتطبيقات معينة ليس دائمًا سهلاً، على عكس وحدات المعالجة المركزية أو وحدات معالجة الرسوميات العامة.
معالجة في الوقت الحقيقي لخوارزمية الترميز/فك الترميز H.266 على ملفات فيديو كبيرة. (الصورة مقدمة من: مختبر هارياما)

معالجة في الوقت الحقيقي لخوارزمية الترميز/فك الترميز H.266 على ملفات فيديو كبيرة. (الصورة مقدمة من: مختبر هارياما)

أوتسوكا تكنولوجيا FPGA قد تقدمت كثيرًا، أليس كذلك؟ تم الاستحواذ على Xilinx في عام 2012، وAltera في عام 2022. نهجنا يجمع بين FPGA ونماذج اللغة واسعة النطاق—أي الذكاء الاصطناعي—لاكتشاف أنماط حوسبة موحدة. بدلاً من كتابة كل شيء بلغات مفصلة مثل OpenCL أو C++، نحن نصمم لغة ذات مستوى أعلى. الفكرة هي أتمتة العملية بحيث يكتشف النظام بنفسه الطريقة الصحيحة لتطبيق الحسابات. هل يمكنك شرح كيف يعمل ذلك مع FPGA بالتفصيل؟
هارياما تحسين الحوسبة في FPGA يتلخص في نمطين رئيسيين: التفرع المكاني والتدفق (pipelining). التفرع المكاني يشبه وجود عدة عمال يقومون بنفس المهمة في وقت واحد—عدة وحدات تنفذ نفس المهمة على بيانات مختلفة في نفس الوقت. أما التدفق فهو مثل خط التجميع في المصنع: يمرر عامل واحد النتائج إلى التالي، كل منهما يتعامل مع مهمة مختلفة، مما يسمح بتنفيذ عدة مهام بالتوازي. في الممارسة، نجمع بين هذين لخلق أنماط معمارية مفيدة. على سبيل المثال، قد نستخدم التفرع المكاني في مرحلة معينة من التدفق أو نداخل التدفقات ضمن التفرع المكاني. المفتاح هو إيجاد التركيبة المثلى لهذه الأنماط لمهمة معينة.

في التصميم الفعلي، نقسم العملية بأكملها إلى مهام ونقرر أيها مناسب أكثر للمعالجات المركزية أو وحدات معالجة الرسوميات أو FPGA. لذلك، نحلل توازي كل مهمة، ومدى قابليتها للتوازي، ومدى اعتماد خطوة على أخرى. من خلال الخبرة، اكتشفنا أن أنماط معالجة المهام تنقسم إلى فئات قليلة. نبدأ بقوالب معمارية تعتمد على هذه الأنماط—مثل المخططات—ونعدلها من هناك.
التوسع لمجموعات بيانات كبيرة عن طريق ربط الرقائق معًا. (الصورة مقدمة من: مختبر هارياما)

التوسع لمجموعات بيانات كبيرة عن طريق ربط الرقائق معًا. (الصورة مقدمة من: مختبر هارياما)

أوتسوكا إذن، حتى لو كانت الأنماط موحدة إلى حد ما، لا تزال هناك حاجة لتعديلها لمهام معينة، صحيح؟ ما هي العوائق التي تجعل هذا التعديل أكثر سلاسة؟
هارياما يعتمد ذلك على القيود مثل كمية البيانات الواردة في وقت واحد وسرعة المعالجة المطلوبة. نحن نبرمج النظام لينظر إلى البيانات الواردة ويقرر: 'بالنسبة لهذا العبء، حسّن بهذه الطريقة'. إذا كان تدفق البيانات ثقيلًا، نعمق التدفق؛ إذا كان واسع النطاق، نزيد الوحدات المكانية. مع وجود منطق كافٍ مدمج، يمكن للنظام أن يتكيف ويعدل تلقائيًا. قد تستغرق تركيب دوائر FPGA من برنامج بلغة C حوالي 10 ساعات في بعض الحالات. لتقليل وقت الترجمة هذا، نتعاون مع Altera Japan، مدمجين إعادة التهيئة الجزئية في OneAPI*2 ونقدم مساهمات تقنية لتبسيط تصميم FPGA.
مقارنة الأداء مع وحدات GPU. ربط عدة FPGA يؤدي إلى تحسينات خطية في الأداء، متجاوزًا قدرات GPU باستخدام وحدتين فقط. (الصورة مقدمة من: مختبر هارياما)

مقارنة الأداء مع وحدات GPU. ربط عدة FPGA يؤدي إلى تحسينات خطية في الأداء، متجاوزًا قدرات GPU باستخدام وحدتين فقط. (الصورة مقدمة من: مختبر هارياما)

أوتسوكا شيء آخر أعتقد أنه يستحق الذكر هو قابلية التوسع في ربط FPGA. ربط عدة رقائق يجعلها تعمل كدائرة عملاقة واحدة، أليس كذلك؟ في إعدادنا السحابي، هذا يعني أننا نوفر مثيلات حوسبة حيث يمكن للمستخدمين الاستفادة من هذه الوظيفة عبر وحدات متعددة. ما التطورات التي تتوقعها؟
هارياما إحدى نقاط قوة FPGA هي سهولة التوسع—ما عليك سوى ربطها بكابلات وضبط الإعداد. هذا ليس معروفًا على نطاق واسع. على سبيل المثال، بالنسبة لهياكل الرسوم البيانية الضخمة، أو الحسابات المصفوفية الهائلة لنماذج المناخ (فكر في شبكات 10,000 × 10,000)، أو الحسابات ذات الدقة الرباعية للكيمياء الكمية التي تتعامل مع أرقام من تريليونات إلى تريليون، تبطئ المعالجات المركزية ووحدات معالجة الرسوميات مع زيادة حجم المشكلة. لكن مع FPGA، ربط عدة وحدات بكابلات يجعلها تعمل كرقاقة عملاقة واحدة. إنه شبه سلس، والسرعة لا تنخفض مع زيادة الحجم. بالنسبة للحوسبة العلمية أو المهام المتخصصة، هذا ثوري.
أوتسوكا بالفعل. أستاذ هارياما، شكرًا على هذا الحديث القيم. نتطلع إلى التعاون المستمر.
*1 المسرّع الديناميكي: تقنية تعيد تهيئة تكوينات المعالج ديناميكيًا بناءً على احتياجات الحوسبة، مما يحسن السرعة وكفاءة الطاقة.
*2 OneAPI: لغة مفتوحة لبرمجة الأجهزة طورتها إنتل.
ماسانوري هارياما
دكتوراه في علوم المعلومات. أستاذ في كلية الدراسات العليا لعلوم المعلومات، أنظمة التكامل الذكي، جامعة توهوكو. خبير رائد في اليابان في الحوسبة الفائقة المخصصة للتطبيقات باستخدام FPGA (مصفوفة البوابات القابلة للبرمجة الميدانية).