شهد يوم الرابع من أكتوبر الجاري ليلة سقوط شركة فيسبوك، فمنذُ السادسة ليلًا حتى الواحدة صباحًا تبخر كل ما يتعلق بالشركة حيث لم يكن من الممكن الوصول إلى أي من منصتي فيسبوك أو إنستجرام، بالإضافة إلى أن واتس أب ومسنجر كلاهما كانا خارج الخدمة عالميًا. هذا الحدث المُربك ترك المليارات من مستخدمي الإنترنت دون أي شبكات تواصل اجتماعي، صحيح كانت هناك بدائل لكنها تعرضت هي الأخرى للسقوط والضغط الشديد نتيجة نزوح الملايين إليها بشكل لم يكن متوقعًا. باختصار، توقف خدمات فيسبوك لهذه المدة الطويلة رجعنا بالزمن لعصر البريد الالكتروني!
وطوال قرابة 6 ساعات من الانتظار لم تخرج فيسبوك لتخبرنا بأية معلومات عن السبب أو حتى كيفية التعامل مع هذه المشكلة. ولكن يبدو أن فيسبوك وكل خدماته عادت للعمل بصورة طبيعية كما المعتاد، إلا أن ذلك لا يمنع الناس عن التساؤل عن الأسباب، خاصًة في ظل الشائعات المتداولة بأن السبب هو هجوم الكتروني عنيف على المنصة، وهناك من يقول هاكر صيني يبلغ من العمر 13 عامًا هو السبب فيما حدث وخزعبلات لا تمس الواقع بصلة. لذا تابع القراءة لمعرفة ماذا حدث بالضبط.
ما الذي حدث ؟
بدايةً كان لهذا العطل تأثير على خدمات فيسبوك الداخلية أي أنّ المشكلة لم تقتصر على التطبيقات والخدمات وانما على جميع أدوات فيسبوك ومعدات عمل الشركة الداخلية توقفت أيضًا وهذا ما لعب دوراً رئيسيًا في تأخر عودة الخدمة للعمل.
السبب الرئيسي للعطل حسب ما صرح به فريق المهندسين المشرف على عمل موقع "فيسبوك" في بيان تم نشره على موقع مهندسي الشركة انه كان نتيجة خطأ في تغييرات الإعدادات الخاصة بأنظمة التوجيه الأساسية. ولأن البيان لم يوضح بالضبط ما حدث، قامت مصادر موثوقة برصد الأسباب بشكل أكثر تفصيلًا وملخصه كالآتي:
في حوالي الساعة 11:40 صباحًا بالتوقيت الشرقي قام أحد موظفي فيسبوك بتحديث موزع الـ BGP ويقصد به "سجلات بروتوكولات التوجيه الحدودية - Border Gateway Protocol" فهو نظام يتحكم في سير البيانات وتوجيهها إلى الطريق المناسب بينما تنتقل من جهازك او هاتفك وحتى الوصول إلى خوادم المواقع المختلفة. ولكي تُدرك أهميته عليك أولا ان تعرف عن مصطلح آخر وهو الـ DNS أو نظام أسماء النطاقات.
بعبارات بسيطة، الـ DNS يشبه دفتر الأرقام أو دليل الهاتف، فإذا اردت ان تتصل بجهة معينة، ستبحث عنها في هذا الدليل حتى تعثر عليها وتحصل على رقم الهاتف لإجراء الاتصال. نظام أسماء النطاقات يفعل الشيء نفسه، حيث يقوم بحفظ أسماء المواقع على هيئة عناوين بروتوكول الإنترنت IP، بحيث عندما تكتب اسم الموقع في المتصفح، يتم الاستعلام عنه في نظام DNS ثم الحصول على الـ IP المقترن باسم هذا الموقع ويتم الاتصال به.
وبالتالي إذا حدث أي خلل في نظام الـ DNS نتيجة تحديثات تجريها المواقع الكبرى أو مزودي خدمة الانترنت أو مزودي نطاقات المواقع، سيؤدي على الفور إلى انهيار حركة المرور على شبكة الانترنت. حدث ذلك كثيرًا من قبل ووارد حدوثه في أي لحظة لأن من يقوم بهذه التحديثات هم بشر معرضون للوقوع بالأخطاء مهم بلغت مهارتهم. ولكن هذه المرة، مع انقطاع كل خدمات فيسبوك لأكثر من 6 ساعات، المشكلة كانت أكثر تعقيدًا.
وبحسب قول Doug Madory، مدير تحليل الإنترنت في شركة كنتك - Kentik لمراقبة الشبكة، إن فيسبوك قامت بإجراء تحديث روتيني على ما يبدو صباح يوم الاثنين في معلومات توجيه الشبكة او نظام BGP، ولكن حدث ذلك بشكل خاطئ حيث تم سحب السجلات الرقمية الأساسية لبروتوكولات التوجيه الحدودية BGP التي تحتوي على عناوين IP الخاصة بأسماء النطاقات للشبكة DNS. أي ان المشكلة تكمن في اختفاء السجلات المسؤولة عن توجيه الأجهزة إلى موقع فيسبوك على الشبكة. عنوان URL الخاص بالفيسبوك أو أي خدمة مرتبطة به لا يتم التعرف عليه لأنه غير مرتبط بأي خادم محدد — باختصار، فيسبوك اختفى من على الشبكة حرفيًا كان لم يكن له وجود من قبل! والحل هو تحميل سجلات BGP جديدة إلى شبكة الإنترنت والتأكد من انها صحيحة وأن الجميع يستطيع رؤيتها.
من الأسهل قول ذلك عن القيام به فعلًا، ولكن هل يستحق فعلًا انقطاع تام لمدة 6 ساعات كاملة ؟! الإجابة لا ولكن كون فيسبوك اختفى من الشبكة فذلك أدى إلى تفاقم المشكلة أكثر لدى موظفي فيسبوك ذاتهم.
وفقًا لتصريحات موظفين من داخل الشركة لموقع The Verge فإن أدوات فيسبوك الداخلية التي يتم استخدامها للعمل والتواصل فيما بينهم تأثرت بالعطل أيضًا مما يعني أن مهندسو فيسبوك المكلفين بالتعامل مع المشكلة عليهم زيارة مركز بيانات الشركة في كاليفورنيا شخصيًا والعمل على حلها من الداخل. ومع ذلك، فالمشكلة كانت تتجاوز قدرتهم المعرفية وكان عليهم انتظار وصول خبراء لديهم القدرة على حلها. هنا تظهر مشكلة أخرى: الدخول إلى مباني الشركة يتطلب كروت دخول خاصة، بما ان «السيستم واقع!» كان على موظفو الشركة إيجاد بديل آخر يمكنهم من الوصول إلى خوادم الشركة وحل المشكلة. هذا هو السبب المنطقي لاستمرار الانقطاع لمدة 6 ساعات.
ما الدليل على أنّ السبب ليس هجوم الكتروني؟
نشر موقع Ars Technica المتخصص بالتقنية، أن أحد مستخدمي خدمة "ريديت" (Reddit) للتواصل الاجتماعي - والذي يدعي أنه موظف في فيسبوك - يَفترض أن مهندسي شبكات كانوا يدفعون نحو تغييرات في الإعدادات والتي تسببت بطريق الخطأ بقفل النظام، وفي هذه الحالة فإن تقني مركز البيانات المحليين والذي يملكون وصولًا فعليا للراوترز (الموزعات) هم الوحيدون الذي يملكون القدرة على إصلاح الخلل. ويؤكد هذا الشخص أن العطل ليس نتيجة هجوم إلكتروني ما.
وبالتالي فلا صحة للشائعات المتداولة بأن السبب هجوم الكتروني، أو مقابلة Frances Haugen عالمة البيانات السابقة بفيسبوك، مع البرنامج الحواري الشهير 60Minutes أو بسبب هاكر صيني يبلغ من العمر 13 عامًا أراد العبث ببيانات المستخدمين 🙄
توضيح: قد يستخف بعض المستخدمين بهذا السبب ولكن بالفعل إعادة توثيق خوادم DNS يحتاج إلى فترة زمنية طويلة وهذا ما حدث مع شركة فيسبوك والجدير بالذكر أيضًا أنّ فيسبوك واجهة هذه المشكلة من قبل في عام 2019 ودام الانقطاع وقتها لمدة 14 ساعة وصرحت وقتها بان السبب يعود لإعادة توثيق خوادم DNS. وبمعزل عن ذلك، الأكيد أن إمبراطورية فيسبوك قد خسرت كثيرًا، واهتزت الثقة بها كما لاحظ المليارات أمس، ويمكن القول أن بديل فيسبوك باتت ظروف ولادته ممكنة!