كل شيء عن DeepSeek: بوت الذكاء الاصطناعي الذي يشعل الجدل !

يمكن القـول إن سبـاق الـذكاء الاصـطناعي العـالمي قـد دخـل فـي مـرحـلة تـوصف بـ «الحـرب البــاردة» مع إطـلاق النموذج الصـيني "ديب سيك" DeepSeek في وقت مبكر من هذا الشهر، والذي أحدث هزة غير مسبوقة في أسهم شركات التكنولوجيا العالمية ووجه تهديدًا صريحًا للهيمنة الأمريكية التي تمثلها شركات مثل Meta و OpenAI وسواها في المجال. تجاوز تطبيق DeepSeek سريعًا منافسه ChatGPT ليصبح التطبيق الأكثر تنزيلًا عالميًا على كلًا من App Store و Play Store خلال أيام قليلة من طرحه للهواتف.

ورغم تشابه آلية استخدامه مع أحدث النماذج المطورة غربيًا، إلا أنه يحقق طفرة نوعية في كفاءة التشغيل والتطوير، إذ تؤكد الشركة المطورة، التي تحمل الاسم نفسه، أن نموذجها يتم تدريبه بتكاليف أقل وبعدد شرائح أقل بكثير مقارنةً بالنماذج الرائدة الغربية. الأهم من ذلك، أنه مفتوح المصدر، مما يتيح له انتشارًا أوسع وأسرع. إذًا، دعونا نستهل السطور التالية لنتعرف بشكل أعمق على بوت DeepSeek وما الذي يجعله مخيفًا للحد الذي أدى لخسارة أسواق التقنية الأمريكية أكثر من نصف تريليون دولار!

نموذج الذكاء الاصطناعي DeepSeek

ما هو بوت DeepSeek أصلًا ؟

بوت ذكاء اصطناعي تم تطويره بواسطة شركة ناشئة صينية تحمل اسم "DeepSeek AI" تأسست عام 2023 على يد "ليانج وينفنج"، رئيس صندوق التحوط الكمي المدعوم بالذكاء الاصطناعي والمعروف باسم High-Flyer. ومثل روبوتات الدردشة التقليدية: تقوم بكتابة الاستفسار أو الطلب، ليقوم بتوليد إجابة نصية، بأداء يوازي نماذج الذكاء الاصطناعي الأحدث وبشكل مجاني تمامًا.

ظهر هذا البوت لأول مرة في أواخر ديسمبر 2024 حيث أعلنت الشركة عن طرحه مع الكشف عن النموذج الأساسي الذي يعتمد عليه، والمعروف باسم "DeepSeek-V3" ليكون من أقوى النماذج مفتوحة المصدر في العالم، إذ يحتوي على 671 مليار متغير، متجاوزًا أكبر نموذج مفتوح المصدر لشركة Meta، الذي يضم 405 مليارات متغير، بفارق يبلغ حوالي 1.6 ضعف. والمتغيرات (Parameters) تُستخدم كمقياس لتحديد حجم المهارات والقدرات الخاصة بنماذج الذكاء الاصطناعي، وتعكس هذه الأرقام مدى تطور النموذج وقدرته على أداء مجموعة متنوعة من المهام، مثل كتابة الأكواد البرمجية، والترجمة، وإنشاء النصوص، إضافة إلى ميزة "التفكير المنطقي" قبل تقديم الإجابات.

ووفقًا لاختبارات الأداء (Benchmarks) فقد أثبت DeepSeek-V3 تفرده أمام نماذج رائدة مثل Llama 3.1 من ميتا و GPT-4 من OpenAI و Claude 3.5 من Anthropic. كما تشير الورقة البحثية التي أصدرتها الشركة المطورة إلى أن النموذج تم تدريبه باستخدام قاعدة بيانات ضخمة تضم 14.8 تريليون Token، وهو مقياس يعادل مليون منه حوالي 750 ألف كلمة، مما يعكس قدرته على التعامل مع كميات هائلة من البيانات النصية.

الميزة الأبرز في هذا النموذج هي كونه مفتوح المصدر بموجب رخصة MIT، مما يمنح الجميع حرية استخدامه وتعديله وتطويره. وعلى عكس ChatGPT المُغلق الذي يقتصر تشغيله على خوادم OpenAI الخاصة، يمكن تشغيل DeepSeek محليًا على أجهزة الكمبيوتر. إذ يتوفر نموذج DeepSeek-V3 للتنزيل عبر منصتي GitHub و HuggingFace، بالإضافة إلى إمكانية الاستفادة من قدراته من خلال واجهة برمجية (API) توفرها الشركة بأسعار تنافسية أقل بكثير من تلك الخاصة بنماذج OpenAI.

رغم كل ذلك، لم ينجح نموذج DeepSeek-V3 في إثارة ضجة كافية لجذب انتباه العالم، لكن يمكن القول أن البداية الحقيقية للإثارة كانت في 20 يناير الماضي، حين كشفت الشركة الصينية عن نموذجها الأكثر تطورًا "R1"، مدعيةً أنه يضاهي نماذج التفكير المنطقي الرائدة مثل "o1" من شركة OpenAI وهي النماذج التي تعتمد على التفكير والتحليل والمقارنة قبل توليد الإجابات. النموذج الجديد مبني على إصدار "V3" وقد أظهرت المؤشرات القياسية المتخصصة في تقييم الذكاء الاصطناعي أن نموذج DeepSeek-R1 حقق بالفعل أداءً قريبًا من أداء OpenAI-o1 في عدة معايير بفضل مهاراته الاستدلالية باستخدام التعلم المعزز (Reinforcement Learning) دون الاعتماد على أمثلة بشرية.

لكن لم تكن قدرات هذا النموذج تحديدًا هي المفاجأة الكبرى، خاصةً أن شركات مثل "جوجل" تتفوق على OpenAI في تطوير نماذج التفكير الخاصة بها. بل إن شركة OpenAI نفسها أعلنت عن نموذج "o3"، الذي يتفوق على "o1" من حيث الأداء. أما المفاجأة الحقيقية التي أحدثها نموذج DeepSeek، فتكمن في كفاءته الاستثنائية في عمليات التطوير والتشغيل، دعونا نوضح أكثر فيما يلي.

لماذا DeepSeek يمثل إنجاز تقني ؟

عندما كشفت الشركة الصينية الناشئة DeepSeek AI عن نموذجها الجديد "DeepSeek-V3"، أعلنت عن تبنيها لأساليب تدريب مبتكرة تعتمد على تقنيات لا تحتاج إلى قوة معالجة حاسوبية ضخمة مثل MoE (اختصارًا لـ Mixture-of-Experts) والتي تسمح بتفعيل جزء من المتغيرات فقط لكل إدخال نصي، مما يقلل من استهلاك الموارد مع الحفاظ على السرعة في توليد الإجابات. بالإضافة إلى تقنية "التقطير" (Distillation) التي تسمح باستخدام نموذج كبير لتدريب نموذج أصغر بفعالية وكفاءة، وهو ما حدث مع نموذج DeepSeek-R1 الذي طورت منه الشركة 6 نماذج أصغر بقدرات متفاوتة يتم استخدامها حسب الحاجة، مما يساعد في تقليل التكاليف والموارد المطلوبة أيضًا.

كما قامت الشركة بإجراء تحسينات هندسية عميقة تركز بشكل أساسي على خفض تكلفة تطوير النموذج بشكل كبير، وتقليل متطلبات قدرات المعالجة وعدد بطاقات الرسوميات مقارنة بالمنافسين الغربيين. للتوضيح، استغرق تدريب نموذج DeepSeek-V3 حوالي 2.788 مليون ساعة تدريب باستخدام نحو 2000 بطاقة رسومية من طراز Nvidia H800 بتكلفة تُقدَّر بـ 5.6 ملايين دولار. في المقابل، تحتاج النماذج الرائدة من OpenAI أكثر من 16,000 بطاقة رسومية من Nvidia بتكلفة تتجاوز 100 مليون دولار.

المثير للاهتمام أن العقوبات الأميركية تحظر تصدير شرائح المعالجة الرسومية الرائدة من إنفيديا إلى الشركات الصينية، وتسمح فقط ببيع الشرائح الأقل من حيث الإمكانيات بفارق ملحوظ في الأداء. ورغم ذلك، تمكنت شركة DeepSeek من استغلال شرائح H800 بأقصى كفاءة ممكنة لسد هذه الفجوة بمساعدة تقنيات مبتكرة تقلل من استهلاك الطاقة، وتعزز كفاءة العمليات الحسابية، الأمر الذي ساهم بشكل كبير في خفض التكاليف لدرجة أثارت تساؤلات عديدة حول المبالغ الهائلة التي أنفقت – والتي بلغت عشرات المليارات – لتطوير نماذج الذكاء الاصطناعي الغربية.

في الواقع، سعت شركة Meta جاهدة لمجاراة النجاح السريع الذي حققه نموذج DeepSeek، حيث قامت بتشكيل أربع "غرف حرب". اختصت اثنتان منها بتحليل التكلفة الفعلية التي تحملتها الشركة الصينية لتدريب نموذجها الرائد، بينما ركزت غرفة أخرى على استكشاف نوعية البيانات المستخدمة في تدريب هذا النموذج الذي حقق أداءً مذهلاً، بحسب تقرير لموقع The Information.

ويتزامن هذا التقدم في صناعة الذكاء الاصطناعي مع ضخ الشركات الامريكية – من بينها إنفيديا ومايكروسوفت و OpenAI وميتا –استثمارات بمليارات الدولارات في مراكز بيانات الذكاء الاصطناعي. ففي إطار مشروع "Stargate" الذي أعلنه ترامب مؤخرًا بقيمة إجمالية تبلغ 500 مليار دولار، خُصص منه 100 مليار دولار لإنفيديا وحدها. لذا، فقد أدت النجاحات اللافتة التي حققتها DeepSeek إلى دفع المحللين والمستثمرين لمراجعة مدى ضرورة وفائدة هذه الاستثمارات الهائلة. الأمر كان كافيًا ليلقي بظلال من الشك على ريادة أمريكا في مجال الذكاء الاصطناعي وحدوث تحركات عنيفة في سوق الأسهم الأمريكي.

تأثير صعود DeepSeek على «وادي السيليكون»

من الواضح أن شركة DeepSeek AI أثارت اهتمام العالم من خلال بناء نموذج ذكاء اصطناعي مجاريًا لأحدث النماذج الرائدة عالميًا، رغم محدودية مواردها المالية وقيود التصدير الأمريكية. هذا النجاح السريع للمنصة الصينية ترك بصمته على السوق، حيث سجلت أسهم الشركات المصنعة لشرائح المعالجة، وعلى رأسها "Nvidia"، تراجعًا حادًا يُعتبر الأعنف في تاريخ أسواق الأسهم الأمريكية. كانت Nvidia رائدة في دفع طفرة أسهم الذكاء الاصطناعي العالمية بفضل شرائحها المتطورة، والتي تعد عنصرًا أساسيًا لهذه التكنولوجيا. لكن ومع صعود DeepSeek، برزت توقعات بانخفاض كبير في الطلب على هذه الشرائح، مما أدى إلى خسارة Nvidia لأكثر من 500 مليار دولار من قيمتها السوقية في فترة وجيزة.

إضافة إلى ذلك، أثارت مخاوف بشأن التوجه الجديد لـ DeepSeek انخفاضًا في أسهم شركات تقنية أخرى، حيث تراجعت أسهم مايكروسوفت بنسبة 6%، وأسهم ألفابت (الشركة الأم لجوجل) بنحو 3%، وميتا بنسبة 4.6%، وAMD بنسبة 5.3%. كما تكبدت شركة ASML الهولندية خسارة كبيرة بلغت 9% من قيمة سهمها، نظرًا لكونها الشركة الوحيدة في العالم التي تنتج آلات تصنيع الشرائح عالية الأداء والدقة المستخدمة في خوادم الذكاء الاصطناعي.

بشكل عام، ظهور DeepSeek أثار موجة من الجدل في الأوساط التقنية والاستثمارية، حيث أدى إلى إعادة تقييم استثمارات الشركات الكبرى في الذكاء الاصطناعي. هذا التحول سوف يدفع بالشركات إلى تبني استراتيجيات تركز على تحسين الكفاءة وتقليل التكاليف، مستلهمة النهج الصيني الذي مثّل نقلة نوعية في هذا المجال. وهذا ما أكده ترامب الذي أشار أن النموذج الصيني يُعد تطورًا إيجابيًا من ناحية التكلفة، قائلًا: "بدلًا من إنفاق مليارات الدولارات، يمكننا تقليل الإنفاق والوصول إلى النتائج نفسها، وربما نتائج أفضل".

كيفية استخدام DeepSeek

حظى النموذج الصيني باستحسان العديد من المستخدمين كونه يوفر خدماته بشكل مجاني تمامًا في الوقت الحالي، في حين تبلغ تكلفة الاشتراك في ChatGPT، وتحديدًا في خطة ChatGPT Pro، نحو 200 دولار شهريًا. وعن آلية الاستخدام فإنها لا تختلف كثيرًا عن الروبوتات التقليدية، كما أشرنا سلفًا. إذ يمكن الوصول إلى DeepSeek من خلال نسخة الويب على أجهزة الكمبيوتر، أو من خلال تطبيق للهواتف الذكية سواء أندرويد أو آيفون. وفي حين يمكن استخدام النموذج دون الحاجة إلى إنشاء حساب من خلال نسخة الويب، يتوجب على المستخدم إنشاء حساب خاص به عبر تطبيق الهواتف الذكية. يدعم النموذج كل اللغات تقريبًا، بما في ذلك العربية.

النموذج يتميز بواجهة استخدام بسيطة ومألوفة تسهل على المستخدم التفاعل معها وفهم أدوات التحكم، خاصة إذا كان لديه تجربة سابقة مع بوتات الذكاء الاصطناعي. تتضمن الواجهة مربع كتابة بيضاوي الحواف يحتوي على أيقونة "الإدراج"، والتي تتيح للمستخدم عند الضغط عليها إضافة مستندات مثل النصوص والصور المخزنة على الجهاز أو التي يتم التقاطها مباشرة عبر الكاميرا. مع ذلك، فإن الوظائف المتوفرة حالياً لهذه الميزة تقتصر على استخراج النصوص من الصور، دون إمكانية طرح أسئلة أو استفسارات حول المحتوى البصري. هذا يختلف عن بعض المنصات الذكية الأخرى مثل ChatGPT و"جيميناي"، التي توفر ميزات أكثر تطوراً لتحليل الصور.

ويتيح النموذج ميزة البحث المباشر على الإنترنت، والمعروفة باسم Search، حيث تمكّن DeepSeek من تصفح الويب للعثور على المعلومات المطلوبة أو للإجابة على استفسارات المستخدمين، مع توفير قائمة بالمصادر التي استندت إليها الإجابات. يشبه أسلوب نموذج DeepSeek في عرض هذه المصادر الطريقة التي يعتمدها ChatGPT، حيث تظهر المصادر على شكل قائمة عمودية في الجانب الأيمن من الشاشة عند استخدام البوت عبر نسخة الويب.

بالإضافة إلى ذلك، يوفر النموذج ميزة مبتكرة تُدعى DeepThink (التفكير العميق)، والتي تسمح لـ DeepSeek بعرض طريقة تفكير نموذجه الذكي R1 عند تحليل وإدراك السؤال الذي يطرحه المستخدم قبل تقديم إجابة عليه بشكل واضح ومفصل.

تضيف هذه الخاصية عنصرًا من الإثارة إلى تجربة التفاعل مع الذكاء الاصطناعي، حيث تسعى المنصة الصينية إلى إضفاء لمسة مبتكرة على أسلوب عرض آلية تفكير النموذج أمام المستخدم. على سبيل المثال، يعتمد النموذج أحيانًا على أسلوب يعكس عملية التفكير وكأنه يحاكي العقل البشري في تفسير البيانات المتوفرة لديه، فيظهر وكأنه "يفكر"، ثم "يتوقف"، ثم يعيد النظر في المعطيات ليقدم استنتاجًا جديدًا. يتم التعبير عن هذه الخطوات بشكل نصي، وبذلك يحصل المستخدم على تجربة أكثر تفاعلية، بدلاً من الاكتفاء بالحصول على إجابات مباشرة لاستفساراته كما يحدث في النماذج الأخرى.

عيوب ومشاكل DeepSeek الحالية

رغم تطور قدراته التقنية، إلا أن نموذج DeepSeek يواجه بعض المشاكل الغريبة، فقد أظهرت بعض الردود إشارات إلى وجود تأثير حكومي من "بكين" على عملية تدريب النموذج. على سبيل المثال، عند طرح أسئلة تتعلق بقضايا حساسة مثل مظاهرات ميدان تيانانمين الشهيرة التي اندلعت عام 1989 ضد الحزب الشيوعي الحاكم، يرفض النموذج الإجابة مباشرة ويقدم ردًا موحدًا: "أعتذر عن إجابة هذا السؤال، أنا مجرد مساعد ذكاء اصطناعي، متخصص في تقديم ردود مساعدة وغير ضارة." يُعزى هذا النهج إلى ضرورة خضوع جميع الشركات الصينية المطورة لأنظمة الذكاء الاصطناعي لرقابة هيئة حكومية متخصصة بتنظيم الإنترنت، لضمان توافق أداء النماذج مع السياسات الحكومية.

أيضًا ما زال يفتقر النموذج إلى العديد من ميزات ChatGPT الفريدة، مثل القدرة على تصميم الصور والقدرات "البصرية" التي تمكّن النموذج من تحليل الصور والإجابة عن أسئلة المستخدم المتعلقة بمحتواها وعناصرها المختلفة. بالإضافة إلى ذلك، يتفوق ChatGPT على DeepSeek في قدراته على التفاعل الصوتي من خلال ميزة Advanced Voice Mode، التي تتيح للمستخدم خوض نقاش صوتي مباشر مع الروبوت الذكي، وكذلك ميزة Share Screen لمشاركة محتوى الشاشة، مع القدرة على طرح أسئلة تتعلق بالمشاهد التي تلتقطها عدسة كاميرا الهاتف الذكي مباشرة من داخل تطبيق ChatGPT.

ولكن مجانية نموذج DeepSeek وما تقدمه من مزايا قد تلبي احتياجات العديد من المستخدمين، لاسيما الذين بحاجة فقط للمساعدة مع النصوص وتصفح الإنترنت بشكل سريع من مكان واحد، مع إمكانية عرض مصادر المعلومات التي تستند إليها المنصة في إجاباتها.

ويذكر أنه وبالتزامن مع إقبال الملايين على تجربة النموذج خلال الأيام الأخيرة، شهدت شركة DeepSeek انقطاعات في موقعها الإلكتروني، مما أدى إلى تعذر دخول المستخدمين إلى المنصة. ويُعد هذا الانقطاع الأطول الذي تواجهه الشركة منذ حوالي 90 يومًا.

ورغم ذلك، لا يمكن إنكار أن النجاح الذي حققته DeepSeek يُبرز أن الصين أصبحت لاعبًا رئيسيًا في مجال الذكاء الاصطناعي، مستفيدة من الكفاءة الهندسية وتكاليف التطوير المنخفضة لإنتاج نماذج ذكية عالية الأداء. بل يؤكد إنجاز DeepSeek أن الشركات الصغيرة قادرة على منافسة العمالقة من خلال خطط استراتيجية محكمة وإدارة فعالة للموارد.

عمومًا، سيترك تداعيات صعود DeepSeek تأثيرات كبيرة على سوق الذكاء الاصطناعي العالمي في المستقبل القريب. إذ يُعتبر أول نموذج ذكاء اصطناعي متقدم يتم تطويره خارج الولايات المتحدة. ومع كونه مفتوح المصدر وقابلًا للتطوير المستمر، قد يتمكن من جذب الانتباه بعيدًا عن النماذج الحالية، مما قد يعيد خلط أوراق المجال ليصبح أكثر تنافسية ولتخسر شركة OpenAI الاهتمام الاستثنائي الذي حظيت به والذي أوصل قيمتها السوقية لـ 157 مليار دولار أمريكي وفقًا لآخر جولة استثمارية.

عالم الكمبيوتر