أوفت OpenAI بوعدها وأزاحت الستار في
حدث Spring Update
الذي تم بثه على يوتيوب عن تحديثٍ هو الأقوى
لنموذج الذكاء الاصطناعي GPT-4 المُستخدم في
بوت الدردشة الشهير ChatGPT
والذي يتمتع بالفعل بإمكانيات تفوق تخيلاتنا. وكان سام ألتمان، وهو المدير
التنفيذي للشركة، قد وصف هذا التحديث في بيان سابق بأنه شيء "حلم به"، غير أنه لم
يكشف عن التفاصيل وقتها، أما اليوم، ومع ظهور
نموذج الذكاء الاصطناعي المحسّن GPT-4o
للنور أخيرًا، أصبحنا نعرف ما الذي كان يقصده ألتمان. هناك خبرٌ سعيد وآخر ليس
كذلك بشأن هذه الإضافة، أما السعيد فهو أنها مجانية، وأما الخبر الآخر فإنها
محدودة، وبعد تجربة نموذج GPT-4o بشكل شخصي، إليكم كل ما تودون معرفته عنه في
السطور التالية.
نموذج الذكاء الاصطناعي GPT-4o
أولًا: الإعلان عن GPT-4o
كُل من يتابع المشهد التقني، وبخاصة مشهد الذكاء الاصطناعي عن كثب، كان يعرف أن
OpenAI ستعلن عن شيء جلل في القريب العاجل. الإعلان جاء بالأمس، وفيه أعلنت
OpenAI عن إصدار مُحسّن من نموذج GPT-4 أطلقت عليه اسم "GPT-4o" وحرف الـ "O" هنا تأتي اختصارًا للكلمة اللاتينية "Omnis" والتي تُستخدم لوصف أي شيء واسع النطاق وشامل، وبالفعل تُشير التسمية
لقدرات النموذج الجديد على التعامل بشكل أفضل من GPT-4 من حيث معالجة النصوص
والصوت والمواد المرئية.
وبحسب ميرا موراتي، رئيسة قسم التكنولوجيا في OpenAI، فإن GPT-4o سيكون على نفس مستوى ذكاء "GPT-4"، ولكنه سيفوقه من
حيث التعامل مع الوسائط المتعددة. وأكد على ذلك سام ألتمان، الرئيس التنفيذي
للشركة، في
منشور له على منصة إكس
حيث قال ان "نموذج GPT-4o يُعد أفضل نموذج لدينا على الإطلاق، وهو ذكي وسريع
ومتعدد الوسائط" أي يمكنه إنشاء المحتوى وفهم الأوامر في شكل صوت أو نص أو صور أو
فيديو.
وقبل أن نتحدث عن المميزات الاستثنائية للنموذج الجديد، علينا أن نعرف شيئًا
مهمًا لنستوعب الصورة كاملة: لقد تدرب نموذج GPT-4 Turbo – وهو نموذج OpenAI
الأكثر تطورًا حتى أتى GPT-4o – على مجموعة هائلة من البيانات تضم خليطًا من
الصور والنصوص، أما "GPT-4o"، فتدرب على نفس نوعية البيانات مُضافًا إليها
البيانات الصوتية، ولهذا لا عجب أن معظم القدرات الاستثنائية للنموذج الجديد
ستتمحور حول الصوت، وهذا يأخذنا إلى القسم الثاني من هذا المقال، وهو...
ثانيًا: ماذا يقدم GPT-4o ؟
صرحت OpenAI عبر موقعها الرسمي بأن نموذج GPT-4o سيعمل بنفس آلية GPT-4، غير
أن النموذج الجديد سيكون أسرع كثيرًا ليُحاكي الطريقة التي يتحدث بها البشر إلى
بعضهم أو على الأقل يقترب منها. بمعنى أدق، تُريد OpenAI أن تجعل محادثاتك مع
ChatGPT سواء الصوتية أو النصية تبدو وكأنها تحدث مع شخصٍ حقيقي بدون تأخير في
الردود وفي الوقت الفعلي، بحيث يرد النموذج عليك لحظيًا بمجرد انتهاءك من الكلام،
ولقد نجحت في ذلك بالفعل!
دلَّلت OpenAI على ذلك بمثالين مُذهلين حيث جلبت باحثًا في الشركة يُدعى مارك
وجعلته يُجري محادثة صوتية مع نموذج GPT-4o عبر تطبيق ChatGPT على الهاتف. في
البداية طلب مارك من النموذج أن يُعلمه طريقة التنفس الصحيحة وقام باختباره بأن
أخذ يتنفس شهيقًا وزفيرًا بسرعة كبيرة لنُفاجئ برد GPT-4o عليه في الوقت الفعلي
قائلًا: "ووه! اهدأ قليلًا يا مارك، أنت لست مِكنسة !" ويخبره بالطريقة الصحيحة
للتنفس.. ردٌ مذهل أليس كذلك؟ نحن البشر لا نمتلك نفس البراعة في الرد، ومرةً
أخرى، هذا حدث في الوقت الفعلي، أي بمجرد انتهاء مارك من التنفس بالطريقة
الخاطئة.
على يسار مارك الباحث بـ OpenAI "باريت زوف" وعلى يمينه "ميرا موراتي" – في
المثال الثاني طلب مارك من GPT-4o أن يحكي لصديقه "باريت" قصة ما قبل النوم عن
"الروبوتات والحب" لأنه يُعاني مشاكل في النوم. بدأ النموذج بسرد القصة بشكل جيد،
ولكن بنبرة خالية من الدراما والتشويق فقاطعه مارك مُطالبًا بتغيير النبرة، وهو
ما كان في التو واللحظة، ولكن "باريت" أراد نبرة دراميةً أكثر فطلب تغييرها وهو ما
كان في لحظة، ثم تدخلت ميرا وطلبت نبرة آلية وهو ما حدث أيضًا، وبالأخير طلب مارك
إنهاء القصة بصوتٍ غنائي، وخمن ماذا حدث؟! أتم GPT-4o القصة بصوتٍ غنائي في
ثوانٍ.
قدرات وإمكانيات GPT-4o
كان ذلك بالنسبة لمميزات النموذج المتعلقة بالرد الصوتي في الوقت الفعلي، والتي
كانت لتكفي لإبهارنا، ولكن OpenAI أرادت أن تُضفي مزيدًا من الإبهار فقام
"باريت" بكتابة معادلة رياضية هي 3x + 1 = 4 وأراها للنموذج مطالبًا
إياه بمساعدته على حلها، ولكن مع شرح الخطوات، وهذا ما فعله ChatGPT حيث قال إننا
يجب أن نضع الـ "X" في طرف وبقية المعادلة في الطرف آخر، إلى بقية الحل.
المُثير في الأمر أنه بعد انتهاء "باريت" من حل المعادلة تدخل مارك وسأل GPT-4o:
كيف يمكن لهذه المعادلة الخطية أن تفيدني بشكل عملي في الحياة؟ فرد عليه النموذج
بأن سؤاله منطقي وأجابه بالفوائد مُستشهدًا ببعض المجالات التي تدخل فيها
المعادلات الخطية بشكل كبير. أتدري ما المُدهش حقًا عزيزي القارئ؟ المدهش أن
ChatGPT استطاع أن يُفرق بين الشخصيات الثلاثة مناديًا كل شخص باسمه، ناهيك أن
الردود لم تكن تلقائيًا، على سبيل المثال: مزح مارك مع GPT-4o فجاراه الأخير بنفس
النبرة، وفي النهاية كتب "باريت" على الورقة "I ♡ ChatGPT" وسأل النموذج عما يراه
فرد عليه بشكلٍ عاطفي يبدو نابعًا من قلب إنسان!
لاحظ أيضًا أن "مارك وباريت وميرا" كانوا يقاطعون النموذج أثناء ردوده ونموذج GPT-4o كان
يستجيب لذلك بطريقة واقعية ومنطقية تمامًا. وإذا كنت تعتقد أن المهام الذي وُكِّل
النموذج بها كانت سهلة، وهي ليست كذلك، فدعنا نُخبرك بأن "باريت" قد اختبره بمهمةٍ
برمجية معقدة واستطاع GPT-4o – كما المتوقع – أن يُساعده بأسلوب بشري.
هذه هي القدرات التي قامت OpenAI باستعراضها خلال الحدث، ولكن على قناة يوتيوب الرسمية التابعة للشركة، هناك مجموعة من المقاطع التي تستعرض بشكل عملي وأكثر واقعية استخدامات GPT-4o مثل هذا المقطع الذي يوضح قدرة النموذج على حل المعادلات الرياضية بأسلوب يُحاكي مدرسين الرياضيات، أو ذاك الذي يُبين سرعة النموذج في التعرف على الكلام وترجمته في الوقت الفعلي لإجراء محادثة مع شخص بلغة مختلفة. وبشكل عام، يرتقي GPT-4o بإمكانيات ChatGPT المُذهلة بالفعل ليعطيه القدرة على خوض المحادثات بدرجة عالية من الفهم والاستجابة للأوامر المعقّدة واستيعاب المدخلات الصوتية بصورة أقرب للعقل البشري، ولذا فلا عجب من تشبيه البعض، بما فيهم سام ألتمان، لنموذج GPT-4o الجديد بنظام التشغيل OS1 من فيلم الخيال العلمي "Her".
ثالثًا: كيف يمكننا استخدام GPT-4o ؟
يمكن استخدام هذا النموذج المذهل داخل واجهة ChatGPT المُعتادة نفسها سواء من خلال المتصفح أو التطبيق على الهاتف، وبشكلٍ
مجاني، أو كواجهة برمجية منفصلة. وكما ذكرنا في المقدمة، سيكون GPT-4o مُتاحًا لكافة المستخدمين بداية من اليوم، بما في ذلك مستخدمي النسخة المجانية لتكون هذه بمثابة ترقية لنموذج GPT-3.5 الافتراضي على الحسابات المجانية، ولكن سيتمتع المشتركون في النسخة المدفوعة "ChatGPT Plus" بسرعة تلقي ردود أكبر حتى 5 مرات مقارنة بمستخدمي النسخة المجانية. كذلك هناك حدٌ
للاستخدام المجاني لـ GPT-4o؛ شخصيًا جربت النموذج لمدة ربع ساعة متصلة تقريبًا
وفجأة ظهرت لي رسالة بأنني وصلت إلى الحد المسموح به ولكي أتمكن من استخدام
النموذج مرةً أخرى عليّ أن أعود بعد ساعتين على الأقل.
الجدير بالذكر أنه لا يوجد مؤشر ينبهك بحد الاستهلاك إذا كنت تستخدم النسخة
المجانية من ChatGPT (GPT-3.5)، فقط ستظهر لك هذه الرسالة وتخبرك بالمواصلة
باستخدام GPT-3.5 بدلًا من GPT-4o. وجديرٌ بالذكر أيضًا أن النموذج الجديد يستطيع
تصفح الإنترنت وتحليل البيانات ورؤية الصور والتعامل مع أنواع مختلفة من الملفات
لتلخيصها أو مساعدتك على فهمها مثلًا.