بعد روبوت الدردشة الذكي ChatGPT لتوليد النصوص، ونماذج DALL-E المخصصة
لإنشاء الصور بالذكاء الاصطناعي، ها هي OpenAI تستعرض عضلاتها مجددًا في اليوم الثالث من سلسلة الأيام الـ 12
من إطلاقات الشركة حيث تم طرح أداة جديدة لإنشاء مقاطع فيديو واقعية
باستخدام الذكاء الاصطناعي، والتي تُدعى "سورا" Sora (باليابانية: السماء) وذلك بعد أن قامت بالكشف عنها لأول مرة في شهر
فبراير الماضي وإتاحتها بشكل محدود لمبتكري المحتوى، في إطار مرحلة تجريبية.
من خلال هذه الأداة يمكن توليد مقاطع واقعية وخيالية اعتمادًا على الأوصاف
النصية أو باستخدام الصور الثابتة لمدة تصل إلى 20 ثانية، كما يستطيع
تمديد مقاطع الفيديو الموجودة
عبر توليد من الإطارات (الفريمات) لملء التفاصيل المفقودة – وهذا شيء لو تعلمون
عظيم! لذلك دعونا نسرد عبر السطور التالية أهم التفاصيل والقدرات التي يتمتع بها
نموذج Sora ولماذا قد يمثل طفرة حقيقية في مجال الذكاء الاصطناعي التوليدي.
نموذج Sora لإنشاء الفيديو بالذكاء الاصطناعي
مبدئيًا، دعونا نوضح أنه حتى وقت كتابة هذا المقال، فإن الوصول لأداة Sora
الجديدة، والتي تعتمد على نموذج Sora Turbo محدود للغاية، إذ أتاحته
OpenAI على موقع
Sora.com لأصحاب حسابات
ChatGPT المدفوعة في الولايات المتحدة وبعض الدول الأخرى. حيث تقول الشركة انه
يمكن للمشتركين في ChatGPT Plus إنشاء ما يصل إلى 50 مقطع فيديو بدقة تصل
إلى 720 بكسل لمدة 5 ثوانٍ.
بينما يتيح اشتراك ChatGPT Pro – الذي تبلغ قيمته 200 دولار شهريًا – إنشاء ما
يصل إلى 500 فيديو مع رفع الدقة إلى 1080 بكسل والمدة إلى 20 ثانية. كما تسمح
الباقة الأغلى ثمناً للمشتركين بتنزيل مقاطع الفيديو التي تم إنشاؤها بدون
علامة مائية. لكن في جميع الحالات، يظل استخدام الأداة مقيد بنظام "الرصيد" حيث
كل مستخدم له 1000 نقطة يتم الخصم منها مع كل عملية إنشاء جديدة، على ان يُجدد
الرصيد كل شهر.
وعلى الرغم من أنها لا تُعد أداة الذكاء الاصطناعي الأولى من نوعها، فإن Sora
تتفوق على المنافسين من حيث جودة الفيديوهات والتفاصيل، إذ تستطيع إنتاج مقطع
فيديو بجودة 1080p، وبعرضٍ سلس للإطارات يُصعّب على غير المنتبهين أن يكتشفوا
مصدره، وهذا على عكس أدوات شركتي Google و Meta القادرة على صنع فيديوهات
بالذكاء الاصطناعي نعم، ولكن جودتها سيئة، وتجعل المشاهد معيوبة لدرجة تجعل أي
شخصٍ يستطيع كشف انها مصنوعة بالذكاء الاصطناعي بكل سهولة.
قدرات تطبيق Sora الجديد من OpenAI
على موقعها الرسمي Openai.com/sora
شاركتنا OpenAI أمثلةً لما يمكن لأداتها الجديدة أن تفعل، وقياسًا على ما رأيناه،
فالذكاء الاصطناعي تطور بشكلٍ مرعب في تجسيد الأشخاص، ومحاكاة الإضاءات
والانعكاسات، فضلًا عن خلق بيئات سينمائية ممتازة؛ مقارنةً بما كان عليه من قبل
بالطبع، أما لو كنا نتحدث في العموم، فالمنتج البشري لا زال متفوقًا بأميال.
وجديرٌ بالذكر أن قدرات Sora ليست محدودةً برسم البشر بتفاصيل دقيقة فقط، وإنما
تستطيع تجسيد الحيوانات بشكل واقعي كذلك.
مرةً أخرى، تُنشئ أداة Sora مقاطع فيديو واقعية وعالية الجودة من العدم، أو بمعنى
أدق من عدة كلمات أو صور ثابتة، ولكي تستوعبوا مدى التطور المُرعب الذي وصلنا
إليه، فقط تذكروا مقطع الفيديو المُنشأ بالذكاء الاصطناعي للممثل ويل سميث والذي
كان مُضحكًا للغاية وجعلنا نستخف بقدرات الآلة،
ذلك المقطع
كان منذ فترة ليست ببعيدة، قارنه بما يمكن لأداة OpenAI أن تفعله الآن وستعرف
الفرق.
عمومًا، خلال البث المباشر لليوم الثالث، عرضت شركة OpenAI صفحة Featured
الجديدة ضمن واجهة Sora والتي تتضمن موجز لمقاطع الفيديو التي أنشأها أعضاء
آخرون باستخدام الذكاء الاصطناعي وقرروا إتاحتها للعامة، بالإضافة إلى استعراض
ميزة جديدة تُسمى "Storyboard" التي تتيح لك إنشاء مقاطع فيديو بناءً على
سلسلة من المطالبات، بالإضافة إلى القدرة على تحويل الصور (وليس النص فقط) إلى
مقاطع فيديو. كما عرض الشركة أيضًا ميزة "Remix" التي تتيح لك تعديل المقاطع التي
أنتجتها Sora من خلال إدخال المطالبات النصية لأشياء مثل تغيير المنظور أو
التركيز على مشهد مُعين، هذا بالإضافة إلى ميزة "Blend" التي ستسمح بدمج مشهدين
من إنتاج الأداة معًا بطريقة سلسة بالذكاء الاصطناعي.
عرضت OpenAI كذلك ميزة "Re-cut" التي تُمكّن المستخدمين من البحث عن أفضل
إطارات تم توليدها في المقطع وعزلها ثم تمديدها في أي من الاتجاهين لإكمال
المشهد. وأيضًا، هناك ميزة "Loop" حيث يمكن للمستخدم قص وإنشاء مقاطع فيديو
تظهر بها مشاهد مكررة مثل شعلة نار أو زهرة تتفتح أو أمواج البحر، وهكذا. بينما
توفر الأداة أنماط جاهزة "Style presets" حيث يسهل على المستخدم إنشاء مقاطع
فيديو يغلب عليها قالب مُعين كمحاكاة نمط الأبيض والأسود أو السرد الوثائقي،
وغيره.
عالجت OpenAI الكثير من مشاكل Sora التي ظهرت في النسخة التجريبية مطلع العام
الجاري مثل حركات اليدين غير المتناسقة وانعكاسات الإضاءات، لكن رغم ذلك، ما زال
نموذج Sora Turbo الذي تعتمد عليه الأداة يُظهر "جلتشات" على مستوى التجسيد
والحركة، فالنموذج يُعاني من قصور في المحاكاة الدقيقة للنواحي الفيزيائية
وبخاصة في المشاهد المعقدة. ومع ذلك، لو أريت هذه الفيديوهات لأشخاصٍ دون إخبارهم
بأنها مُنشأة بواسطة الذكاء الاصطناعي، فمن غير الوارد أن يكتشفوا ذلك، خصوصًا لو
مرت عليهم بشكل عابر أثناء تصفح فيسبوك أو إنستجرام مثلًا.
كيف تُنشئ أداة Sora هذه الفيديوهات؟
تتمتع الأداة بفهمٍ عميق للغة وتستطيع تجسيد حتى المشاعر بشكل ممتاز. وتعمل Sora
مثل بقية أدوات الذكاء الاصطناعي عن طريق تحويل النصوص والصور الثابتة إلى
فيديوهات، وإذا كنت تعتقد أنها تحتاج إلى أسطرٍ كثيرة وعدد كبير من الكلمات حتى
تُنتج مقطعًا مُعتبرًا فدعنا نُفاجئك بالعكس، حيث تستطيع الأداة أن تنتج فيديوهات
رائعة بسطرٍ واحد أو بجمل مفتوحة منقوصة التفاصيل، أي أنها لا تختلف كثيرًا عن
ميزة تحويل النصوص إلى صور في ChatGPT أو DALL-E لكن إلى جانب كتابة نص المطالبة،
عليك بتحديد بعض المتغيرات مثل المدة والدقة ونسبة العرض. لكن
أثبتت OpenAI قدرات Sora
على الملء والتخيل، وذلك بتلقي طلبات المستخدمين وتحويلها إلى فيديوهات في وقتٍ
قياسي للمصداقية.
لم تكشف OpenAI سوى القليل عن البيانات المستخدمة لتدريب الأداة الجديدة، فتقول
إنها درَّبت Sora على 10 آلاف ساعة من الفيديوهات عالية الجدودة. لكن أهم ما تركز
عليه الشركة هو جانب الخصوصية، حيث إن مقاطع الفيديو التي تم إنشاؤها
باستخدام Sora ستحتوي على علامات مائية مرئية عن طريق معيار يُسمى C2PA وهذا سيقلل من المعلومات المضللة والمحتوى الضار الذي قد يُنشئه البعض
مُستعينين بـ Sora. وقبل رفع صورة أو مقطع فيديو على Sora، ستحتاج إلى الموافقة
على اتفاقية تنص على أن ما ترفعه لا يحتوي على أشخاص دون سن 18 عامًا، أو محتوى
صريح أو عنيف، أو مواد محمية بحقوق الطبع والنشر. وتؤكد الشركة ان من يخالف هذه
البنود سيتم حظر حسابه أو تعليقه.
في السياق نفسه، قال نائب رئيس قسم الأبحاث في OpenAI خلال البث المباشر: "نريد
منع النشاط غير القانوني لـ Sora، ولكننا نريد أيضًا أن نوازن ذلك مع حرية
التعبير الإبداعي. نحن نعلم أن ذلك سيكون تحديًا مستمرًا، وقد لا نصل إلى الكمال
في اليوم الأول. لذلك نبدأ بشكل متحفظ قليلاً، وإذا لم يكن إشرافنا على المحتوى
دقيقًا تمامًا، فما عليك سوى إعطائنا التعليقات النقدية (Feedbacks)."
يُذكَر أن OpenAI لم تتح الأداة للجميع لأنها تواجه تحديات ضخمة على مستوى
الخصوصية وحقوق الملكية. ولكن إذا لم يكن لديك اشتراك في ChatGPT فستظل
قادرًا على تصفح مقاطع الفيديو التي أنشأها أشخاص آخرون باستخدام Sora. في حين أن
الأداة ستصبح متاحة في الولايات المتحدة والعديد من البلدان الأخرى اليوم وتأمل
الشركة أن يُمكّن هذا الإصدار المبكر من Sora الناس في كل مكان من استكشاف أشكال
جديدة من الإبداع، وسرد قصصهم، وتخطي حدود الممكن في سرد القصص المصورة.