هل تخيلت يوما أن يكون لنا ذكاء اصطناعي يصنع لنا فديوهات واقعية و كأنها مصورة بكامرا أو بهاتف، صور واقعية لأشخاص و أماكن و أزمنة و مناظر طبيعية من خيال الذكاء الاصطناعي. قبل أن نعرفكم بسورا Sora، إليكم صور من تلك الفديزهات التي أنشأها نموذج سورا Sora لتتضح لكم الصورة على ما هو قادم :
أنا لا أرى أي ذكاء اصطناعي في الصور، فهي مأخوذة حتما بكامرا! في الواقع هي من صنع الذكاء الاصطناعي لخلق الفديوهات من النصوص الوصفية، يمكن الاطلاع على المزيد عبر : https://openai.com/sora العديد من الفديوهات التي صنعها الذكاء الاصطناعي و أبدا لن تظهر على أنها من صنعه.
ما هو سورا Sora؟
سورا هو نموذج ذكاء اصطناعي طورته شركة أوبن أيه آي (OpenAI) لإنشاء مقاطع فيديو واقعية وخيالية من نصوص وصفية فقط. سورا Sora يمكنه إنشاء محتوى فيديو واقعي ومبتكر من خلال مطالبات نصية بسيطة كما أشرنا لها في الصور.
نموذج سورا Sora يعد مثال لفئة من نماذج الذكاء الاصطناعي المعروفة باسم مولدات تحويل النص إلى فيديو. يأخذ سورا وصفًا مكتوبًا لمشهد فيديو ويعرض مقطع فيديو فعليًا يصوره. النظام قادر على إنتاج مقاطع فيديو تصل مدتها إلى دقيقة واحدة وتتوافق مع العناصر المرئية المطلوبة بدرجة عالية من الدقة. على سبيل المثال، يمكنه عرض مقاطع فيديو بشكل موثوق يضم شخصيات متعددة تشارك في حركات وأنشطة محددة يصفها المستخدم. تحافظ مقاطع الفيديو التي تم إنشاؤها على الاتساق في أشياء مثل الشخصيات والخلفيات والعناصر الأخرى حتى مع تغير زاوية الكاميرا.
أهم ما جاء به نموذج سورا Sora
- Sora هو نموذج للذكاء الاصطناعي تم تدريبه بواسطة OpenAI لإنشاء مشاهد فيديو واقعية ومتخيلة من التعليمات النصية.
- يمكنه إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة بجودة مرئية جيدة وإخلاص للمطالبات.
- يفهم النموذج الخصائص الفيزيائية للمشاهد والشخصيات، مما يسمح بأجيال معقدة ومتماسكة.
- يمثل Sora بعضًا من إمكانيات تحويل النص إلى المرئي الأكثر تقدمًا التي شوهدت حتى الآن في نظام الذكاء الاصطناعي.
قدرات نموذج سورا Sora
- إنشاء مشاهد معقدة تحتوي على شخصيات وعناصر متعددة
- محاكاة الحركة الواقعية والفيزيائية
- المحافضة على الاتساق البصري، مع استمرار الشخصيات والعناصر بشكل صحيح على الرغم من تغيرات زاوية الكاميرا
- القيام بإنتاج لقطات متعددة بزاوية الكاميرا ضمن مقطع فيديو واحد تم إنشاؤه
- القيام بتحريك الصور الثابتة من خلال توسيعها إلى مقاطع فيديو
- ملئ الإطارات المفقودة من لقطات الفيديو الموجودة
كيف يعمل نموذج سورا Sora؟
يستخدم سورا تقنية التعلم العميق لمعالجة النصوص وفهم محتواها، ثم ينشئ مقاطع فيديو تتوافق مع الوصف. تقنيا كيف يعمل سورا لأولئك الذين يتساءلون كيف تمكن Sora بالفعل من إنشاء مقاطع الفيديو هذه. يستخدم Sora بنية الذكاء الاصطناعي لنموذج الانتشار، بدءًا من الضوضاء وتحسينها تدريجيًا إلى فيديو واضح ومتماسك عبر العديد من الخطوات. كما أنها تستخدم نماذج المحولات التي تسمح بالقياس الفائق. تم تدريب النموذج على مجموعات بيانات كبيرة من الصور ومقاطع الفيديو الموضحة، مما يمنحه طريقة أسهل بكثير لفهم المفاهيم المرئية بشكل كامل ومطابقة الكلمات مع الكائنات.
لاحظت OpenAI أن Sora لا يزال يعاني من بعض نقاط الضعف في النمذجة الدقيقة للفيزياء والتفاعلات المعقدة بين عناصر متعددة. لكن قدراته تظهر بوضوح التقدم السريع للذكاء الاصطناعي في فهم ومحاكاة العالم الحقيقي من خلال وسيط الفيديو. من بين جميع مولدات الفيديو التي تعمل بالذكاء الاصطناعي والتي جاءت قبل Sora، من الواضح أن الذكاء الاصطناعي في هذا الأمر أصبح أقل اصطناعية و أكثر أبداعية وواقعية.
تطبيقات نموذج سورا Sora
يمكن استخدام Sora لإنشاء مقاطع فيديو من البداية أو توسيع مقاطع الفيديو الموجودة لجعلها أطول. يمكنه أيضًا ملء الإطارات المفقودة من مقاطع الفيديو.
بنفس الطريقة التي سهلت بها أدوات الذكاء الاصطناعي المولدة لتحويل النص إلى صورة إنشاء الصور بشكل كبير دون خبرة فنية في تحرير الصور، يعد Sora بتسهيل إنشاء مقاطع فيديو دون خبرة في تحرير الصور. فيما يلي بعض حالات الاستخدام الرئيسية.
- صناعة الأفلام: يمكن استخدام سورا لإنشاء مشاهد صعبة التصوير أو باهظة الثمن.
- التسويق: يمكن استخدام سورا لإنشاء إعلانات فيديو جذابة.
- التعليم: يمكن استخدام سورا لإنشاء مواد تعليمية تفاعلية.
- الترفيه: يمكن استخدام سورا لإنشاء ألعاب فيديو أو أفلام قصيرة.
في الختام، يعد نموذج Sora من OpenAI بقفزة إلى الأمام في جودة الفيديو التوليدي. ومن المنتظر أن نجد تطبيقاته المحتملة في مختلف القطاعات و الأعمال الفنية و حتى الأفلام و المسلسلات.