لماذا تثير أداة Sora، أداة تحويل النص إلى الفيديو الجديدة من OpenAI، الدهشة؟

لماذا تثير أداة Sora، أداة تحويل النص إلى الفيديو الجديدة من OpenAI، الدهشة؟

[ad_1]

Sora هو المولد الجديد لتحويل النص إلى فيديو من صانع ChatGPT OpenAI. وإليك ما نعرفه عن الأداة الجديدة التي تثير القلق والإثارة بنفس القدر.

إعلان

يغوص صانع ChatGPT الآن في عالم الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي (AI).

تعرف على Sora – مولد تحويل النص إلى فيديو الجديد من OpenAI. تستخدم الأداة، التي كشفت عنها الشركة ومقرها سان فرانسيسكو يوم الخميس، الذكاء الاصطناعي التوليدي لإنشاء مقاطع فيديو قصيرة على الفور بناءً على أوامر مكتوبة.

سورا ليس أول من أظهر هذا النوع من التكنولوجيا. لكن محللي الصناعة يشيرون إلى الجودة العالية لمقاطع الفيديو التي تعرضها الأداة حتى الآن، ويلاحظون أن تقديمها يمثل قفزة كبيرة لكل من OpenAI ومستقبل إنشاء تحويل النص إلى فيديو بشكل عام.

ومع ذلك، كما هو الحال مع كل الأشياء في مجال الذكاء الاصطناعي سريع النمو اليوم، تثير هذه التكنولوجيا أيضًا مخاوف بشأن الآثار الأخلاقية والمجتمعية المحتملة. إليك ما تحتاج إلى معرفته.

ما الذي يمكن أن يفعله سورا وهل يمكنني استخدامه بعد؟

Sora هو منشئ تحويل النص إلى فيديو – حيث يقوم بإنشاء مقاطع فيديو تصل مدتها إلى 60 ثانية بناءً على مطالبات مكتوبة باستخدام الذكاء الاصطناعي التوليدي. يمكن للنموذج أيضًا إنشاء فيديو من صورة ثابتة موجودة.

الذكاء الاصطناعي التوليدي هو فرع من الذكاء الاصطناعي يمكنه إنشاء شيء جديد. تشمل الأمثلة روبوتات الدردشة، مثل ChatGPT من OpenAI، ومولدات الصور مثل DALL-E وMidjourney.

يعد الحصول على نظام ذكاء اصطناعي لإنشاء مقاطع فيديو أمرًا أحدث وأكثر تحديًا ولكنه يعتمد على بعض التقنيات نفسها.

Sora ليس متاحًا للاستخدام العام بعد (تقول OpenAI إنها تتواصل مع صانعي السياسات والفنانين قبل إطلاق الأداة رسميًا) وما زال هناك الكثير مما لا نعرفه. ولكن منذ إعلان يوم الخميس، شاركت الشركة عددًا من الأمثلة لمقاطع الفيديو التي أنشأها Sora لإظهار ما يمكنها فعله.

توجه سام ألتمان، الرئيس التنفيذي لشركة OpenAI، أيضًا إلى X، المنصة المعروفة سابقًا باسم Twitter، ليطلب من مستخدمي وسائل التواصل الاجتماعي إرسال أفكار سريعة.

شارك لاحقًا مقاطع فيديو مفصلة بشكل واقعي استجابت لمطالبات مثل “اثنين من المستردات الذهبية يبثان على قمة جبل” و”سباق دراجات على المحيط مع حيوانات مختلفة كرياضيين يركبون الدراجات مع عرض كاميرا بدون طيار”.

في حين أن مقاطع الفيديو التي تم إنشاؤها بواسطة Sora يمكن أن تصور مشاهد معقدة ومفصلة بشكل لا يصدق، تشير OpenAI إلى أنه لا تزال هناك بعض نقاط الضعف – بما في ذلك بعض العناصر المكانية وعناصر السبب والنتيجة.

على سبيل المثال، تضيف شركة OpenAI على موقعها على الإنترنت، “قد يأخذ الشخص قضمة من ملف تعريف الارتباط، ولكن بعد ذلك، قد لا يكون لملف تعريف الارتباط علامة قضمة”.

ما هي أدوات الفيديو الأخرى التي تم إنشاؤها بواسطة الذكاء الاصطناعي؟

إن Sora من OpenAI ليس الأول من نوعه. جوجل، ميتا، والشركة الناشئة Runway ML هي من بين الشركات التي أظهرت تكنولوجيا مماثلة.

ومع ذلك، يؤكد محللو الصناعة على الجودة الواضحة والطول المذهل لمقاطع فيديو Sora التي تمت مشاركتها حتى الآن.

وقال فريد هافيماير، رئيس قسم الذكاء الاصطناعي وأبحاث البرمجيات في ماكواري بالولايات المتحدة، إن إطلاق Sora يمثل خطوة كبيرة إلى الأمام بالنسبة لهذه الصناعة.

وقال هافيماير: “لا يمكنك فقط إنشاء مقاطع فيديو أطول، فأنا أفهم ما يصل إلى 60 ثانية، ولكن أيضًا مقاطع الفيديو التي يتم إنشاؤها تبدو طبيعية أكثر ويبدو أنها تحترم الفيزياء والعالم الحقيقي أكثر”.

“أنت لا تحصل على العديد من مقاطع الفيديو أو الأجزاء من “الوادي الخارق” في خلاصات الفيديو التي تبدو… غير طبيعية”.

على الرغم من أنه كان هناك “تقدم هائل” في الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي خلال العام الماضي – بما في ذلك تقديم Stable Video Diffusion في نوفمبر الماضي – قال روان كوران، كبير المحللين في شركة Forrester، إن مقاطع الفيديو هذه تتطلب المزيد من “الدمج معًا” من أجل اتساق الشخصية والمشهد.

إعلان

ومع ذلك، فإن اتساق مقاطع الفيديو الخاصة بسورا وطولها يمثل “فرصًا جديدة للمبدعين لدمج عناصر الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي في محتوى أكثر تقليدية، والآن حتى لإنشاء مقاطع فيديو روائية كاملة من واحد أو عدد قليل من المطالبات،” كما قال كوران لصحيفة The The Guardian. وكالة أسوشيتد برس عبر البريد الإلكتروني يوم الجمعة.

ما هي المخاطر المحتملة؟

على الرغم من أن قدرات سورا أذهلت المراقبين منذ إطلاقه يوم الخميس، إلا أن القلق بشأن الآثار الأخلاقية والمجتمعية لاستخدامات الفيديو التي يولدها الذكاء الاصطناعي لا يزال قائمًا أيضًا.

يشير هافيماير إلى المخاطر الكبيرة التي تنطوي عليها الدورة الانتخابية لعام 2024، على سبيل المثال.

وأضاف أن وجود طريقة “سحرية محتملة” لإنتاج مقاطع فيديو قد تبدو واقعية يطرح عددًا من القضايا داخل السياسة وخارجها – مشيرًا إلى مخاوف الاحتيال والدعاية والمعلومات المضللة.

وقال هافيمير: “العوامل الخارجية السلبية للذكاء الاصطناعي التوليدي ستكون موضوعًا حاسمًا للنقاش في عام 2024”. “إنها قضية جوهرية سيتعين على كل شركة وكل شخص مواجهتها هذا العام”.

إعلان

لا تزال شركات التكنولوجيا هي صاحبة القرار عندما يتعلق الأمر بإدارة الذكاء الاصطناعي ومخاطره، حيث تعمل الحكومات في جميع أنحاء العالم على اللحاق بالركب.

وفي ديسمبر/كانون الأول، توصل الاتحاد الأوروبي إلى اتفاق بشأن أول قواعد شاملة للذكاء الاصطناعي في العالم، لكن القانون لن يدخل حيز التنفيذ إلا بعد مرور عامين على الموافقة النهائية.

وفي يوم الخميس، قالت OpenAI إنها تتخذ خطوات سلامة مهمة قبل إتاحة Sora على نطاق واسع.

وكتبت الشركة: “نحن نعمل مع أعضاء الفريق الأحمر – خبراء المجال في مجالات مثل المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز – الذين سيختبرون النموذج بشكل عدائي”.

“نحن أيضًا نبني أدوات للمساعدة في اكتشاف المحتوى المضلل مثل مصنف الكشف الذي يمكنه معرفة متى تم إنشاء مقطع فيديو بواسطة Sora”.

إعلان

كررت آنا ماكانجو، نائبة رئيس الشؤون العالمية في OpenAI، ذلك عندما تحدثت يوم الجمعة في مؤتمر ميونيخ للأمن، حيث تعهدت OpenAI و19 شركة تكنولوجيا أخرى بالعمل معًا طوعًا لمكافحة التزييف العميق للانتخابات الناتج عن الذكاء الاصطناعي.

وأشارت إلى أن الشركة أطلقت سراح سورا “بطريقة حذرة للغاية”.

وفي الوقت نفسه، كشفت OpenAI عن معلومات محدودة حول كيفية بناء Sora.

ولم يكشف التقرير الفني لشركة OpenAI عن مصادر الصور والفيديو المستخدمة لتدريب Sora، ولم تستجب الشركة على الفور لطلب مزيد من التعليق يوم الجمعة.

يأتي إصدار Sora أيضًا على خلفية الدعاوى القضائية المرفوعة ضد OpenAI وشريكتها التجارية Microsoft من قبل بعض المؤلفين وصحيفة نيويورك تايمز بشأن استخدامها لأعمال كتابية محمية بحقوق الطبع والنشر لتدريب ChatGPT.

إعلان

[ad_2]

المصدر