إذا كنت مهتما في إنشاء مقاطع الفيديو باستخدام الذكاء الاصطناعي وإذا كنت قد جربت نموذجًا توليديًا من قبل، فربما تكون قد شاهدت مقاطع فيديو بحركات غريبة، وشخصيات تتغير ملامحها، ومشاهد تتعطل بمجرد إضافة أي تعقيد بسيط إلى اللقطة. وهنا تكمن أهمية هذا البرنامج. لوما راي 3، وهو نموذج لا يقوم فقط بتوليد وحدات البكسل، بل يحاول أيضًا "التفكير" في المشهد كما يفعل المخرج.
سنستعرض في هذه المقالة بهدوء كل ما يقدمه. لوما راي: توليد المشاهد ثلاثية الأبعاد بفضل أسلوب التحليل المنطقي، وفيديو HDR ذي 16 بت، وتقنية التقاط الصور ثلاثية الأبعاد عبر الهاتف المحمول، وغيرها من الميزات، كل ذلك لتحقيق نتائج بصرية مذهلة في غضون ساعات، وليس أسابيع.
ما هو برنامج Luma Ray3 وماذا يقدم مقارنةً بنماذج الفيديو الأخرى التي تعتمد على الذكاء الاصطناعي؟
لوما راي 3 هذا هو الجيل الثالث الرئيسي من نماذج الفيديو من شركة Luma AI، الشركة التي تقف وراء منصة Dream Machine وتطبيق التقاط الصور ثلاثية الأبعاد للهواتف المحمولة. ويكمن الاختلاف الرئيسي بينه وبين الموجة السابقة من مولدات الفيديو في أنه يتضمن نظام الاستدلال متعدد الوسائطأي أنه لا يقوم ببساطة بتحويل النص إلى سلسلة من الإطارات، ولكنه يقسم المهمة إلى خطوات منطقية.
عندما تكتب سؤالاً معقداً - على سبيل المثال، أ مشهد قتال يضم عدة شخصياتمع الكاميرات المتحركة والإضاءة المتغيرة، يعمل برنامج Ray3 كفريق إبداعي صغير: فهو يطور سيناريو ذهنيًا، ويقيّم ما يجب أن يحدث أولًا وما يليه، ويُنشئ مسودات داخلية تُصقل حتى الوصول إلى تسلسل متماسك. هذه العملية الفكرية المتسلسلة هي ما يقلل من العديد من العيوب الشائعة في مقاطع الفيديو التي يُنتجها الذكاء الاصطناعي.
بالإضافة إلى الاستدلال، يعمل النموذج على فضاء ثلاثي الأبعاد يراعي الفيزياء والإضاءةهذا يعني أنه يتمتع بفهم أفضل لثبات الكائنات، وعمق المشهد، والاستمرارية بين المستويات، ومنطق الحركة. كما تُمكّنه هذه البنية ثلاثية الأبعاد من التفوق في مهام تحويل الصور إلى فيديو أو في تطوير الرسومات التخطيطية والإطارات الرئيسية. مدعوم من تطور وحدة معالجة الرسومات في نظام التشغيل Windows.
لا يقتصر اقتراح لوما على الفيديو فحسب، بل يجمع بين... إنتاج الفيديو، وإنشاء الصور الثابتة، والتقاط الصور ثلاثية الأبعاد في بيئة واحدة، يمكن الوصول إليها عبر الإنترنت والأجهزة المحمولة. بالنسبة للعديد من الشركات الصغيرة والمتوسطة والاستوديوهات الصغيرة، يعني هذا القدرة على تصميم ومعاينة وإنتاج المواد التسويقية والجولات الافتراضية ولوحات القصة، دون الحاجة إلى الاستعانة باستوديو خارجي.

محرك فيديو HDR ذو 16 بت: جودة سينمائية جاهزة للإنتاج
من أبرز مزايا Ray3 قدرته على توليد فيديو HDR أصلي بدقة 16 بت. هذا أمر كان مقتصراً حتى الآن على كاميرات الأفلام وعمليات ما بعد الإنتاج المتقدمة. فبدلاً من العمل ضمن نطاق ديناميكي مضغوط، يقوم النموذج بحساب الإضاءة واللون في نطاق واسع يحافظ على التفاصيل في كل من المناطق شديدة الإضاءة والظلال العميقة.
تتيح تقنية HDR ذات 16 بت إمكانية دمج مقاطع Ray3 بسلاسة في تصحيح الألوان الاحترافي، والمؤثرات البصرية، وسير العمل في البثباستخدام برامج لتحرير الفيديوهات في الويندوزيحصل مصححو الألوان على مليارات التدرجات اللونية الإضافية، وانتقالات سلسة دون تشويش، ومساحة كافية لإجراء تعديلات جذرية على اللقطات دون تدهور جودة الصورة. بالنسبة للإعلانات أو الأفلام المستقلة، تُعدّ هذه التقنية نقلة نوعية مقارنةً بنماذج النطاق الديناميكي القياسي (SDR).
من حيث التنسيقات والدقة، يعمل نظام Luma البيئي مع مخرجات تصل إلى ملفات بدقة 4K و16 بت وEXR تُعطي الخطط المتقدمة الأولوية لدقة عرض مثل 540p أو 720p أو 1080p بمعدل 24 إطارًا في الثانية، بينما تُعطي الخطط القياسية والمجانية الأولوية أيضًا لدقة عرض مماثلة. هذه الدقة كافية لوسائل التواصل الاجتماعي والعروض التقديمية والمعاينات.
الاستدلال متعدد الوسائط والتعليق المرئي: توجيه الذكاء الاصطناعي كطاقم تصوير سينمائي
العنصر الأساسي في Ray3 هو نظام الاستدلال متعدد الوسائطهذا يعني أنه يجمع بين المعلومات النصية والبصرية وسياق المشهد لاتخاذ قرارات بشأن ما يتم إنشاؤه في كل إطار. عمليًا، يُترجم هذا إلى تقليل اختفاء الشخصيات من الإطار دون سبب، وتقليل أخطاء الاستمرارية. كما يؤدي إلى فهم أفضل للتسلسل المنطقي بين الأحداث.
للاستفادة من هذا المنطق، تقدم لوما أداة التعليق المرئي في برنامج Dream Machine، يمكنك الرسم مباشرةً على صورة ثابتة أو إطار أولي، ورسم مسارات الكاميرا، وتحديد مكان تحرك الشخصية، أو تسليط الضوء على منطقة معينة لتكون محور التركيز. إنها طريقة سهلة وبديهية للغاية لإعطاء الأوامر للذكاء الاصطناعي، تتجاوز مجرد النصوص. كما أنها تُسهّل التعامل مع الإضاءة بشكل كبير.
يجمع النموذج هذه التعليقات التوضيحية مع التعليمات المكتوبة، مما يسمح بأشياء مثل تصميم مشاهد القتال، وحركات الكاميرا المعقدة أو محاكاة الحشود والسوائل دون الحاجة إلى وصف كل شيء بالتفصيل بالكلمات. بالنسبة للفرق المعتادة على لغة الصوت والصورة، من الطبيعي أكثر الإشارة إلى لقطة التتبع، أو دوران الكاميرا، أو تغيير التركيز على الصورة.

وضع المسودة: كرر العملية من 5 إلى 20 مرة أسرع للعثور على الفكرة
إنتاج فيديو HDR بدقة 16 بت باستخدام تقنيات المعالجة المنطقية ليس بالأمر الرخيص من حيث قوة الحوسبة. ولهذا السبب قدمت Luma... وضع المسودة صُمم هذا الوضع للتجربة دون استهلاك رصيد. في هذا الوضع، يُنشئ Ray3 نسخًا تجريبية منخفضة الدقة بسرعة أكبر بكثير.
الفكرة هي أنه يمكنك جرب تغييرات في الكاميرا أو النغمة أو الإيقاع أو التكوين لا تخف. غيّر التعليمات، وعدّل التعليقات المرئية، وأنشئ مقطعًا قصيرًا، وتأكد من وضوح التركيز، ثم كرّر العملية. بمجرد أن تتضح لك النتيجة المرجوة، يمكنك حينها طلب معالجة عالية الجودة بتقنية HDR أو 4K باستخدام محرك Hi-Fi Diffusion.
يتناسب وضع المسودة هذا تمامًا مع سير العمل الفعلي للوكالات والاستوديوهات. أولًا، تحتاج إلى مواد رسومية متحركة على غرار لوحة القصة لعرض الفكرة على العميل. بعد ذلك، يصبح استثمار الوقت والموارد في النسخة النهائية أمرًا مبررًا. يتكيف Ray3 مع هذه العملية الإبداعية بتوازن معقول بين السرعة والتكلفة والجودة.
برنامج Dream Machine ومولد فيديو Luma: من النصوص والصور إلى الفيديو السينمائي
خلف Ray3 آلة الحلمبيئة Luma الأساسية لإنشاء مقاطع الفيديو والصور المدعومة بالذكاء الاصطناعي. ضمن هذه المنصة، نجد أيضًا ما يُسمى مولد فيديو لوما، مع التركيز على تحويل الصور الثابتة إلى مقاطع واقعية باستخدام الكاميرا والعمق والرسوم المتحركة المتناسقة.
باستخدام برنامج Luma Video Generator، يمكنك تحميل رسم توضيحي أو تصميم معماري أو صورة منتج، ثم تطلب من النظام إنشاء فيديو. حركة كاميرا سلسة، وتأثيرات عمق والانتقالات التي تُضفي الحيوية على تلك الصورة. كما أنها متوافقة مع التنسيقات التي تم التقاطها بواسطة برنامج لاستخدام الكاميرا الاحترافية الخاصة بكوهذا يسهل دمج المواد الحقيقية والمواد المولدة بواسطة الذكاء الاصطناعي.
من الناحية التقنية، يعتمد المولد على شبكات عصبية متطورة وتقنية Dream Machine الحاصلة على براءة اختراع لتفسير الهندسة والإضاءة من صورة واحدة. والنتيجة، عندما تكون المادة المصدرية جيدة، هي... مقاطع فيديو قصيرة ذات طابع سينمائي والتي تعمل بشكل جيد للغاية كإعلانات تشويقية أو مقاطع فيديو قصيرة أو مقاطع فيديو للصفحات المقصودة.

كيفية استخدام Ray3 في Dream Machine خطوة بخطوة
يتوفر طراز Ray3 ضمن منصة Luma ضمن خيارات مثل "إطار مفتاحي باستخدام Ray3" أو تحويل النصوص إلى فيديوهات والصور إلى فيديوهات. يمكن تلخيص العملية الأساسية، بشكل عام، في ثلاث خطوات رئيسية، يمكنك بعد ذلك تحسينها حسب مشروعك.
لتبدأ ، أنت بحاجة أنشئ حسابًا على Luma AI (يمكنك استخدام معرف جوجل أو أبل الخاص بك) والوصول إلى لوحة التحكم الخاصة بـ آلة الحلممن هنا، يمكنك اختيار سير العمل: تحويل النص إلى فيديو، أو تحويل الصورة إلى فيديو، أو استخدام سير عمل أكثر تقدماً مع الإطارات الرئيسية. الخطوة الأولى المهمة هي اختيار Ray3 أو Ray3 HDR كنموذج، حيث سيتوافق مع الإصدارات الأخرى من عائلة Ray.
بعد اختيارك للطراز، حان الوقت لـ... صياغة الموجه وإذا رغبت، يمكنك تحميل صور مرجعية. من المهم أن تكون وصفي وملموسصف المشهد والإضاءة والأسلوب البصري والحركة الرئيسية وأي عناصر أساسية لا تريد فقدانها. يمكنك استخدام المصطلحات السينمائية (لقطة مقرّبة، لقطة واسعة، حركة بطيئة، عدسة أنامورفية، إلخ) لتوجيه الكاميرا الافتراضية.
في لوحة opciones يمكنك أيضاً الاختيار:
- نوع الإخراج (فيديو).
- نسبة العرض إلى الارتفاع (على سبيل المثال، 16:9).
- مدة المقطع (5 ثوانٍ، 10 ثوانٍ أو امتدادات تصل إلى 30 ثانية في SDR).
- جودة أو وضع HDR/SDR، في الخطط التي تسمح بذلك.
دمج Ray3 في Adobe Firely
لم تنعزل شركة Luma AI داخل منظومتها الخاصة، بل تربطها تحالفات مهمة مع أدوبي لدمج Ray3 ضمن أدوبي فايرفلاي، وهي مجموعة أدوات إبداعية تعتمد على الذكاء الاصطناعي تشق طريقها إلى برامج فوتوشوب، وبريمير، وأفتر إفكتس، وبقية برامج كرييتف كلاود.
عمليًا، هذا يعني أنه يمكنك الذهاب إلى موقع Firefly الإلكتروني، وتسجيل الدخول باستخدام حساب Adobe الخاص بك، والوصول إلى قسم "فيديو > تحويل الصورة إلى فيديو"ضمن هذه الوحدة، لديك خيار تحديد Ray3 أو Ray3 HDR كمحرك، بالإضافة إلى تعديلات على الدقة ونسبة العرض إلى الارتفاع ومعدل الإطارات في الثانية ومدة المقطع.
يفتح هذا التكامل أبواب Ray3 لـ ملايين المهنيين المبدعين الذين يستخدمون برامج أدوبي بشكل يومي، ودون إجبارهم على تعلم منصة جديدة من الصفر، يمكنك إنشاء المقطع باستخدام Firefly وRay3، ثم تنزيله، واستيراده إلى أداتك المعتادة لدمجه في عملية تحرير أكبر.
لكن للوصول إلى النموذج داخل فايرفلاي، اشتراك مميز أو حساب من أدوبي. هنا، يمكن أن يكون استهلاك الرصيد كبيرًا إذا أفرطت في استخدام نموذج الاستدلال، لأنه يميل إلى إنشاء إصدارات داخلية متعددة وبالتالي يستهلك المزيد من الموارد.
المزايا والقيود الحالية لـ Ray3
لتحديد ما إذا كان من المجدي دمج Ray3 في سير عملك، يُنصح بالنظر بعناية في كل من نقاط القوة بالإضافة إلى الجوانب التي لا تزال قيد التطوير. وتُظهر التحليلات المهنية الأولية وضوحاً تاماً في كلا الجانبين.
الإيجابيات
- القدرة على تفسير التعليمات المعقدة، والتماسك الزمني للمشاهد (عدد أقل من الأخطاء العشوائية)، وجودة إضاءة HDR، والفيزياء المعقولة للعناصر.
- نظام الاستدلال البصري والتعليق. يبرز هذا الأمر بشكل خاص في المشاهد المليئة بالحركة أو تلك التي تضم شخصيات متعددة. يتعامل Ray3 مع العناصر المتحركة المتعددة بشكل أفضل ويحافظ على التناسق المكاني بكفاءة أعلى من النماذج السابقة. بالنسبة للإعلانات ورواية القصص، يُترجم هذا إلى أعمال ذات مظهر احترافي أكثر.
سلبيات
- مشاكل في الرسوم المتحركة من الصور إلى الفيديو. قد تتشوه الوجوه أو تفقد دقتها في مطابقة النمط الأصلي، وقد تحدث أخطاء عرضية عند اتباع تعليمات محددة للغاية للكاميرا.
- نموذج التسعير القائم على الائتمان. يستهلك خيار الاستدلال موارد أكثر لأنه يقوم بإنشاء وتقييم العديد من الخيارات الداخلية، لذلك يمكن أن تختفي الاعتمادات إذا لم تخطط جيدًا.
ترخيص Luma AI، وخصوصية البيانات، والدعم
في بيئات العمل الاحترافية، لا يكفي أن تكون الأداة قوية: بل يجب عليك أيضاً التأكد من أن يلتزم بالمتطلبات القانونية ومتطلبات الخصوصيةتوضح Luma AI في وثائقها كيفية تعاملها مع البيانات والمحتوى المُنشأ، مع وجود فروق دقيقة مهمة تعتمد على نوع الخطة المشتراة.
في الخطة المجانية، يمكن للشركة استضافة واستخدام بعض المحتوى لتشغيل الخدمة وتحسينها، وهو أمر شائع في هذا النوع من المنصات. في الخطط المدفوعة، وخاصةً في خطة المؤسسات، يقتصر استخدام البيانات على الخدمة المتعاقد عليها، ولا يُستخدم المحتوى لتدريب النماذج إلا بموافقة صريحة من العميل.
تزعم الشركة أنها تعمل ضمن أطر عمل مثل اللائحة العامة لحماية البيانات (GDPR)، واللائحة العامة لحماية البيانات في المملكة المتحدة، وقوانين حماية البيانات السويسرية، واللوائح الأمريكية. (قانون حماية خصوصية المستهلك في كاليفورنيا، وقانون حماية خصوصية المستهلك في فرجينيا)، باستخدام بنود تعاقدية قياسية لعمليات النقل الدولية. ويصف ملحق معالجة البيانات تدابير أمنية مثل التحكم في الوصول والتشفير وإجراءات الإبلاغ عن الحوادث.
قائمة المعالجات الفرعية (AWS، Cloudflare، Freshworks، إلخ). المعلومات متاحة للعموم، ويُتاح نظام إخطار للموردين الجدد. وتُضيف المؤسسة خيارات مثل المصادقة الموحدة (SSO) والاتفاقيات القوية. ورغم عدم تحديد شهادات مثل ISO أو SOC 2 في المعلومات المتاحة للعموم، إلا أن الشركة تُصرّ على عدم استخدام محتوى العملاء في أي تدريب دون موافقتهم.
بالنظر إلى كل ما سبق، يبرز Luma Ray 3 كواحد من أكثر المقترحات طموحًا في مجال الفيديو التوليدي: فهو يجمع بين الاستدلال متعدد الوسائط، وتقنية HDR ذات 16 بت، ووضع Draft عملي للغاية، ونظام بيئي يشمل الصور والفيديو والرسومات ثلاثية الأبعاد، بالإضافة إلى التكامل مع برامج عملاقة مثل Adobe Firefly. ليس هو الخيار الوحيد المتاح في السوق - إذ يلبي CapCut Web وPippit احتياجات معينة بشكل أفضل في مجال الصور الثابتة والرسومات المتحركة والمحتوى ذي العلامات التجارية - ولكنه يُعدّ من أكثر الخيارات شمولًا عندما تبحث عن... لإنشاء مشاهد ثلاثية الأبعاد متماسكة ومقاطع سينمائية بسرعة، مع الحفاظ على مستوى من الجودة كان يبدو حتى وقت قريب مقتصراً على الإنتاجات ذات الميزانيات الأكبر بكثير.