databelarebia
LLM

شركة Google طلقات نموذج Gemini Omni الجديد لإنشاء الفيديوهات

·

# نموذج Gemini Omni الجديد وصل: الذكاء الاصطناعي كيولد فيديو من أي مدخل

شركة Google DeepMind أعلنات على نموذج جديد كلياً اسمو Gemini Omni، وهاد المرة المراهنة كانت على توليد الفيديو وتحريره بالكلام الطبيعي.


شنو هو Gemini Omni بالضبط؟

نموذج Gemini Omni مبني على أساس واحد: الجمع بين القدرة على الفهم والقدرة على الإبداع في آن واحد. النموذج الجديد يقبل كمدخلات الصور، الصوت، الفيديو، والنصوص مجتمعة، ويولد من كل هاذ المدخلات فيديو بجودة عالية مبني على المعرفة الحقيقية ديال النموذج بالعالم.

المنطق ديال الشركة واضح: منذ البداية، بنات شركة Google نموذج Gemini ليكون متعدد الوسائط أصلاً، وهاد الإصدار هو الخطوة الموالية في هاد المسار.


أول نموذج فالعيلة: إصدار Gemini Omni Flash

مزيد من التفاصيل وضحات أن أول نموذج يطلق من عيلة Omni هو Gemini Omni Flash، وهاد النموذج متاح دابا على تطبيق Gemini، وعلى أداة Google Flow، وكذلك على منصة YouTube Shorts للفيديوهات القصيرة.

فالمستقبل، الشركة خططات لدعم مخرجات من نوع آخر بحال الصور والصوت، وهاد الأمر لم يكن متاحاً في الإصدار الحالي.


تحرير الفيديو بالحوار: الميزة الرئيسية

الميزة اللي كتميز نموذج Gemini Omni على غيره هي إمكانية تحرير الفيديو عبر الحوار الطبيعي. كل تعليمة كتبني على اللي قبلها، والشخصيات كتبقى متسقة، والفيزياء داخل الفيديو كتحترم منطقها، والمشهد كيتذكر السياق كامل.

المستخدم يقدر يبدل شيئاً معيناً في الفيديو، أو يبدل كل شيء دفعة واحدة. مثال ذكرتو الشركة: أنت تقول للنموذج "خلي هاد التمثال مصنوع من الفقاعات"، والنموذج كيطبق هاد التعديل على الفيديو مباشرة.


سياق الإصدار: من أين جاء Omni؟

قبل هاد النموذج، أطلقات شركة Google مشروع Nano Banana اللي جاب ذكاء النموذج Gemini لتوليد الصور وتحريرها. ملايين من المستخدمين استعملوه لاسترجاع الصور القديمة، والتصميم من الرسومات اليدوية، وتجسيد الأفكار بصرياً. نموذج Gemini Omni جاء كخطوة موالية بعد هاد النجاح.


خلاصة: ماذا يعني هذا للقطاع؟

دخول شركة Google بنموذج Gemini Omni يعني أن حرب توليد الفيديو بالذكاء الاصطناعي دخلت مرحلة جديدة. المنافسون بحال Sora ديال شركة OpenAI أو Kling AI وغيرهم، سيجدون أمامهم منافساً مدمجاً داخل منظومة Google الكاملة من تطبيقات ومنصات.

الأهم من هاد كله هو ربط توليد الفيديو بالحوار الطبيعي — وهاد الشيء ممكن يبدل الطريقة اللي كيشتغل بيها المبدعون، صناع المحتوى، وحتى المسوّقون مع الفيديو بشكل جذري.


مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية