LLM

نموذج DiffusionGemma الجديد كيولد النصوص بسرعة 4 مرات أكثر

Miloud Belarebia · 2026-06-11

# نموذج DiffusionGemma الجديد كيولد النصوص بسرعة 4 مرات أسرع من المعتاد

شركة Google DeepMind خرجات نموذجاً تجريبياً جديداً اسمه DiffusionGemma، وهو نموذج مفتوح المصدر كيستعمل تقنية text diffusion بدل الطريقة التقليدية ديال توليد النصوص. هاد النموذج متاح تحت رخصة Apache 2.0، ومبني على بنية Mixture of Experts بـ 26 مليار باراميتر.

الفرق الكبير مع النماذج التقليدية

النماذج التقليدية اللي كنعرفوها، بحال نماذج autoregressive، كتولد الكلام token بـ token — يعني واحدة واحدة. أما نموذج DiffusionGemma الجديد فكيولد بلوكات كاملة من النص فنفس الوقت، وهاد الشي هو اللي كيخليه يوصل لسرعة أعلى بـ 4 مرات فالـ GPUs مقارنة بالنماذج التقليدية.

الفرق التقني الأساسي هو أن النماذج التقليدية معطلة بسبب memory bandwidth، بينما نموذج DiffusionGemma الجديد كيحول هاد الـ bottleneck نحو الـ compute، وهاد الشي كيخلي الـ GPUs تخدم بشكل أكثر كفاءة.

أرقام السرعة على مختلف الأجهزة

الأرقام اللي خرجت مع إطلاق نموذج DiffusionGemma الجديد كاتاليو:

- فوق الـ 1000 token في الثانية على كارت واحد من نوع NVIDIA H100

- فوق الـ 700 token في الثانية على كارت NVIDIA GeForce RTX 5090

- حتى 2000 token في الثانية على منصة NVIDIA DGX Station

- حوالي 150 token في الثانية على منصة NVIDIA DGX Spark

هاد الأرقام خرجات مع تحسينات خاصة طوّرتها شركة NVIDIA باش يشتغل النموذج بشكل فعال على منصاتها المختلفة.

الكيفاش كيشتغل ونظام denoising

النموذج كيستعمل تقنية diffusion-based denoising باش يولد 256 token فنفس الوقت فكل خطوة. هاد الأسلوب مشابه لطريقة توليد الصور بالـ diffusion، ولكن مكيف باش يشتغل مع النصوص. نموذج DiffusionGemma الجديد مبني على نفس البنية ديال Gemma 4 ومستفيد من أبحاث Gemini Diffusion.

لمن هاد النموذج؟

شركة Google DeepMind وضحات أن نموذج DiffusionGemma الجديد مو بديل للنماذج autoregressive اللي كتستعملها فالإنتاج — هادو مازالو الأفضل فجودة الناتج. النموذج الجديد مصمم أساساً للباحثين والمطورين اللي كيحتاجو سرعة فالحالات التالية:

- تطبيقات التفاعل اللحظي مع الذكاء الاصطناعي

- أنظمة copilot والمساعدين الفوريين

- سير عمل agentic

- التعديل المباشر على النصوص inline editing

- توليد هياكل نصية غير خطية

خلاصة وتداعيات على القطاع

هاد الإطلاق كيبين أن ميدان تسريع توليد النصوص دخل مرحلة جديدة. المقاربة ديال text diffusion، اللي كانت محدودة فالصور، واصلات دابا لمجال النصوص بنتائج ملموسة.

بالنسبة للقطاع، هاد التوجه ممكن يغير معادلة تكاليف خدمة النماذج فالتطبيقات اللي كتحتاج استجابة فورية. تطبيقات chatbot والـ copilot والـ agentic workflows كتعاني من مشكل الـ latency — ونموذج DiffusionGemma الجديد كيقدم حلاً تقنياً مباشراً. التحدي اللي باقي هو مسألة جودة الناتج مقارنة بالنماذج autoregressive التقليدية، وهاد الشي هو اللي ممكن يحدد إلى أي حد راح ينتشر هاد النهج فالتطبيقات الحقيقية.

مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية