# نموذج DeepSeek-V4 الجديد: مليون توكن للأعمال ديال الـ Agents
المشكلة اللي كانت موجودة
كل واحد خدم مع نماذج الذكاء الاصطناعي فمهام طويلة عارف المشكلة: النموذج كيوقف، تعاود تسألو، الـ context كيكبر حتى يملا الذاكرة، والـ GPU كيخلص. هاد المشاكل مو حوادث عشوائية — هي أخطاء معروفة ومتوقعة فكل مشروع كيستعمل الـ agents فمهام معقدة.
فريق DeepSeek بنا النموذج الجديد DeepSeek-V4 بالضبط باش يحل هاد الإشكاليات، مو غير يزيد سعة الـ context.
شنو هو الفرق مع نافذة مليون توكن
نافذة ديال مليون توكن هي غير سعة — ماشي performance. المشكلة الحقيقية هي الثمن ديال كل forward pass وانت فهاد العمق. كل tool result كيتضاف للـ context، وكل token جديد خاصو يحسب الـ attention ضد كل اللي جا قبلو.
رقمان مهمين هنا: عدد الـ FLOPs فكل inference، وحجم الـ KV cache فالذاكرة. كلاهم كيكبر مع الـ sequence. فالمقارنة بين نموذج DeepSeek-V4-Pro ونموذج DeepSeek-V3.2 السابق، النموذج الجديد محتاج غير **27% من الـ FLOPs** — يعني أسرع بكثير على نفس الـ hardware. وكمان يستهلك غير **10% من حجم الـ KV cache**.
نسخة Flash: أرقام أقوى
النسخة الثانية DeepSeek-V4-Flash كتحط الأرقام أكتر: **10% من الـ FLOPs** و **7% من حجم الـ KV cache** — هادي نقلة كبيرة فالكفاءة مقارنة بالأجيال السابقة.
التدريب الخاص بالـ Agents
مو غير الـ architecture اللي تبدلت — حتى مرحلة الـ post-training تبدلت. فريق DeepSeek دار قرارات خاصة بمهام الـ agents: المهام الطويلة ديال الـ tool-use، وجلسات البراوزينغ، وسيشنات الترمينال اللي فيها مئات الأوامر. هاد التدريب مصمم باش النموذج يبقى consistent ومفيد حتى فآخر الـ trace الطويلة.
المشاكل اللي كانت تظهر قبل — بحال النموذج يدي بحال ما كمل المهمة، ولا يتدهور أداءه فنص المهمة — هاد القرارات فالتدريب هي اللي مصممة تحلها.
شنو يعني هاد الخبر للقطاع
على المستوى التقني، نموذج DeepSeek-V4 كيبين اتجاه واضح: الجيل الجاي من النماذج مو رح يتنافس غير على الـ benchmark scores، بل على الكفاءة فالاستخدام الحقيقي فمهام الـ agentic الطويلة. التخفيض الكبير فالـ FLOPs والـ KV cache كيفتح الباب باش تشغل نماذج frontier على hardware أصغر وبتكلفة أقل.
على المستوى الأوسع، هاد النهج ممكن يتأثر بيه الـ open-source community بأكملها — لأن DeepSeek صرح صراحة أنو V4 مصمم باش "يوجه المجتمع" لنفس الاتجاه فتطوير النماذج المستقبلية.
مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية