تيك

منصة NVIDIA Vera Rubin كتحل مشكل التوسع فالذكاء الاصطناعي

Miloud Belarebia · 2026-05-16

# منصة NVIDIA Vera Rubin: قفزة تقنية فخدمة الـ AI Agents

شنو هو المشكل اللي كانت كاتحل؟

منصة الـ agentic AI غيرات بشكل جذري الطريقة اللي كيشتغل بها الـ inference. خلافاً للنماذج التقليدية، الـ AI agents كيتبعو مسارات غير محددة مسبقاً — كيقرروا، كيلاحظوا، وكيتصرفوا بشكل ديناميكي. هاد الطريقة كتولد مئات الطلبات فالجلسة الواحدة، وكتراكم الـ latency بشكل متسلسل حتى يصير الأداء بطيئاً وغير مقبول فالتطبيقات الحقيقية.

المشكل الأكبر هو أن قنوات الـ networking التقليدية فمراكز البيانات صُممت أصلاً لمهام التدريب الكبيرة، أين كاين هامش للتسامح مع بعض التأخيرات. لكن فخدمات الـ AI premium، أي اهتزاز فالشبكة كيظهر مباشرة للمستخدم وكيخرب التجربة بأكملها.

الحل: تصميم مشترك بين الـ Hardware والـ Software

شركة NVIDIA قدمات منصة Vera Rubin كجواب شامل على هاد التحدي. القلب ديالها هو معالج NVIDIA Vera Rubin NVL72، اللي صُمم خصيصاً ليتحمل العبء الأكبر من عمليات الـ inference. الميزة الأساسية ديال هاد المنصة هي ما تسميه NVIDIA بـ "extreme co-design" — يعني تصميم متكامل بين الـ compute والشبكة والـ software فنفس الوقت.

فالجانب العملي، الشركة جمعات بين معالج NVIDIA Vera Rubin NVL72 وشريحة NVIDIA Groq 3 LPX، واللي وصفاتهم كأول حل قادر على تقديم كلٍ من الـ high throughput والـ low latency معاً فنفس الوقت. هاد الجمع كيستهدف تحديداً نماذج الـ MoE اللي عندها تريليون parameter مع نوافذ context طويلة — وهي النماذج الأكثر طلباً فالسوق دابا.

الـ Voice Agents: تحدي آخر فمستوى آخر

فجانب مختلف من نفس المجال، شركة AWS نشرات تفاصيل تقنية على كيفية بناء الـ voice agents فالوقت الحقيقي. التحدي هنا مختلف: خاصك تنسق بين نماذج الكلام، تدير الـ audio streaming بـ latency منخفض، وتضمن تجربة موحدة على الويب والموبايل والكمبيوتر معاً.

الحل جاء من خلال دمج إطار عمل Stream Vision Agents المفتوح المصدر مع خدمة Amazon Bedrock ونموذج Amazon Nova 2 Sonic. الهدف المُعلن هو تمكين المطورين من بناء تطبيقات صوتية جاهزة للإنتاج فدقائق معدودة.

أرقام وتفاصيل تقنية

المنصة ديال NVIDIA مصممة لتشتغل على مئات إلى آلاف الـ chips فنفس الوقت. النقطة الجوهرية اللي كتميزها هي الـ deterministic execution — يعني الأداء كيبقى ثابتاً ومتوقعاً حتى تحت الضغط الشديد، وهاد الشيء كان مشكلاً حقيقياً فالمنصات السابقة.

فالسوق، هاد النوع من الـ workloads ما كانش يُخدَم بشكل اقتصادي قبل هاد الإعلان — حسب ما صرحت به شركة NVIDIA بشكل صريح.

خلاصة: شنو كيعني هاد الخبر للقطاع

هاد التطورات كتشير لمرحلة جديدة فبنية الـ AI infrastructure. القطاع كيتحول من التركيز على الـ training إلى التركيز على الـ inference، وخصوصاً الـ agentic inference اللي كتفرض متطلبات تقنية مختلفة كلياً. الشركات اللي بغات تبني تطبيقات AI حقيقية — سواء صوتية أو نصية أو متعددة الأنظمة — غادي تحتاج لـ infrastructure مختلف على اللي كان موجود قبل. التقارب بين حلول الـ hardware ديال NVIDIA وخدمات الـ cloud ديال AWS كيبين أن المعركة الحقيقية دابا هي فالـ latency والموثوقية، مو غير فالقدرة الحسابية.

مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية