بحث

شركة NVIDIA حققات أداء قياسي فبنشمارك الـ agentic coding الجديد

Miloud Belarebia · 2026-06-13

# معيار جديد لقياس أداء الـ AI Agents فالأنظمة الحديثة

شركة NVIDIA وباحثو Artificial Analysis طلقو معياراً جديداً كيقيس أداء أنظمة الذكاء الاصطناعي تحت ضغط المهام الوكيلية — وهاد المعيار اسمو **AA-AgentPerf**، وهو الأول من نوعه فالصناعة.

شنو هو معيار AA-AgentPerf؟

أداة AA-AgentPerf هي benchmark مفتوحة المصدر، صنعتها شركة Artificial Analysis، وكتقيس عدد الـ AI Agents اللي قادر يشتغل عليهم النظام فنفس الوقت — مع الحفاظ على مستوى أداء محدد مسبقاً. هاد المستوى كيتسمى **SLO** أو Service Level Objective، وكيشمل سرعة توليد الـ tokens وكذلك زمن الاستجابة الأولى اللي كيتسمى **TTFT** أو Time to First Token.

النتائج ديال هاد المعيار كتتحسب بشكل موحد — لكل مسرّع (accelerator) ولكل ميغاواط من الطاقة — باش يكون المقارنة عادلة بين مختلف الأجهزة والبنيات التحتية.

علاش الـ Agentic Workloads صعبة القياس؟

المشكل الأساسي هو طبيعة المهام الوكيلية نفسها. الـ AI Agents كيشتغلو بشكل غير حتمي — يعني كل مرة كيقدرو ياخدو قرارات مختلفة، ويستدعيو tools بترتيب متغير. هاد اللاحتمية (non-determinism) كانت أكبر عقبة في وجه أي قياس دقيق، لأنها كتخلي مسار الوكيل (agent trajectory) — يعني التسلسل الكامل ديال أفعاله وقراراته ومشاهداته — صعب التوقع والتمثيل.

معيار AA-AgentPerf جاء باش يحل هاد المشكل، عبر تطوير مسارات تمثيلية لمهام الكودينج الحقيقية ديال الـ AI Agents، وهاد المسارات هي اللي كيتبنى عليها القياس.

شنو قدمات NVIDIA فهاد الموضوع؟

شركة NVIDIA تبنّات هاد المعيار الجديد، وكشفات على أن التصميم المشترك المتطرف — اللي كيسميه "extreme co-design" — مكّنها من تحقيق أداء أحسن بـ **20 مرة** مقارنة مع الأجيال السابقة فمهام الكودينج الوكيلي. هاد الرقم كتقيسه تحديداً من خلال معيار AA-AgentPerf.

شنو كيعني هاد الخبر للقطاع؟

على مستوى الصناعة، ظهور معيار AA-AgentPerf كيملا فراغاً حقيقياً — لأن القطاع كان عندو مشكل حقيقي فغياب أي standard موحد لقياس الأداء تحت أحمال الـ AI Agents. دابا، لأول مرة، عندنا أداة مفتوحة ومتعددة الموردين كتقيس الأداء الحقيقي لهاد النوع من الأعباء.

على المدى القريب، ممكن يتبدل طريقة مقارنة الشركات للأجهزة والبنيات التحتية — من اعتماد معايير تقليدية مبنية على مهام بسيطة، إلى معايير كتعكس التعقيد الحقيقي ديال الأنظمة الوكيلية. وهاد التحول ممكن يؤثر على قرارات الشراء والاستثمار فبنية الـ inference داخل الشركات الكبيرة.

مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية