databelarebia
# نظام تدريب جديد كيعلم الذكاء الاصطناعي يخدم بحال بائع حقيقي فالمتجر الإلكتروني
فعالم التسوق الرقمي، الباحثون طلقو مشروع **Ecom-RLVE** — إطار عمل متخصص لتدريب وكلاء الذكاء الاصطناعي على مهام التجارة الإلكترونية بأسلوب قائم على التعزيز والتحقق.
إطار **Ecom-RLVE** هو امتداد لنظام **RLVE** الأصلي، اللي كان متخصص فالألغاز ذات الخطوة الواحدة. المشروع الجديد كيوسع هذا النهج ليشمل محادثات متعددة الخطوات مع أدوات خارجية، وهذا مناسب أكثر للتجارة الإلكترونية الحقيقية.
الفريق بنا ما سماه **EcomRLVE-GYM** — بيئة تدريب تحتوي على **8 سيناريوهات قابلة للتحقق**:
- اكتشاف المنتجات
- إيجاد البدائل
- بناء السلة
- معالجة الإرجاع
- تتبع الطلبات
- الأسئلة حول السياسات
- تخطيط الباقات
- الرحلات متعددة النوايا
الباحثون شرحو المشكل الأساسي: النماذج اللغوية الكبيرة قادرة على الكلام بطلاقة، لكن الطلاقة وحدها ما كتعنيش إتمام المهمة. زبون كيطلب "شارجر USB-C بأقل من 25 دولار يوصل خلال يومين" — محتاج وكيل يدير بحث حقيقي فالكتالوج، يفلتر على ثلاثة شروط صارمة، وما يخترعش معرفات منتجات ما شافها ف الحياة.
التدريب الكلاسيكي بالأمثلة **SFT** يقدر يعلم استخدام الأدوات بشكل سطحي، لكنه ما يقدرش يغطي الحالات اللانهائية الممكنة: الحوارات الناقصة المعلومات، وسير العمل المعقد في التجارة الرقمية.
النظام كيعتمد على **منهج صعوبة تكيفية** بـ 12 محورا — كيبدا بمهام بسيطة وكيزيد الصعوبة تدريجيا حسب أداء النموذج. المكافآت **algorithmically verifiable** — يعني النظام كيتحقق بشكل آلي إذا الوكيل حل المهمة صح أم لا.
الفريق درب نموذج **Qwen 3 8B** باستخدام تقنية **DAPO** على مدى **300 خطوة**، وقدم نتائج أولية تبين أن توسيع البيئات والصعوبة التكيفية كيتحول لإتمام حقيقي للمهام.
المشروع خرج من **PyTorch OpenEnv Hackathon**، ولازال فمرحلة التطوير. الفريق صرح أن النتائج الحالية أولية، وأن التحديثات مستمرة.
هاد المشروع كيبين اتجاه واضح فالقطاع: الانتقال من نماذج لغوية عامة إلى وكلاء متخصصين بالتحقق من الأداء. فقطاع التجارة الإلكترونية، اللي تقدر فيه الأخطاء تكون مكلفة — هلاكة منتج غلط، أو طلب ما يتتبعش — هاد النهج المبني على المكافأة القابلة للتحقق ممكن يبدل طريقة بناء المساعدين الرقميين للمتاجر.
مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية
مشروع ديال 2PiData