databelarebia
أدوات

تشغيل سيرفر vLLM على منصة Hugging Face Jobs بأمر واحد

·

# منصة Hugging Face خلات تشغيل سيرفر ذكاء اصطناعي بأمر واحد فقط

شركة Hugging Face أعلنات على ميزة جديدة كتخلي المطورين يشغلو سيرفر نماذج بأمر واحد فالـ command line، بدون ما يحتاجو لإعداد بيئة معقدة أو إدارة infrastructure يدوياً.


شنو هي الميزة الجديدة؟

الأداة الجديدة كتسمح للمطورين بتشغيل سيرفر يستعمل إطار عمل vLLM مباشرة فوق البنية التحتية ديال Hugging Face، وهادشي من خلال نظام يسمى Jobs. الأمر بسيط: سطر واحد فالـ terminal وعندك سيرفر كيشتغل فالسحاب.

الأداة مبنية على صورة Docker الرسمية `vllm/vllm-openai`، وكتسمح باختيار نوع GPU المطلوب عبر خيار `--flavor`، وكذلك تحديد البورت اللي غادي يكون متاح للعموم عبر `--expose`. مثلاً، تشغيل نموذج Qwen/Qwen3-4B على GPU من نوع a10g-large ما يحتاجش غير أمر واحد مباشر.


كيفاش كتخدم التقنية؟

المطور كيحتاج لثلاثة حاجات أساسية قبل ما يبدا:

- طريقة دفع أو رصيد إيجابي، لأن نظام Jobs كيتحاسب بالدقيقة حسب الـ hardware

- نسخة من مكتبة `huggingface_hub` بـ 1.20.0 أو أحدث

- تسجيل دخول محلي عبر أمر `hf auth login`

بعد الإعداد، الأمر الكامل كيشغل الـ container، كيحمل أوزان النموذج، وكيعطي للمطور URL عمومي مباشر. هاد الـ URL كيحتاج لـ token خاص بـ Hugging Face من أجل الوصول إليه، وهادشي كيضمن أمان الـ endpoint.


الفرق بين Jobs وInference Endpoints

منصة Hugging Face كتوضح بشكل صريح الفرق بين الحالتين:

نظام Jobs مخصص للاستعمال المؤقت: تيستينج، تيفاليواشن، أو توليد بيانات بكميات كبيرة. كيشتغل لمدة محددة، ومثلاً ممكن تحدد timeout ديال ساعتين.

أما Inference Endpoints فهي الحل المدار والجاهز للإنتاج الحقيقي، اللي كيحتاج availability مستمرة وإدارة أعمق للـ infrastructure.


التفاصيل التقنية

بعد إطلاق الأمر، النظام كيطبع ID خاص بكل job، وهاد الـ ID هو اللي كيتعامل معاه المطور فالأوامر الموالية. الـ URL النهائي كيكون بهاد الشكل: `https://<job_id>--8000.hf.jobs`. النظام كيحتاج بضع دقائق لتحميل الأوزان والإقلاع، وبعدها يكون السيرفر جاهز لاستقبال الطلبات.


خلاصة وتأثير على القطاع

هاد التطور كيبين توجهاً واضحاً نحو تبسيط الوصول لتشغيل نماذج اللغة الكبيرة. المطورون اللي كانو قبل محتاجين لإعداد بيئات معقدة وإدارة سيرفرات يدوياً، دابا يمكنهم إطلاق نماذج على hardware قوي بأقل جهد ممكن.

هاد النهج كيفتح الباب أمام فرق صغيرة أو أفراد باش يجربو ويقيمو النماذج بتكلفة محسوبة بالدقيقة بدون التزامات طويلة الأمد. التحول الأكبر اللي ممكن يتبدل هو أن الحاجز التقني والمادي لتشغيل نماذج ضخمة فالسحاب كيصغر بشكل ملحوظ، وهادشي ممكن يغير طريقة عمل فرق البحث والتطوير مع نماذج الذكاء الاصطناعي بشكل كامل.


مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية