# نموذج DiScoFormer: خطوة جديدة فمجال تقدير الكثافة والـ Score فالذكاء الاصطناعي
باحثون فمجال التعلم الآلي جاو بمقاربة جديدة اسمها **DiScoFormer**، وهي نموذج واحد كيقدر يحسب الكثافة والـ score فنفس الوقت، وهاد الأمر كيمثل تقدم ملحوظ فمجال تقدير التوزيعات الإحصائية.
شنو هو المشكل اللي DiScoFormer جاي يحل؟
فكثير ديال المسائل فالتعلم الآلي والعلوم، الهدف الأساسي واحد: عندك مجموعة ديال بيانات وخاصك تفهم التوزيع اللي جات منه. بمعنى آخر، تعرف أي قيم كثيرة وأي قيم نادرة. هاد المسألة كتتطلب تقدير شيئين أساسيين:
- **الكثافة (Density):** هي النسخة السلسة ديال الهيستوغرام — عالية فين البيانات متجمعة، ومنخفضة فين هي نادرة.
- **الـ Score:** هو gradient ديال log-density، وكيشير فالاتجاه اللي فيه الكثافة كترتفع بزاف. تحرك نقطة فاتجاه الـ score وغادي تمشي نحو منطقة أكثر احتمالاً.
علاش الـ Score مهم هكذا؟
نماذج الـ diffusion الجنراتيفية — وهي التكنولوجيا اللي كتشغل مولدات الصور ديال الذكاء الاصطناعي بحال **Stable Diffusion** و**DALL-E** — كتبدا من ضجيج عشوائي وكتتبع الـ score مرات ومرات باش تحول الضجيج لصورة واقعية. نفس الـ score كيشغل أيضاً الـ Bayesian sampling وسيمولاسيون الجزيئات المستعملة فمجالات بحال دراسة البلازما.
الأدوات الموجودة وحدودها
استخراج الكثافة والـ score من عينة محدودة مسألة صعيبة، والأدوات الحالية كتفرض trade-off بين القابلية للتعميم والدقة.
**أولاً — الـ KDE أو Kernel Density Estimation:** هاد الأسلوب الكلاسيكي كيحسب الكثافة انطلاقاً من النقاط القريبة من الموقع المدروس، وكلما كانت النقاط أكثر وأقرب، كلما ارتفعت الكثافة. الميزة ديالو أنه ما يحتاجش لتدريب وينطبق على أي توزيع. لكن المشكل أن دقته كتتراجع بشكل حاد كلما زاد عدد الأبعاد (الـ dimensionality).
**ثانياً — الـ Neural Score Matching:** هاد المقاربة العصبية كتعطي دقة أحسن فالأبعاد العالية، لكنها محدودة بالتوزيعات اللي تدربت عليها ومتعممتش بشكل كافي.
**نموذج DiScoFormer** جاي باش يجمع بين المزايا ديال الطرفين: نموذج واحد كيحسب الكثافة والـ score معاً، وكيشتغل على توزيعات مختلفة.
شنو كيعني هاد الخبر للقطاع؟
من الناحية التقنية، DiScoFormer كيمكن يبسط بزاف من الـ pipeline ديال أي نظام كيحتاج لتقدير التوزيعات — من مولدات الصور الذكية حتى الأبحاث العلمية فالفيزياء والبيولوجيا. إلا ثبتت نجاعته فالتطبيقات الكبرى، فممكن يقلل الحاجة لتطوير نماذج متخصصة لكل توزيع على حدة. هاد الأمر غادي يأثر بشكل مباشر على فرق البحث والشركات اللي كتشتغل على نماذج الـ diffusion والـ simulation العلمية.
مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية