databelarebia
LLM

شركة Anthropic كتشارك تفاصيل جديدة حول حماية نموذج Fable 5 من الاختراقات

·

# شركة Anthropic كتحارب الـ Jailbreaks وحكومة أمريكا كتدخل للذكاء الاصطناعي

نموذج Fable 5 رجع للخدمة بحماية جديدة

شركة Anthropic أعادت تشغيل نموذجها Fable 5 وخلاتو متاح لجميع المستخدمين في كل أنحاء العالم. مع هاد العودة، شاركات الشركة تفاصيل إضافية على نوعين من الأشياء: الأول هو نظام الحماية من الاستخدامات الخطيرة في مجال الأمن السيبراني، والثاني هو إطار عمل جديد لتصنيف خطورة الـ jailbreaks على النماذج ديال الذكاء الاصطناعي.

شنو هي الـ Safety Classifiers ديال الشركة

النظام الجديد اللي طلقاتو شركة Anthropic كيتضمن أدوات تسمى safety classifiers — وهي أنظمة ذكاء اصطناعي كتشتغل جنب النموذج الرئيسي وكتكشف وكتمنع الاستخدامات الخطيرة أو اللي ممكن تكون خطيرة في مجال الأمن السيبراني. شركة Anthropic شاركات لائحة مفصلة بأنواع الأضرار اللي الـ classifiers هادو مصممين يمنعوها، وكذلك الأنواع اللي مصممين ما يمنعوهاش.

إطار تصنيف الـ Jailbreaks: مشكلة بلا حل موحد

الـ jailbreaks هي طرق غير عادية لبرمجة نموذج الذكاء الاصطناعي بشكل يخليه يتجاوز الحمايات ديالو، وبالتالي يقدر يدير أشياء ممنوعة كالمهام الخطيرة المرتبطة بالأمن السيبراني. المشكل اللي بينتو شركة Anthropic هو أن الـ jailbreaks ماشي كلها بنفس الخطورة: بعضها كيفتح غير سلوكيات بسيطة غير مرغوب فيها، وبعضها الآخر كيفتح مجموعة واسعة من المخرجات الخطيرة وكيخلي النموذج أكثر خطورة بكثير.

المشكل الأكبر هو أنه ما كاينش حتى إطار موحد كيوصف خطورة أي jailbreak بمصطلحات واضحة. شركة Anthropic، بتعاون مع شركاء Glasswing ديالها، كتعمل على إطار عمل مقترح لهاد الغرض — بحيث يقدر مطورو الذكاء الاصطناعي يتواصلو مع الحكومات بمصطلحات موحدة حول المخاطر اللي كيمثلها كل jailbreak. ما شاركاتو شركة Anthropic اليوم هو نسخة أولية، وهدفها إطلاق نقاش مع الجامعات والشركات والمجتمع المدني.

الحكومة الأمريكية كتدخل لنماذج الذكاء الاصطناعي

على صعيد آخر، منصة Amazon Bedrock أعلنات على توفير نماذج مفتوحة الأوزان في بيئة AWS GovCloud الخاصة بالحكومة الأمريكية، وهاد الشي يشمل نماذج NVIDIA Nemotron وكذلك نماذج OpenAI المفتوحة المصدر. الهدف هو تمكين الوكالات الحكومية والمقاولين اللي كيخدمو مع الدفاع والاستخبارات من استعمال نماذج متطورة، مع الحفاظ على متطلبات الأمن والامتثال وإقامة البيانات اللي ما يقدروش يتنازلو عليها.

خلاصة: شنو كيعني هاد الخبر للقطاع

هاد التطورات كتبين اتجاهين واضحين في قطاع الذكاء الاصطناعي. الأول هو أن شركات كبيرة بحال شركة Anthropic بدات تاخد مسؤولية أكبر في تصنيف المخاطر وتوحيد المصطلحات مع الحكومات — وهادا ممكن يفتح الباب لتنظيم أكثر وضوحاً في المستقبل. الثاني هو أن الطلب الحكومي على نماذج الذكاء الاصطناعي كيكبر، والشركات كتحاول تلبي هاد الطلب مع الحفاظ على معايير الأمن الصارمة. النتيجة المحتملة هي أن السنوات القادمة غادي تشهد ضغطاً أكبر على المطورين باش يوحدو طريقة تقييم المخاطر، خصوصاً في مجال الـ jailbreaks اللي بقا موضوع حساس بلا معايير دولية واضحة.


مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية