databelarebia
خبر

صحفي Atlantic بنى قاعدة بيانات للموسيقى المستخدمة في تدريب الذكاء الاصطناعي

·

# ملايين الأغاني كتتستعمل باش تتدرب نماذج الذكاء الاصطناعي

شنو اكتشف الصحافي ديال Atlantic؟

صحافي Atlantic المسمى Alex Reisner كشف على أربع مجموعات بيانات ديال موسيقى كتتستعمل باش تتدرب نماذج الذكاء الاصطناعي، وخلاهم متاحين للعموم بشكل قابل للبحث. مجموعتين من هاد الـ datasets كبيرات بزاف — واحدة فيهم فيها 12 مليون أغنية والثانية فيها 9 ملايين أغنية. المجموعتين اللواتيين بقاو صغيرتين بالمقارنة، مع هاكا كيجوز كل واحدة منهم المية ألف أغنية.

شكون كيستعمل هاد البيانات؟

مش ممكن نعرفو بالضبط شكون كيستعمل هاد الـ datasets، حيت تحميلهم الآلاف ديال المرات. مع هاكا، شركة Google وشركة Stability كلتاهوم صرحاتو بأنهم استعملو هاد البيانات، وهاد الشي جا مذكور فالورقات البحثية ديالهم.

الإشكالية القانونية والتقنية

بعض المصادر، بحال مجموعة بيانات Free Music Archive، متاحة للبث المجاني للاستخدام الشخصي فقط — أما الاستخدام التجاري فكيحتاج ترخيص خاص. والمشكلة التقنية كاينة هي أن ثلاثة من هاد الـ datasets الأربعة مش بزاف تحميل بسيط — كتجي على شكل قوائم لينكات من منصتي YouTube وSpotify المعروفتين.

المطورون كيستعملو أدوات تقنية خاصة باش يحملو الأوديو الحقيقي، وبعض هاد الأدوات كتقدر تتجاوز تسجيل الدخول والإعلانات والميكانيزمات اللي كتولد الدخل أو المشتركين للفنانين. Reisner صرح بأن هاد النوع من الأدوات كيخالف شروط الاستخدام ديال هاد المنصات.

الأثر على الفنانين والمنصات

هاد الطريقة فالتدريب كتطرح سؤال مزدوج: الأول قانوني يتعلق بالترخيص التجاري، والثاني أخلاقي يتعلق بتجاوز الأنظمة اللي أصلاً كتضمن عائد مالي للفنانين. المنصات الكبيرة بحال YouTube وSpotify عندهم شروط صريحة تمنع هاد النوع من الاستخدام الآلي، لكن تطبيق هاد الشروط ظاهر صعيب من الناحية العملية.

خلاصة وتأثير على القطاع

هاد الكشف كيسلط الضوء على إشكالية بنيوية كبيرة فصناعة الذكاء الاصطناعي: الفجوة اللي كاينة بين التقنية المتاحة وما هو مسموح به قانونياً وأخلاقياً. الجهة اللي صنعات هاد الـ datasets متاحة للبحث كتسمح للفنانين يشوفو واش موسيقاهم كاينة فيهم ولا لا. هاد الخطوة ممكن تحرك دعاوى قضائية جديدة أو تزيد الضغط على الشركات الكبيرة باش تفرض شفافية أكثر حول البيانات المستعملة فالتدريب. كذلك ممكن تدفع المنصات الكبيرة باش تشدد الرقابة التقنية على الأدوات اللي كتتجاوز الأنظمة ديالهم.


مقال من databelarebia — نشرة يومية ديال أخبار الذكاء الاصطناعي بالدارجة المغربية