دراسة تحذر: ChatGPT و Gemini يحملان تحيزات جنسية وعرقية ودينية

أفادت دراسة جديدة بأن برنامجي ChatGPT وGemini عرضة لتوليد استجابات متحيزة، حيث قام فريق من الباحثين بجمع بيانات المشاركين الذين كُلفوا بتصميم حوافز يمكنها تجاوز معايير الأمان في نموذج الذكاء الاصطناعي، وقد قدّم ما يصل إلى 53 دافعًا نتائج قابلة للتكرار فيما يتعلق بالتحيز، في حين تم اختبار ثمانية نماذج ذكاء اصطناعي مختلفة للكشف عن التحيز، وُجد أن ChatGPT وGemini هما الأكثر عرضة له، والجدير بالذكر أن نموذجي Gemini وGPT اللذين اختبرهما الباحثون لم يعودا النموذجين الرائدين اللذين تقدمهما الشركة.

ChatGPT وGemini يُولّدان استجابات متحيزة

أجرت مجموعة من الباحثين في جامعة ولاية بنسلفانيا، تجربةً لمعرفة ما إذا كان من الممكن خداع نموذج ذكاء اصطناعي لتوليد استجابات متحيزة دون محاولة إدخال حوافز معقدة، نُشرت منهجياتهم ونتائجهم في وقائع المؤتمر الثامن للجمعية الأمريكية للذكاء الاصطناعي (AAAI) وجمعية آلات الحوسبة (ACM) حول الذكاء الاصطناعي والأخلاق والمجتمع.

وأُجريت الدراسة عام 2024، مما يعني أنها قد تشمل نماذج رائدة في ذلك الوقت، تشمل النماذج الثمانية التي تم اختبارها Llama 2 و3 و3،1؛ وQwen وQwen 2؛ وGemma وGemma 2؛ وGemini 1،5 Flash؛ وGPT-4o-mini، والجدير بالذكر أن روبوت الدردشة Gemini يعمل حاليًا بعائلة 2،5، بينما يعمل ChatGPT بعائلة GPT-5 (افتراضيًا).

ولإجراء التجربة، استضاف الباحثون فعالية "Bias-a-Thon"، حيث طُلب من 52 فردًا تصميم وإرسال لقطات شاشة لمطالبات واستجابات الذكاء الاصطناعي على جميع هذه النماذج، كما طُلب منهم تقديم شرح للتحيز أو الصورة النمطية التي حددوها في الاستجابة، ولتوحيد تعريف التحيز، أُجريت مقابلات مع مجموعة فرعية من المشاركين لفهم تعريفهم له، ووجدوا أن جميع التعريفات تضمنت مفاهيم نقص التمثيل، والصور النمطية، والتحيز، والتفضيلات غير المبررة، كما تعرفوا على الاستراتيجيات التي خطط المشاركون لاستخدامها.

واستُخدمت سبع استراتيجيات إجمالاً، بما في ذلك تمثيل الأدوار، والسيناريوهات الافتراضية، وطرح أسئلة حول مواضيع محددة، واستخدام أسئلة توجيهية حول مواضيع مثيرة للجدل، واستكشاف التحيزات في الفئات غير الممثلة تمثيلاً كافياً، وتزويد نموذج الذكاء الاصطناعي بمعلومات مضللة، وتأطير المهمة على أنها ذات غرض بحثي.

وأفادت الدراسة بأن التحيزات التي أظهرتها نماذج الذكاء الاصطناعي تندرج ضمن ثماني فئات وهم التحيز الجنسي، والعرقي، والديني، والعمري، والإعاقة، واللغوي، والتاريخي، والثقافي، والسياسي.

دراسة تحذر: ChatGPT و Gemini يحملان تحيزات جنسية وعرقية ودينية - الأول نيوز

ChatGPT وGemini يُولّدان استجابات متحيزة

0 تعليق