محاذاة الذكاء الاصطناعي
توافقية الذكاء الاصطناعي تمثل تحدياً نحو الأهداف والقيم المطلوبة منه من قبل البشر، ومنعه من اتخاذ قرارات ضارة أو غير متوقعة أثناء تحقيقه الأهداف.
هناك قانون لغودهارت: “عندما يصبح المقياس هدفاً، يفقد صلاحيته كمقياس”.
بمعنى أنه عند ربط المكافأة برقم معين، سيفعل الناس أي شيء لتحسين هذا الرقم بغض النظر عن الطريقة، مثل: الطلاب يدخلون الامتحان لتحقيق النجاح (درجة النجاح)، وبعضهم لا يلتزم بالقانون ويغش لتحقيق الهدف (النجاح).
وكذا الحال مع الذكاء الاصطناعي، حيث يعاني من مشاكل عدم المحاذاة الداخلية والخارجية، مثلاً: إعطاؤه مهمة اختبار صحة الكود البرمجي، ثم يقوم بتعديل ملف الاختبار ومسح الكود بحيث عند الاختبار ينجح، حتى لو لم يكتب شيئًا. وثانياً، هدفه فلترة الرسائل العشوائية من البريد الإلكتروني، فيحذف العشوائية والنظامي، وبالنتيجة يصبح عدد الرسائل العشوائية صفرًا، ويحقق الهدف من إزالة العشوائية، إلا أنه يُحذف الشخصية أيضاً!
هناك حلول، لكنها ليست كاملة؛ إنما كل جزء يحد من مشكلة معينة وليس حلاً لها. وفي هذه الحلول أيضاً توجد مشكلة، ستكون مبينة مع المشاكل والأفكار التي قد تحد منها.
أولاً: تعدد اللغات (الثقافات) في تدريب النموذج، يؤدي إلى دائرة التوافق (Alignment Circuit) مختلفة بالنسبة للغات، وهذا غير صحيح، ولعل أحد الأسباب هو تدريب RL فقط للغة الإنجليزية. حل مقترح: أولاً، التفكير البشري لا يكون على مستوى الكلام، وقد ثبت ذلك في بحث علمي منشور. ثانياً، تدريب نموذج على لغة واحدة قد يكون أفضل حل لمثل هذه المشكلة، رغم وجود فجوة التوافق (alignment gap)، إلا أنه ليس صحيحًا، إذ إن التفكير الصحيح لا علاقة له باللغة، إنما بالمنطق.
ثانياً: الغش في الهدف والمكافأة. هذا الخطأ يتكرر، وأهم أسبابه هو خوارزمية الـ RL نفسها، لأن فكرتها هي الحصول على قيمة مكافأة عالية بغض النظر عن الخطوات المتخذة، كما بيَّن المثال السابق. المفروض البحث أكثر عن إمكانية حل هذه المشكلة أو إضافة إمكانيات مختلفة مثل الself-supervised.
ثالثاً: مشكلة الرفض مقابل إعطاء البدائل، وهذه الحالة موجودة أيضاً عند البشر، فعند السؤال: مثلا لا تفكر في الباب، مباشرة الدماغ يفكر بالباب. يمكن تطبيق هذا المفهوم مع الذكاء الاصطناعي في (Constitutional AI).
رابعاً: تغير الجواب كل مرة بسبب مبدأ الBatch Variance الذي يُحسب عن طريق الـ GPU ويكون متغيراً بالإضافة إلى الـ sample إذا تم تغييره. الحل المتاح هو الاستنتاج الحتمي (Deterministic Inference)، وعدم التغير في الـ Batch (Batch Invariant).
ولعل هذه الأفكار أو الحلول مرتبطة مع بعضها، بحيث قد نحصل على نموذج أقل ضرراً ومتوافق مع أهدافنا.
وقد نعود إلى نقطة الأصل: ما معنى المحاذاة؟ وهل هي مع الأهداف، أي أهداف؟ وعلى ماذا تعتمد؟ هل على قوانين دولة أو شركة، وهل ينفع البشر كلهم؟ وفي هذا نحتاج إلى بحث أكثر وإعطاء قوانين كما للروبوتات كم ذكرها اسحاق اسيموف.Robotics Laws
