هشاشة البرومبتات: لماذا يفشل الذكاء الاصطناعي حين تغيّر كلمة واحدة؟
أبحاث حديثة تكشف أن أداء النماذج اللغوية يتذبذب بشدّة لمجرّد تغيير طفيف في صياغة البرومبت. ما أسباب هذه الهشاشة، وأين خطورتها، وكيف يخفّفها المطوّرون؟
صار التوجيه (Prompting) الواجهة الأساسية بين البشر والذكاء الاصطناعي التوليدي؛ نكتب طلبًا بلغة طبيعية، فيستجيب النموذج. لكن وراء هذه البساطة الظاهرة تكمن مشكلة تؤرّق الباحثين وتُربك المطوّرين: «هشاشة البرومبتات» (Prompt Fragility). فبرومبت ينجح اليوم قد يفشل غدًا لمجرّد تغيير كلمة بمرادفها، أو إعادة ترتيب جملة، أو تبديل صيغة التنسيق. وقد سلّطت موجة من الأبحاث الحديثة على منصّة arXiv الضوء على هذه الظاهرة، محذّرةً من أن هذه الهشاشة تحدّ من موثوقية النماذج في المجالات الحسّاسة.
ما المقصود بهشاشة البرومبت؟
هشاشة البرومبت تعني أن أداء النموذج يتذبذب بشكل كبير استجابةً لتغييرات طفيفة وغير دلالية في صياغة الطلب، أي تغييرات لا تمسّ المعنى المقصود. تخيّل أنك تسأل سؤالًا، ثم تعيد صياغته بكلمات مختلفة تحمل المعنى نفسه تمامًا، فتحصل على إجابة مختلفة كلّيًّا أو حتى خاطئة. هذا بالضبط جوهر المشكلة: النموذج حسّاس للشكل لا للمضمون وحده.
وتشمل أنواع هذه التغييرات استبدال كلمة بمرادفها، أو إدراج كلمات أو حذفها، أو إعادة ترتيب الجمل، أو حتى تغيير صيغة التنسيق كاستخدام نقاط بدل أرقام. والمفارقة أن بعض هذه التغييرات قد لا يلاحظه إنسان أصلًا، لكنه يكفي لزعزعة استقرار النموذج.
لماذا تحدث هذه الظاهرة؟
تشير الأبحاث إلى أن جذر المشكلة هو أن النماذج غالبًا «تفرط في التكيّف» (Overfitting) مع صيغ البرومبتات التي صادفتها أثناء التدريب، وتعتمد على إشارات سطحية بدل فهم دلالي أعمق. بعبارة أخرى، يتعلّم النموذج أحيانًا ربط صيغة معيّنة بنوع معيّن من الإجابات، فيتعثّر حين تتغيّر الصيغة وإن بقي المعنى ثابتًا. وهذا يكشف فجوة بين «مطابقة الأنماط» و«الفهم الحقيقي».
أين تكمن الخطورة؟
قد تبدو المسألة أكاديمية، لكن تبعاتها عملية وخطيرة في المجالات عالية المخاطر. ففي الرعاية الصحية مثلًا، أظهرت دراسة حديثة أن تغييرًا طفيفًا في صياغة سؤال طبّي قد يغيّر النصيحة السريرية، بل قد يجعل النموذج «يهلوس» أدوية عند إعادة الصياغة. في سياق كهذا، حيث الدقّة مسألة حياة، يصبح أيّ تذبذب غير مقبول. والأمر نفسه ينطبق على التعليم والحوكمة ودعم القرار العلمي، حيث تتطلّب الثقة في النموذج استقرارًا لا يتزعزع بتغيير كلمة.
اللافت أن الأبحاث تكشف نمطًا متّسقًا: تميل النماذج إلى الصمود أمام الاستبدالات البسيطة للكلمات وإعادة الصياغة، لكنها «تنهار» أكثر أمام إعادة الترتيب النحوي أو الإشارات السياقية المضلّلة. أي أن نوع التغيير يحدّد حجم الضرر.
ماذا يقترح الباحثون؟
لم تكتفِ الأبحاث بالتشخيص، بل قدّمت مقاربات للعلاج. من أبرزها فكرة «مزيج الصيغ» (Mixture of Formats)، وهي تقنية بسيطة تقترح تنويع أنماط الأمثلة المقدّمة للنموذج ضمن البرومبت بدل الالتزام بصيغة واحدة، بحيث لا يتعلّم النموذج ربط أسلوب بعينه بالإجابة الصحيحة. والفكرة مستلهمة من تقنيات الرؤية الحاسوبية التي تنوّع أنماط بيانات التدريب لمنع النموذج من الاعتماد على ملامح سطحية.
كما تتّجه أبحاث أخرى إلى بناء أطر منهجية «موجّهة للمتانة» (Robustness-oriented) لتحديد عدم الاستقرار وقياسه والتخفيف منه بشكل منظّم، إضافةً إلى استخدام التغييرات نفسها لتوليد أمثلة تدريبية تصحيحية تجعل النموذج أكثر مناعةً مستقبلًا.
دروس عملية للمطوّرين
إلى أن تنضج هذه الحلول، يستطيع المطوّر تقليل أثر الهشاشة بخطوات عملية. أوّلها اختبار البرومبت بعدّة صياغات مكافئة بدل الاكتفاء بواحدة، للتأكّد من ثبات النتيجة. وثانيها تثبيت صيغة التنسيق وتوثيقها بدقّة في الأنظمة الإنتاجية بدل تركها عشوائية. وثالثها، في المهام الحسّاسة، عدم الاعتماد على مخرجة واحدة، بل تشغيل النموذج عدّة مرّات والتحقّق من اتّساق النتائج. ورابعها، إبقاء المراجعة البشرية في الحلقة حين تكون الكلفة عالية، فلا يُسلَّم القرار النهائي لمخرجة قد تتغيّر بتغيير حرف.
خلاصة
هشاشة البرومبتات تذكّرنا بأن النماذج اللغوية، رغم قوّتها المذهلة، ما زالت تعالج اللغة بطريقة تختلف جوهريًّا عن فهم البشر. هي حسّاسة للشكل بقدر حساسيتها للمعنى، وهذا مصدر قوّتها وضعفها معًا. وبالنسبة للمطوّر، الدرس ليس التخلّي عن هذه الأدوات، بل التعامل معها بوعي: صياغة دقيقة، واختبار متعدّد، ومراجعة بشرية حيث يلزم. فمع نضوج أبحاث المتانة، يقترب اليوم الذي تصبح فيه استجابة النموذج رهينة المعنى وحده، لا رهينة الصياغة العابرة.
هل وجدت هذا المقال مفيدًا؟