في فضاءٍ معرفي يتّسم بتداخل القانون واللغة والتكنولوجيا، أحدثت دراسة MizanQA نقلة في فهم قدرات النماذج اللغوية الكبرى حين تُطبيق على السياق التشريعي المغربي. فبدون تبسيط المضمون أو تجميده، صمَّمَ الباحثون معيارا قانونيا خاصا بالمغرب، يضم أكثر من 1700 سؤال اختيار من متعدد، مزج بين العربية الفصحى، الفقه المالكي، العادات المغربية، والنصوص الفرنسية القانونية، ليكون مرآة لعُمق التشابك بين اللغة والحق في السياق الوطني.

وتستند الدراسة، التي أشرف عليها باحثون مغاربة في مجال الذكاء الاصطناعي والقانون، إلى تطوير معيار يحمل اسم MizanQA، كأول قاعدة بيانات مغربية موجّهة لاختبار قدرة النماذج اللغوية الكبرى على فهم واستيعاب الأسئلة القانونية بصيغة دقيقة. وقد تم استخراج محتوى هذه القاعدة من مصادر تشريعية رسمية كـ”بوابة الأمانة العامة للحكومة” و”البوابة القانونية للمملكة المغربية”، مع اعتماد تقنية “استخلاص السياق والإجابة” (Extractive Question Answering) لتكوين أكثر من 1600 زوج من الأسئلة والأجوبة القانونية ذات المرجعية المغربية الخالصة.

كما أوضح معدّو الدراسة أن معيار MizanQA ليس مجرد أداة تقنية؛ بل يشكّل محاولة لتقريب الذكاء الاصطناعي من روح القانون المغربي، بما في ذلك المصطلحات الخاصة بالمدونة الأسرية والعقار والقانون الجنائي وقوانين المرافعات، وهو ما يجعله مرجعا محتملا لاختبار جاهزية هذه النماذج في البيئات القانونية الناطقة بالعربية.

في جانب آخر من الدراسة ذاتها، تطرّق الباحثون إلى تقييم أداء عدد من النماذج اللغوية المعروفة، مثل GPT3.5 وGemma وMistral، عند التعامل مع قاعدة MizanQA، ليخلصوا إلى أن هذه النماذج، رغم كفاءتها العامة، تواجه صعوبات واضحة في فهم الصياغات القانونية الدقيقة باللغة العربية الفصحى، خصوصا حين يتعلق الأمر بالسياق المغربي المحدد.

وقد كشفت النتائج أن أداء هذه النماذج يتراجع بشكل ملحوظ عندما تُطرح عليها أسئلة مستخرجة من قوانين مغربية بصياغات تقنية؛ مما يبرز التحدي القائم بين تعميم الذكاء الاصطناعي وقدرته على الاندماج الفعلي في بيئات قانونية محلية ومعقدة.

وترى الدراسة أن سدّ هذه الفجوة لا يتم فقط بتدريب النماذج على نصوص قانونية؛ بل يتطلب إدماج حساسيات السياق التشريعي المغربي ومفرداته الخاصة، داعية إلى تطوير نماذج لغوية موجهة قُطريا، تأخذ بعين الاعتبار الخصوصيات القانونية واللغوية لكل بلد.

في القسم التجريبي من الدراسة، استند الفريق البحثي إلى قاعدة بيانات MizanQA، وهي مجموعة مخصصة لأسئلة وأجوبة قانونية باللغة العربية، صُممت بعناية لاختبار مدى قدرة نماذج الذكاء الاصطناعي على معالجة النصوص ذات البنية القانونية المركبة. وقد استُخرجت الأسئلة من تشريعات مغربية نافذة، من بينها القانون الجنائي وقانون الالتزامات والعقود، بما يضمن محاكاة دقيقة لسيناريوهات قانونية واقعية.

ولتحقيق هذا الغرض، تم توظيف نماذج لغوية متقدمة، مثل جي بي تي 3.5 وجيما 7 بي وميسترال، حيث أُخضعت لاختبارات دقيقة تناولت فهم المصطلحات وتأويل النصوص القانونية وربط المفاهيم ضمن سياق تشريعي مغربي. وقد جرى تقييم الأداء بناء على دقة الإجابات وملاءمتها للسياق المحلي.

وكشفت النتائج أن هذه النماذج تؤدي أداء جيدا عند التعامل مع الأسئلة المباشرة؛ لكنها تتعثر أمام القضايا التي تستدعي استدلالا معمقا أو تأويلا لمفاهيم قانونية نادرة الاستخدام، ما يبرز الحاجة إلى تدريب مكيّف يأخذ بعين الاعتبار الخصوصيات القانونية الوطنية.

المصدر: هسبريس

شاركها.