كشف مركز أبحاث دولي مرموق عن تطوير معيار تجريبي جديد يهدف إلى قياس قدرة نماذج الذكاء الاصطناعي العالمية على فهم السياقات الثقافية واللغوية العربية. تأتي هذه المبادرة لسد فجوة ملحوظة في أداء التقنيات الحالية، خاصة في ظل تزايد اعتماد الأفراد والمؤسسات على الذكاء الاصطناعي في الإمارات، حيث تشير تقديرات إلى أن حوالي 80% من الموظفين يستخدمون هذه الأدوات بانتظام. يعكس هذا الانتشار الواسع الحاجة الملحة لتطوير نماذج أكثر استيعابًا للمعايير والمفاهيم المحلية، لضمان فاعليتها ودقتها.

وقد أبرزت طالبة دكتوراه في معالجة اللغة الطبيعية بجامعة محمد بن زايد للذكاء الاصطناعي، كريمة قضوي، أن المعيار البحثي الجديد يسلط الضوء على ثغرة أساسية تتمثل في افتقار النماذج الحالية للفهم العميق للعناصر الثقافية العربية في سياق المحتوى المرئي. فبينما تنجح هذه النماذج في التعرف على الأشياء والأشخاص، فإنها غالباً ما تواجه صعوبة في استيعاب المعاني الاجتماعية والثقافية الكامنة وراء هذه العناصر.

معيار “جيم”: فهم أعمق للسياقات الثقافية واللهجات العربية

وذكرت قضوي في تصريح لـ”الإمارات اليوم” أن الجامعة طورت معياراً بحثياً جديداً أطلقت عليه اسم “جيم”، وهو اسم مستوحى من الحرف العربي الذي يمثل كلمة “جواب” في سياق مهام السؤال والجواب. يهدف هذا المعيار إلى تقييم دقة نماذج الذكاء الاصطناعي في فهم الصور داخل سياقات ثقافية عربية متنوعة، تغطي أربع دول هي: الإمارات، والأردن، ومصر، والمغرب. ويركز “جيم” بشكل خاص على اللهجات العامية المستخدمة في الحياة اليومية، وليس فقط على اللغة العربية الفصحى.

يعتمد معيار “جيم” على ركيزتين أساسيتين: الأولى تتمثل في وصف الصور، والثانية في الإجابة عن أسئلة مرتبطة بها. وتم بناء هذا المعيار باستخدام صور تمثل البيئة المحلية، إلى جانب مساهمات من متحدثين أصليين للغة العربية، مما يمنحه دقة ثقافية وواقعية عالية.

تحديات متعددة لنماذج الذكاء الاصطناعي العربية

أظهرت النتائج الأولية لاختبار ستة نماذج عربية رائدة باستخدام معيار “جيم” تباينًا كبيرًا في مستوى الأداء. وكشفت الدراسة عن أربعة تحديات رئيسية تواجه هذه النماذج، أولها ضعف الألفة الثقافية بخصوص المحتوى العربي، وثانيها محدودية دعم اللهجات العامية. أما التحدي الثالث فيتمثل في الوقوع في أخطاء عند التعرف على محتوى الصور، والرابع يتعلق بجودة النصوص التي تنتجها هذه النماذج.

وتشير النتائج بشكل مثير للقلق إلى أن أربعة من أصل ستة نماذج تم تقييمها لا تجيد استخدام أي لهجة عامية، وتعتمد بشكل حصري على اللغة العربية الفصحى في توليد نصوصها، حتى عندما يكون السياق يتطلب استخدام لهجات عامية. تعكس هذه النتائج تحديًا أوسع نطاقًا يواجه تطوير الذكاء الاصطناعي متعدد اللغات.

ضرورة فهم التنوع اللغوي والثقافي

أكد الباحثون المشاركون في هذه الدراسة أن اللغة العربية ليست كيانًا واحدًا موحدًا، بل هي نظام معقد وغني باللهجات والسياقات المتنوعة. لذلك، يتطلب بناء نماذج ذكاء اصطناعي فعالة فهمًا عميقًا لهذا التنوع اللغوي والثقافي، وهو ما سيؤدي إلى تطوير نماذج أكثر تخصصًا ودقة.

ويرى الباحثون أن معيار “جيم” يمثل أداة تشخيصية هامة لتحديد نقاط الضعف في النماذج الحالية، ولكنه لا يقدم حلولاً نهائية. وبدلاً من ذلك، فإنه يوجه الجهود البحثية والتطويرية نحو بناء أنظمة ذكاء اصطناعي تتمتع بقدرة أكبر على استيعاب السياقات المحلية وفهمها.

مستقبل الذكاء الاصطناعي: ما وراء الوصف

مع تزايد الاعتماد على تقنيات الذكاء الاصطناعي في قطاعات حيوية مثل التعليم، والرعاية الصحية، والخدمات الرقمية، تكتسب هذه الأبحاث أهمية قصوى لضمان تقديم حلول تقنية دقيقة ومناسبة للمجتمعات المستهدفة. يؤكد الباحثون أن التحدي المستقبلي لا يقتصر على قدرة النماذج على وصف محتوى الصور، بل يمتد ليشمل فهمًا أعمق وأشمل للثقافة والسياق. هذا الفهم هو ما سيشكل معيار التميز الحقيقي في مستقبل تطورات الذكاء الاصطناعي.

تتطلب المرحلة المقبلة توجيه المزيد من الاستثمارات والموارد البحثية لإنشاء مجموعات بيانات أكبر وأكثر تنوعًا، بالإضافة إلى تطوير تقنيات تعلم آلة قادرة على استيعاب التباينات اللغوية والثقافية. سيعتمد نجاح نماذج الذكاء الاصطناعي في المستقبل على مدى قدرتها على التكيف مع الواقع المحلي بدلاً من الاعتماد على نماذج جاهزة تم تدريبها على بيانات عالمية عامة.

شاركها.