بدأت موجة من مقاطع الفيديو المولدة بالذكاء الاصطناعي، التي تحاكي لقطات من الحياة الواقعية، في الانتشار بشكل كبير. فبعد انتشار مقطع فيديو مذهل لذئب بري يقفز على ترمبولين، ظهرت مقاطع مشابهة لحيوانات أخرى، كلّها من صنع الذكاء الاصطناعي. ورغم أن هذه المقاطع قد تبدو طريفة، إلا أنها تحمل تحذيراً مقلقاً بشأن القدرة المتزايدة لهذه التقنيات على تزييف الواقع، خاصة مع تطورها لتشمل صيغاً نثق بها بشكل غريزي، مثل مقاطع كاميرات المراقبة ولقطات شهود العيان.
لم تعد تقنيات الذكاء الاصطناعي تقتصر على إنتاج مقاطع سريالية أو معدلة بشكل واضح، بل أصبحت قادرة على تقليد الأساليب التي نعتمد عليها لفهم الأحداث الجارية. وتشمل هذه الأساليب لقطات كاميرات المراقبة، وكاميرات السيارات، والكاميرات الشخصية لرجال الشرطة، وكاميرات الحياة البرية، بالإضافة إلى مقاطع فيديو شهود العيان المصورة بالهواتف المحمولة. تلعب هذه المقاطع دوراً حاسماً في تشكيل فهم الجمهور للأحداث، سواء كانت احتجاجات، كوارث، أعمال عنف، أو حالات طوارئ، مما يجعل من الصعب بشكل متزايد التمييز بين المحتوى الحقيقي والمزيف.
الذكاء الاصطناعي وتزييف مقاطع الفيديو: تحديات واقعية
مقاطع أخبار واقعية مولدة اصطناعياً
لقد اقتحمت المقاطع الواقعية المولدة بالذكاء الاصطناعي بالفعل عالم الأخبار andnbsp;. في مؤسسة «ستوريفول»، المتخصصة في التحقق من آلاف مقاطع الفيديو الواقعية لغرف الأخبار والعلامات التجارية حول العالم، تم إجراء اختبار مثير للاهتمام. فقد أدخل فريق العمل عناوين أخبار عاجلة حقيقية من منصة المؤسسة إلى أحد أحدث نماذج الفيديو المولدة بالذكاء الاصطناعي.
في غضون ثوانٍ، أنتج النموذج مقاطع فيديو تحاكي بدقة ملمس ومنظور التقارير التي يقدمها شهود العيان. لم تكن هذه مجرد تجارب أولية، بل لقطات إخبارية واقعية يمكن أن تجد طريقها إلى غرفة الأخبار أثناء تغطية خبر عاجل. وعند مقارنتها مع المقاطع الحقيقية الأصلية، احتاج الصحافيون المدربون إلى التمهل والتدقيق في التفاصيل لتمييز الفارق. وتشكل «ستوريفول» وكالة أخبار عالمية تستفيد منها 70 في المائة من أكبر 20 غرفة أخبار عالمياً، وهي متخصصة في التحقق من الأخبار العاجلة والفيديوهات الرائجة.
تلاشي الضوابط الوقائية من التزييف
بدأت الضوابط التي كانت تحمينا من التزييف بالتلاشي. تنتشر حالياً على منصات مثل «ريديت» منشورات تشرح كيفية إزالة العلامات المائية من مقاطع الفيديو التي ينشئها برنامج «سورا» من «أوبن إيه آي»، أحد أشهر مولدات الفيديو بالذكاء الاصطناعي. ويمكن تجاوز القيود المفروضة على بعض أوامر الذكاء الاصطناعي، إن وجدت، أو تشغيل النماذج محلياً دون قيود على المحتوى الواقعي للغاية. ومع هذه القدرة على إنشاء لقطات كاميرات مراقبة أو لقطات كوارث مزيفة عند الطلب، يصبح السؤال المهم هو ليس ما إذا كان الذكاء الاصطناعي قادراً على توليد مقاطع فيديو مقنعة لأحداث لم تقع، بل إلى أي مدى سينتشر هذا الفيديو المزيف قبل أن يتم التحقق منه.
إتقان التزييف: لماذا تبدو مقاطع الفيديو واقعية؟
لم يعد التغيير الأهم في مقاطع الفيديو المولدة بالذكاء الاصطناعي يقتصر على مظهرها فحسب، بل يشمل سلوكها كذلك. ففي حين أن لقطات شهود العيان الحقيقية غالباً ما تحتوي على عيوب الحياة الواقعية مثل اليد المرتعشة، أو الكاميرا المتجهة نحو الأرض قبل بدء الحدث، أو فترات طويلة من السكون، وزوايا تصوير غير مثالية، فإن الذكاء الاصطناعي يعمل بشكل مختلف.
حتى الآن، لا يحاكي الذكاء الاصطناعي هذه اللحظات العشوائية، بل ينتقل مباشرة إلى الحدث بإطار مركزي مثالي، وإضاءة نقية، وإيقاع متقن في مشهد مصمم لتحقيق أقصى تأثير. بعبارة أخرى، يقدم الذكاء الاصطناعي لنا اللحظة التي نتوقع رؤيتها، متجاهلاً التمهيد البشري المربك الذي يحيط بها عادة. يعود السبب في ذلك إلى أن معظم النماذج لا تزال تُدرب بشكل مكثف على مواد سينمائية بدلاً من المحتوى العشوائي الذي ينتجه المستخدمون بكاميرات محمولة. يبدو أن نماذج الذكاء الاصطناعي تفهم الدراما بشكل أفضل من فهمها للواقع.
هذه الفجوة تحديداً هي ما يسمح لفرق التحقق برصد هذا الاختلاف، في الوقت الحالي. ومع ذلك، مع تطور النماذج وتحسين كتابة الأوامر، ستتلاشى هذه المؤشرات السلوكية. فبيانات التدريب لهذه النماذج تتضمن مقاطع فيديو مهتزة التقطها المارة وأفلاماً وثائقية متقنة، مما يسمح لها بمحاكاة أسلوبها وإحساسها بالواقعية ببراعة.
تراجع ثقة الجمهور
يشير «تقرير رويترز للأخبار الرقمية» إلى أن 58 في المائة من المشاهدين حول العالم يخشون عدم قدرتهم على التمييز بين الحقيقي والمزيف على الإنترنت. بينما كان هذا الخوف يتركز في الماضي على السياسة والدعاية، فإنه يشمل الآن مقاطع الفيديو المنزلية البسيطة. وينطوي هذا على تحول نفسي أعمق؛ فبمجرد أن يبدأ المشاهد بالتشكيك في مقاطع الفيديو اليومية، فإنه لا يتخلى عن هذا التشكيك بسهولة. إذا شك المشاهد في عملية إنقاذ كلب، فقد تمتد شكوكه لتشمل مقاطع مصورة لاحتجاجات، وإذا شك في مزحة، فسيشك بعدها في حقيقة ما يجري داخل منطقة حرب.
في الواقع، لا تنهار الثقة في لحظة درامية واحدة، بل تتآكل تدريجياً عبر آلاف الشكوك الصغيرة. ومع ازدياد وفرة مقاطع الفيديو المولدة بالذكاء الاصطناعي، تتحول اللقطات الأصلية إلى عملة نادرة.
التحقق من تزييف الفيديو: أدوات ومؤشرات
كيف تعرف ما إذا كان فيديو مولداً بالذكاء الاصطناعي؟
بالتأكيد، يمكن لأدوات الكشف بالذكاء الاصطناعي أن تكون جزءًا مفيدًا من جهودك، لكنها لا تغني عن التحقق البشري. وفقًا لتحليل أجرته مؤسسة «ستوريفول»، فإن الأدوات الحالية تحقق دقة تتراوح بين 65% و75% في الظروف المثالية، لكن هذه الدقة تتراجع إلى أقل من 50% في غضون أسابيع من إطلاق نموذج ذكاء اصطناعي جديد. فيما يلي المؤشرات التي تستخدمها فرق التحقق في «ستوريفول» يوميًا، وهي مؤشرات يمكن للجمهور تعلم تمييزها بسرعة:
1. بداية الذروة في الأحداث: غالبًا ما تتضمن اللقطات الحقيقية وقتًا ميتاً، بمعنى أن الفيديو المزيف يفتقر إلى الأحداث الهامة أو حالة الارتباك قبل بدء الحدث.
2. تموضع الأشخاص في منتصف الإطار بدقة: نادراً ما يلتقط شهود العيان فوضى الأخبار العاجلة كما يفعل المصورون المحترفون.
3. الحركة الناعمة أكثر من اللازم: على عكس المحتوى الحقيقي الذي يصنعه المستخدمون والذي يهتز، يتقطع، يعيد التركيز، وينزلق.
4. تدهور الطوابع الزمنية واللافتات ولوحات المركبات عند التدقيق: في الغالب، يرسم الذكاء الاصطناعي صورة تقريبية لهذه التفاصيل بدلاً من رسمها بدقة.
5. مقاطع الكوارث والحياة البرية تبدو «منظمة أكثر من اللازم»: أما الواقع فهو مفعم بالمفاجآت، بينما يبدو الذكاء الاصطناعي في كثير من الأحيان مفتعلاً.
للأسف، من غير المرجح أن تصمد هذه المؤشرات إلى الأبد، لكنها توفر حاليًا حماية بالغة الأهمية.
الأصالة أصبحت كنزاً ثميناً
يمكن للمنصات التكنولوجية إضافة المزيد من الضوابط الوقائية إلى أدوات توليد الفيديو لديها، ويمكن للجهات التنظيمية تحديث الأطر. كما يمكن لأدوات الكشف أن تتحسن، وكذلك قدراتنا النقدية. وبمساعدة غرف الأخبار للجمهور على الإبحار في خضم مستنقع التزييف، فإن أكثر الطرق تأثيراً لإعادة بناء الثقة هي الشفافية.
لم يعد الجمهور يثق بعبارة «تقول المصادر»، بل يرغب في أن يرى كيف يعرف الصحافي أو غرفة الأخبار أن مادة ما حقيقية. وتولي أعداد كبيرة من المؤسسات الإخبارية أولوية للتحقق المسبق، مثل «بي بي سي فيريفاي» و«سي بي إس نيوز كنفيرمد»، التي تدمج فحوصات المصادر المفتوحة والأدلة الجنائية الرقمية في التغطية، عبر فحص المصدر، والصور، وأنماط البيانات الوصفية، وتحديد الموقع الجغرافي عند الاقتضاء. ويزود «ستوريفول نيوزواير» شركاءه بجميع هذه التفاصيل الأساسية والضرورية عن كل فيديو على منصته.
تمثل هذه الشفافية الفارق الحاسم في بيئة أصبح فيها الفيديو المولّد بالذكاء الاصطناعي رخيصاً، وسريعاً، ومتاحاً في كل مكان. وكلما غمرت اللقطات المولّدة بالذكاء الاصطناعي المجال العام، زادت مصداقية المؤسسات التي تجعل «إظهار طريقة العمل» جزءاً أساسياً من القصة. في الواقع، أكثر فيديوهات الإنترنت رسوخاً في الذاكرة لم تكن يوماً مثالية، وإنما جاءت غير متوقعة، مليئة بالعيوب، وإنسانية – وهي تحديداً تلك اللحظات التي لا يزال الذكاء الاصطناعي عاجزاً عن تخيّلها. ومع أن اللقطات المولّدة بالذكاء الاصطناعي أصبحت قادرة على محاكاة اللغة البصرية للحقيقة، فإنها تظل عاجزة عن إعادة إنتاج عشوائية الحياة الواقعية. وما هو على المحك عندما تنجح في ذلك، فإن ما يصبح على المحك هنا ليس مجرد التضليل، بل قدرة الجمهور على الوثوق بما يراه في اللحظات الأهم.
* رئيس تحرير «ستوريفول»، مجلة «فاست كومباني»
