جوجل تكشف عن Veo 3.. فيديوهات واقعية من مجرد وصف نصي

كشفت شركة جوجل، خلال مؤتمرها السنوي للمطورين Google I/O 2025 عن أحدث وأقوى أدواتها في مجال توليد الوسائط باستخدام الذكاء الاصطناعي، والتي تشمل نموذج Imagen 4 لتوليد الصور، وVeo 3 لتوليد الفيديوهات.
وتتيح هذه النماذج الجديدة من جوجل، للمستخدمين إنشاء صور ومقاطع فيديو قصيرة بناء على أوامر نصية أو صور مرجعية، مع دعم لإضافة صوت تلقائي وملائم للمشاهد.
Veo 3 نموذج جوجل الأحدث لتوليد الفيديو
أوضحت جوجل أن Veo 3 هو أحدث إصدار من نموذج توليد الفيديو الخاص بها، ويتميز بقدرته على إنشاء مقاطع فيديو قصيرة عالية الجودة، اعتمادا على وصف نصي أو صور.
ويمتاز النموذج بتحسينات كبيرة على مستوى الحركة، والتفاعل مع البيئة، واتساق المشاهد، ما يمنحه واقعية أكبر.
النموذج أصبح متاحا الآن بنسخة تجريبية لمشتركي خطة Google AI Ultra داخل الولايات المتحدة، عبر تطبيق Gemini ومنصة صناعة الأفلام الجديدة من جوجل المعروفة باسم Flow، والتي تم الإعلان عنها أيضا خلال المؤتمر. كما يتوفر الوصول المؤسسي عبر Vertex AI.
تحديثات جديدة لنموذج Veo 2
إلى جانب إطلاق Veo 3، أعلنت جوجل عن تحديثات كبيرة على الإصدار السابق Veo 2، شملت مزايا إضافية لتعزيز التحكم والتخصيص:
– المدخلات المرجعية: أصبح بإمكان المستخدمين تحميل صور لأشخاص أو أشياء أو أنماط معينة لضمان الاتساق البصري بين مشاهد الفيديو.
– تحكم بالكاميرا: يدعم النموذج الآن أوامر التحكم بالكاميرا مثل التحريك Pan، والتكبير Zoom، والدوران Rotate ضمن التوجيه النصي.
– توسيع الإطار Outpainting: يمكن تمديد المشهد خارج الإطار الأصلي، مما يساعد في تعديل الأبعاد أو تحويل الفيديو إلى تنسيقات مختلفة.
– إضافة أو إزالة العناصر: يوفر النموذج إمكانية إضافة أو حذف كائنات من الإطارات مع تعديل الإضاءة والظلال بشكل يتماشى مع المشهد العام.
إلى جانب نموذج الذكاء الاصطناعي لتوليد الفيديو، أطلقت جوجل أيضا مولد صور جديد يعتمد على الذكاء الاصطناعي وهو Imagen 4.
يدعم هذا النموذج الجديد دقة تصل إلى 2K، مع قدرة محسنة على معالجة التفاصيل الدقيقة مثل أنسجة الأقمشة، والانعكاسات، وفرو الحيوانات، كما يتميز بمرونته في العمل مع أنماط مختلفة، سواء الواقعية الفوتوغرافية أو الرسومية التوضيحية.