كشفت «غوغل» عن نسخة مطوّرة بالكامل من نموذجها الخاص لتوليد الصور، تحمل اسم «نانو بانانا برو» وذلك بعد أيام من إطلاق نموذجها اللغوي العملاق «جيميني 3».

تأتي النسخة بقدرات متقدمة تشمل جودة أعلى، نصوصاً أدق، إمكانات تحرير احترافية، وحتى البحث عبر الويب مباشرة من خلال النموذج.

وتقول «غوغل» إن «نانو بانانا برو» تم تطويره ليوفر للمستخدمين، وخاصة المحترفين، تحكماً كاملاً في مخرجات الصور، من زوايا التصوير والإضاءة وعمق المجال والتركيز وصولاً إلى معالجة الألوان، بحسب تقرير نشره موقع «تك كرانش».

كما أصبح بإمكانه توليد صور بدقة 2K و4K مقارنة بالجيل السابق الذي كان يكتفي بدقة 1024×1024 بكسل.

قدرات جديدة بدقة أعلى ونصوص أوضح

النموذج الجديد قادر على كتابة نصوص داخل الصور بشكل أكثر دقة، وبأنماط وخطوط ولغات متنوعة.

كما يستطيع دمج ما يصل إلى 14 عنصراً بصرياً في الصورة الواحدة، واستخدام حتى 6 صور مرجعية عالية الجودة، إضافة إلى الحفاظ على ملامح خمسة أشخاص داخل الصورة، غير أن هذه القفزة تأتي بتكلفة أعلى.

فبينما كانت تكلفة الصورة في «نانو بانانا» السابق تبلغ 0.039 دولار، فإن نسخة «برو» تصل كلفة إنتاج صورة بدقة 1080p أو 2K إلى 0.139 دولار، وبـ 0.24 دولار للصورة بدقة 4K.

كما أن النموذج الجديد أبطأ في الإنتاج بسبب حجم المعالجة الأكبر.

انتشار تدريجي عبر أدوات «غوغل»

بدأت «غوغل» في دمج «نانو بانانا برو» عبر العديد من خدماتها:

تطبيق جيميني سيعتمد النموذج الجديد بشكل افتراضي، مع وجود حدود للاستخدام في النسخة المجانية.

مشتركو «Google AI Plus» و«Pro وUltra» يحصلون على حدود أعلى في الاستخدام، إضافة إلى تفعيل النموذج في «Notebook LM».

النموذج أصبح متاحاً في وضع الذكاء الاصطناعي داخل البحث للمشتركين في «Pro» و«Ultra» داخل الولايات المتحدة.

كما سيتوفر داخل «Flow» لإنتاج الفيديو، وداخل «Slides» و«Vids» لعملاء «Workspace».

المطورون يمكنهم الوصول إليه عبر «Gemini API» و«AI Studio» وبيئة التطوير الجديدة «Antigravity».

المصدر: الراي

شاركها.