GPT Image 2.0 مقابل Nano Banana 2: مقارنات حقيقية للصور وخلاصات حول الأوامر النصية

أبريل ٢٢، ٢٠٢٦

GPT Image 2.0 مقابل Nano Banana 2: مقارنات حقيقية للصور وخلاصات حول الأوامر النصية

على مدى اليومين الماضيين، جمعتُ مجموعة من مقارنات الصور جنباً إلى جنب بين GPT Image 2.0 و Nano Banana 2 على منصة X. بدلاً من التركيز على ادعاءات النماذج، أردتُ الاطلاع على المخرجات الفعلية: في ظل نفس الأمر النصي، أي نموذج يبدو أكثر واقعية وقابلية للاستخدام وإقناعاً للوهلة الأولى؟

في ملاحظات الاختبار الأصلية، كان الإعداد موحداً: نفس الأمر النصي، وكان GPT يُعرض أولاً بينما Nano Banana 2 يُعرض ثانياً.


ما تقوله التغذية الراجعة الحقيقية

أقوى تغذية راجعة متكررة هي أن GPT Image 2.0 يبدو أفضل في العرض العام، خاصةً في اللون والواقعية. في إحدى مقارنات الصور الشخصية، تقول الملاحظة:

"لون GPT 2 أفضل بكثير في رأيي. إنه يبدو حقيقياً بالفعل مقارنةً بـ Nano Banana 2."

في الوقت ذاته، تحتفظ الوثيقة بفارق دقيق مهم:

"غير أن Nano Banana 2 التقط المزيد من التفاصيل الدقيقة 1:1."


الحالة 1: أمر نصي لصورة شخصية في شوارع الليل

أحد أوضح الأمثلة هو أمر صورة شخصية في شوارع الليل: امرأة شابة جالسة خارج مطعم صغير في المدينة، ترتدي تانك توب أبيض فوق حمالة صدر من الدانتيل الأسود، مع إضاءة فلاش مباشرة، وعمق ميدان ضحل، وحبيبات تشبه الأفلام، وانعكاسات النيون في الخلفية.

يعمل هذا الأمر النصي لأنه يتجاوز مجرد وصف الموضوع. كما يحدد طريقة الإضاءة والبيئة والإحساس بالكاميرا والمزاج. هذا الجمع يمنح النموذج منطق صورة أكمل ليتبعه.

الأمر النصي:

A candid nighttime street portrait of a young woman sitting casually on a woven café chair outside a small urban restaurant... direct flash... medium shot, shallow depth of field, film-like grain, flash photography aesthetic, raw and unfiltered mood.

مقارنة صورة شخصية في شوارع الليل


الحالة 2: أمر نصي لصورة شخصية فاخرة

مثال مفيد آخر هو الصورة الشخصية الفاخرة للغاية: شعر أسود طويل متموج، وعيون زرقاء فاتحة، ومكياج مصقول، وقميص علوي بني داكن بدون أحزمة، ومجوهرات فضية، وفضاء تراس في المساء، وضوء ذهبي دافئ من تركيبة قريبة.

هذا النوع من الأوامر النصية محدد للغاية بشأن تصميم الجمال والإكسسوارات والإطار ودرجة حرارة الضوء. إنه تذكير جيد بأن أوامر الصور الشخصية تصبح أكثر استقراراً عندما تتضمن تفاصيل على مستوى الوجه وسياقاً على مستوى المشهد.

مقارنة الصورة الشخصية الفاخرة


الحالات المعقدة: حيث تتضح الفجوة بشكل أكبر

تتضمن الوثيقة أيضاً مقارنة أوسع عبر خمس حالات أكثر تعقيداً وتلخصها بشكل مباشر للغاية: "GPT Image 2 يفوز بفارق كبير!" وتضيف أن النتائج كانت "واضحة جداً"، وتشير إلى أن Nano Banana 2 كان لا يزال نسخة محسّنة، وليس خطاً أساسياً خاماً.

هذا مهم لأن الأوامر النصية المعقدة تميل إلى الكشف عن مدى قدرة النموذج على التعامل مع قيود متعددة في وقت واحد: الموضوع والحركة والمنظور والإضاءة والأسلوب والجو.


نمط أمر نصي قابل لإعادة الاستخدام

عبر هذه الأمثلة، يتكرر نمط واحد باستمرار:

الموضوع + الوضعية أو الحركة + تفاصيل الملابس + المشهد + الإضاءة + لغة الكاميرا + الملمس أو المزاج.

بالنسبة لمنشئي الصور، هذا على الأرجح الدرس الأكثر عملية من المقارنة بأكملها. الأوامر النصية القوية لا تتعلق فقط بما هو في الإطار — بل تتعلق أيضاً بالطريقة التي ينبغي أن يبدو بها الإطار.

مثال على الأمر النصي:

A photorealistic capture of chaotic youth frozen in time, featuring a beautiful Russian woman running frantically with a slice of toast in her mouth. She is wearing a perfect, elegant dress that flows with her movement. The composition is a dramatic low angle worm's-eye view, emphasizing the vastness of the clear cobalt blue sky and the geometric framing of intersecting power lines above. The lighting simulates hard sunlight at noon, creating crisp, defined shadows on the subject. The image utilizes a Fujifilm Classic Negative aesthetic, adding a layer of nostalgic texture and high-fidelity realism.

نتيجة الأمر النصي الغني بالحركة


تكشف هذه المقارنة أكثر من مجرد الفجوة بين نموذجين — فهي تسلط الضوء على مدى تأثير بنية الأمر النصي على جودة المخرجات.

  • GPT Image 2.0 لديه ميزة واضحة في اللون والواقعية العامة
  • Nano Banana 2 يؤدي بشكل أكثر دقة في الاحتفاظ بالتفاصيل
  • الفجوة الحقيقية تظهر في المشاهد المعقدة مع قيود متزامنة متعددة

أياً كان النموذج الذي تستخدمه، كلما كانت بنية أمرك النصي أكثر اكتمالاً، كلما كانت نتائجك أكثر اتساقاً.

nanobanana.net