واشنطن بوست تختبر أقوى نماذج الذكاء الاصطناعي في توليد الصور

أجرت صحيفة واشنطن بوست اختباراً موسعاً لتحديد نموذج الذكاء الاصطناعي الأكثر كفاءة في توليد الصور والاستجابة لطلبات المستخدمين، مع التركيز على الأدوات المتاحة لعامة المستخدمين دون الحاجة إلى خبرات تقنية متقدمة أو التعامل مع نماذج مفتوحة المصدر.
وشمل الاختبار خمسة نماذج رئيسة بنسخها المدفوعة والاحترافية، بهدف ضمان أعلى مستويات الجودة، وهي: Adobe Firefly، وBytedance Seedream Image 4.0، وGemini 3 Pro، وChatGPT-5، إضافة إلى Meta AI.
واعتمدت التجربة على مجموعة متنوعة من الأوامر التي تحاكي الاستخدام اليومي، مثل تعديل تفاصيل الصور، وإضافة عناصر جديدة، وإزالة أشخاص من المشاهد، فضلاً عن اختبار قدرة النماذج على توليد صور دقيقة لليدين والوجوه، وهي من أكثر الجوانب التي لا يزال الذكاء الاصطناعي يواجه صعوبات واضحة فيها.
وجاء هذا الاختبار ضمن تغطية أعدّها كل من جيفري فاولر، المحرر التقني في واشنطن بوست، وكيفن شاول، المحرر المتخصص في شؤون الذكاء الاصطناعي، تزامناً مع الانتشار الواسع لأدوات الذكاء الاصطناعي التوليدي وتزايد الاعتماد عليها.
منهجية اختبار دقيقة
أكدت الصحيفة أنها اعتمدت منهجية صارمة لضمان موضوعية النتائج، إذ لم يقتصر التقييم على آراء المحررين، بل أُحيلت المخرجات إلى لجنة تحكيم مستقلة ضمت ثلاثة خبراء بارزين في مجال التصوير، لتقييم جودة الصور ودقتها وواقعيتها، بما يعكس الأداء الحقيقي للنماذج في الاستخدام العملي.
وضمت لجنة التحكيم المصور الصحفي المحترف ديفيد كارسون، الحائز على عدة جوائز من بينها جائزة بوليتزر لعام 2015، إلى جانب داليا دريسر، وهي فنانة رقمية متخصصة في الإبداع البصري باستخدام التقنيات الحديثة، وبراتيك نايك، الخبير في تنقيح الصور وإضافة اللمسات الجمالية دون المساس بأصالتها.
وتكوّن الاختبار من خمسة محاور رئيسة، شملت تعديل الوجوه عبر إضافة شعر إلى صورة الممثل دواين جونسون، وتوليد صورة فنية لغزال ملوّن بأسلوب تشكيلي، وحذف شخص من صورة تجمع بين كريستيان ستيوارت وروبرت باتينسون، وتوليد صورة ممثل يبكي فرحاً بعد فوزه بجائزة الأوسكار، إضافة إلى إنشاء صورة ليدين تمسكان برأس شخص من الخلف مع تشابك الأصابع.
وأظهرت النتائج تبايناً كبيراً في أداء النماذج، تبعاً لقدرة كل منها على التعامل مع التفاصيل البصرية الدقيقة.
الحكم النهائي
تصدّر نموذج الذكاء الاصطناعي التابع لشركة غوغل، «جيميناي»، المعتمد على تقنية «نانو بانانا برو»، جميع الاختبارات، ما دفع عضو لجنة التحكيم براتيك نايك إلى الإشادة بالتقدم الملحوظ الذي حققه النموذج مقارنة بالإصدارات السابقة.
وبرز تفوق «جيميناي» بشكل خاص في تعديل الصور، سواء من حيث إزالة أشخاص من المشاهد أو إضافة عناصر جديدة بدقة عالية. ففي أحد الأمثلة، نجح النموذج في حذف الممثل روبرت باتينسون من صورة تجمعه بكريستيان ستيوارت، مع إعادة تشكيل المشهد بطريقة واقعية للغاية، الأمر الذي جعل التمييز بين الصورة المعدلة والصور الحقيقية أمراً بالغ الصعوبة، بحسب ديفيد كارسون.
ورغم هذا التفوق، واجه «جيميناي» انتقادات تتعلق بحماية حقوق الملكية الفكرية، إذ استخدم ملامح الممثل ليوناردو دي كابريو عند توليد صورة لممثل فائز بالأوسكار، كما أضاف توقيعاً وهمياً ينسب الصورة إلى مصور حقيقي يعمل لدى وكالة أسوشيتد برس، ما اعتبره كارسون خللاً يستوجب المعالجة.
في المقابل، حلّ نموذج «فايرفلاي» التابع لشركة أدوبي في المرتبة الأخيرة، ويُعزى ذلك إلى اعتماده في التدريب على صور مفتوحة المصدر ومجانية، وهو ما انعكس على جودة المخرجات مقارنة بالمنافسين.
من جهتها، رأت داليا دريسر أن الفن الناتج عن الذكاء الاصطناعي ليس سلبياً في حد ذاته، لكنه لا يزال بحاجة إلى تدخل إبداعي بشري لبلوغ مستوى أعلى من التميز، مشيرة إلى أن «جيميناي» قدم أفضل جودة تقنية، بينما تميزت صور «شات جي بي تي» بجرأة فنية أكبر.
وتظل مشكلة توليد صور الأيدي والأصابع من أبرز التحديات أمام نماذج الذكاء الاصطناعي، ورغم أن «جيميناي» نجح في إظهار العدد الصحيح من الأصابع دون أخطاء فادحة، فإن الصور الناتجة لا تزال تفتقر إلى الواقعية الكاملة ويمكن التعرف عليها بسهولة كصور مولدة آلياً.









