
أعلنت OpenAI عن طرح نموذجها الجديد لتكوين الصور GPT-Image 1.5، والذي يحقق طفرات نوعية في دقة فهم النصوص، والمحافظة على التفاصيل المرئية، إضافة إلى سرعة المعالجة بالمقارنة مع الإصدار السابق.
وحسبما ذكرته الشركة، يقوم النموذج الجديد بتوليد الصور بسرعة تصل إلى أربعة أضعاف سرعة النموذج القديم. وهو متوفر الآن لجميع مستخدمي ChatGPT، بالإضافة إلى المطورين من خلال واجهة برمجة التطبيقات (API).
وفي تصريح ذي صلة، أشارت فيدجي سيمو، الرئيسة التنفيذية لتطبيقات OpenAI، إلى أن إمكانات توليد الصور الجديدة تمثل جزءًا من تحول شامل لـ ChatGPT، من أداة نصية تفاعلية إلى "واجهة توليد شاملة" تستدعي تلقائيًا المكونات المناسبة بناءً على طلبات المستخدم.
تحرير أكثر دقة وتناسق بصري أفضل
وفقًا لشركة OpenAI، يقدم GPT-Image 1.5 أسلوبًا أكثر دقة في تحرير الصور. فهو يقوم بتطبيق التعديلات المحددة دون التأثير على العناصر الأخرى، الأمر الذي يحافظ على تناسق الإضاءة والتكوين والوجوه. ويدعم هذا النموذج إضافة العناصر وإزالتها ودمجها ومزجها ونقلها داخل الصورة.
وتتضمن أمثلة التطبيقات تحرير الصور بشكل احترافي، وتجربة الملابس وتسريحات الشعر بصورة افتراضية، والتحويل بين الأنماط الفنية المختلفة. وتعرض الأمثلة التي قدمتها OpenAI قدرات مثل دمج صور الأشخاص والحيوانات من صور منفصلة في مشهد واحد، أو تحويل صورة فوتوغرافية عادية إلى ملصق فيلم كلاسيكي.
موثوقية أكبر في تطبيق التعليمات المعقدة
أوضحت الشركة أن النموذج الجديد يتبع التعليمات التفصيلية بدقة أكبر. ففي اختبار تطلب ترتيب 36 عنصرًا مختلفًا في شبكة، نجح GPT-Image 1.5 في تحديد مواقع العناصر بدقة متناهية، بعكس الإصدار السابق، وهو ما سهل إنشاء صور تتطلب دقة عالية في وضع العناصر.
كذلك تحسنت قدرة النموذج على عرض النصوص في الصور، ويشمل هذا عرض نصوص أصغر وأكثر كثافة مثل مقتطفات المقالات والجداول القصيرة والرسوم البيانية الرقمية. ومع ذلك، أقرت OpenAI بوجود بعض التحديات المتبقية، مثل التعامل مع النصوص الطويلة والخطوط غير المألوفة والوجوه المتعددة في صورة واحدة وإنشاء محتوى بلغات مختلفة.
في اختبارات داخلية لمشاهد تصويرية معقدة وغير مألوفة، أظهر GPT-Image 1.5 أداءً عاليًا يضاهي أداء Nano Banana Pro من جوجل، وتفوق بشكل واضح على إمكانيات النموذج السابق، وهو ما عزز مكانته بين أكثر نماذج توليد الصور تطورًا في السوق. ومع ذلك، سيحدد الاختبار العملي في نهاية المطاف مدى كفاءة هذا النموذج مقارنة بالمنافسين.