
رقابت میان مدلهای تولید تصویر با هوش مصنوعی وارد مرحلهای جدیتر شده است. شرکت OpenAI با معرفی GPT Image 1.5 گام تازهای در این مسیر برداشته و اعلام کرده که این نسخه، دقیقترین و سریعترین مدل تولید تصویر این شرکت تاکنون محسوب میشود. این رونمایی تنها چند هفته پس از عرضه ابزار Nano Banana Pro گوگل مبتنی بر Gemini 3 صورت گرفته؛ مدلی که توجه کاربران زیادی را به خود جلب کرده و سطح انتظارات را بالا برده است.
مدل GPT Image 1.5 هماکنون برای اکثر کاربران ChatGPT در سراسر جهان در دسترس قرار گرفته و از طریق API نیز با همین نام قابل استفاده است. البته کاربران Business و Enterprise فعلاً باید برای دسترسی به این نسخه منتظر بمانند. تمرکز اصلی این بهروزرسانی بر دقت بالاتر در پیروی از دستورات کاربر و افزایش چشمگیر سرعت بوده است؛ بهطوری که OpenAI اعلام کرده تولید تصاویر تا چهار برابر سریعتر از نسخههای قبلی انجام میشود.

یکی از مهمترین تغییرات، معرفی تب جدید Images در اپلیکیشن و نسخه مرورگر ChatGPT است. این بخش بهعنوان یک استودیوی خلاقانه طراحی شده و هدف آن، الهامبخشی و سادهسازی فرآیند ایدهپردازی بصری است. OpenAI تأکید کرده که کاربران حتی بدون نوشتن پرامپت متنی نیز میتوانند از مجموعهای از ایدهها و قالبهای آماده برای خلق تصاویر استفاده کنند.
در اعلام رسمی این بهروزرسانی، تمرکز ویژهای بر افزایش دقت در ویرایش تصاویر دیده میشود. کاربران اکنون میتوانند تغییرات را روی جزئیات مشخصی اعمال کنند؛ از نورپردازی و ترکیببندی گرفته تا ظاهر سوژهها، بهگونهای که خروجیها از نظر بصری سازگارتر و یکدستتر باشند. قابلیتهای جدیدی مانند افزودن، حذف، ترکیب، ادغام و جابهجایی عناصر نیز به ابزار ویرایش تصویر اضافه شده است. همچنین، رندر متن در تصاویر بهبود قابلتوجهی یافته و حالا امکان نمایش متنهای کوچکتر و متراکمتر با وضوح بالاتر فراهم شده است؛ قابلیتی مهم برای طراحیهای گرافیکی، پوسترها و محتوای تبلیغاتی.

فیدجی سیمو، مدیرعامل بخش اپلیکیشنهای OpenAI، در پستی در Substack توضیح داده که رابط کاربری اولیه ChatGPT اساساً برای تولید تصویر طراحی نشده بود و نیاز به فضایی اختصاصی برای محتوای بصری احساس میشد. نتیجه این نگاه، GPT Image 1.5 است که به گفته او، بیش از یک ابزار ساده، شبیه به یک استودیوی خلاقیت دیجیتال عمل میکند. OpenAI همچنین وعده داده در آینده، استفاده از تصاویر در پاسخها برای تحقیقات، مقایسهها و تحلیلها افزایش یابد. این بهروزرسانی در ادامه توافق اخیر OpenAI با Disney برای استفاده از بیش از ۲۰۰ شخصیت مشهور در پروژه Sora انجام شده و نشان میدهد نقش محتوای بصری در آینده هوش مصنوعی با سرعتی چشمگیر در حال گسترش است.
منبع خبر: aibusiness

شاهین آقامعلی


پاسخ :