
به گزارش ایتنا و به نقل از انگجت، این قابلیت برای کاربران نسخههای رایگان، Plus، Pro و Team در دسترس خواهد بود و به عنوان ابزار پیشفرض در مدل GPT-4o جایگزین DALL-E میشود. علاوه بر ChatGPT، این ویژگی به هوش مصنوعی تبدیل متن به ویدیو «سورا» نیز اضافه خواهد شد.
OpenAI اعلام کرده که این سیستم میتواند تصاویر باکیفیت را بر اساس پرامپتهای متنی، مکالمات و حتی فایلهای آپلودشده تولید کند. یکی از ویژگیهای کلیدی این ابزار، امکان ویرایش و تغییر تصاویر موجود با استفاده از توضیحات کاربر است. همچنین، این شرکت بهبودهایی در درک متنی و پردازش نوشته در تصاویر ایجاد کرده است.

این قابلیت مبتنی بر مدل GPT-4o است که سال گذشته معرفی شد. حرف o در نام آن مخفف omni به معنای چندوجهی بودن مدل است، که به قابلیتهای چندرسانهای آن اشاره دارد. این مدل میتواند بر روی فایلهای آپلودشده تغییراتی اعمال کند و مفاهیم بصری را با توجه به زمینه مکالمه ایجاد نماید. این بهروزرسانی جدید، گام دیگری در مسیر توسعه هوش مصنوعی همهجانبه است که مدیرعامل OpenAI، سم آلتمن، اخیراً درباره آن صحبت کرده بود.