ایتنافناوری

تحولی جدید در ChatGPT: تولید تصاویر با هوش مصنوعی بدون نیاز به DALL-E

OpenAI اعلام کرده است که کاربران به‌زودی می‌توانند مستقیماً در ChatGPT تصاویر تولید کنند.

به گزارش ایتنا و به نقل از انگجت، این قابلیت برای کاربران نسخه‌های رایگان، Plus، Pro و Team در دسترس خواهد بود و به عنوان ابزار پیش‌فرض در مدل GPT-4o جایگزین DALL-E می‌شود. علاوه بر ChatGPT، این ویژگی به هوش مصنوعی تبدیل متن به ویدیو «سورا» نیز اضافه خواهد شد.

OpenAI اعلام کرده که این سیستم می‌تواند تصاویر باکیفیت را بر اساس پرامپت‌های متنی، مکالمات و حتی فایل‌های آپلودشده تولید کند. یکی از ویژگی‌های کلیدی این ابزار، امکان ویرایش و تغییر تصاویر موجود با استفاده از توضیحات کاربر است. همچنین، این شرکت بهبودهایی در درک متنی و پردازش نوشته در تصاویر ایجاد کرده است.
 

کاربردهای این ابزار هم برای کاربران شخصی و هم حرفه‌ای تعریف شده است. به عنوان مثال، می‌توان از آن برای طراحی اینفوگرافیک‌ها، تصاویر تبلیغاتی برای شبکه‌های اجتماعی و محتوای متنی تصویری (مانند تصویر فوق) استفاده کرد. OpenAI همچنین مدعی است که مدل جدید توانایی بالایی در تولید تصاویر واقع‌گرایانه با دقت بالا در نور، سایه و بافت دارد.

این قابلیت مبتنی بر مدل GPT-4o است که سال گذشته معرفی شد. حرف o در نام آن مخفف omni به معنای چندوجهی بودن مدل است، که به قابلیت‌های چندرسانه‌ای آن اشاره دارد. این مدل می‌تواند بر روی فایل‌های آپلودشده تغییراتی اعمال کند و مفاهیم بصری را با توجه به زمینه مکالمه ایجاد نماید. این به‌روزرسانی جدید، گام دیگری در مسیر توسعه هوش مصنوعی همه‌جانبه است که مدیرعامل OpenAI، سم آلتمن، اخیراً درباره آن صحبت کرده بود.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار مشابه

دکمه بازگشت به بالا