ایتنافناوری

آموزش: چگونه با جمینای تصاویر واقع‌گرایانه بسازیم؟ راهنمایی با ۵ مثال کاربردی

گوگل جمینای (Gemini)، که به‌طور معمول برای تحلیل داده‌ها و سامان‌دهی ایمیل‌ها استفاده می‌شود، حالا به عنوان یکی از برترین ابزارهای تولید تصویر با هوش مصنوعی نیز مطرح شده است.

به گزارش ایتنا و به نقل از tomsguide، این قابلیت جدید، مبتنی بر مدل قدرتمند Imagen 3 است که امکان خلق تصاویر واقع‌گرایانه، هنری و پرظرافت را تنها با یک توصیف متنی فراهم می‌کند. در ادامه، پنج نمونه از بهترین دستورها (پرامپت‌ها) برای تولید تصویر با جمینای ارائه شده‌اند:

    مربی یوگا در طبیعت
    در این مثال، کاربر صحنه‌ای از یک مربی یوگا که در لبه صخره‌ای با منظره غروب آفتاب بر فراز اقیانوس ایستاده توصیف کرده است. با ذکر جزئیاتی مثل لباس، حالت بدن و زاویه دوربین، جمینای تصویری بسیار نزدیک به توصیف تولید کرده، اگرچه در جزئیات کوچکی مانند چهره و پاها کاستی‌هایی دیده می‌شود.
 

پرامپت آن از این قرار است:
«تصویری از یک مربی یوگا در فضای باز تولید کن. مربی یوگا یک بالای سر سفید و پایین سبز رنگ پوشیده است و در لبه یک صخره سنگی ایستاده است. مربی در حالت لانژ هلالی (crescent lunge) قرار دارد. خورشید بر فراز اقیانوسی وسیع و آرام غروب می‌کند. ما یک شات با عرض متوسط ​​را با استفاده از یک لنز ۳۵ میلیمتری می‌بینیم.»

    دیورامای ربات در اداره
    این دستور پیچیده شامل یک ربات عروسکی در محیطی شلوغ با المان‌هایی مثل جعبه پیتزا، مانیتورها و کف‌پوش زیگزاگ بوده است. جمینای تصویری خلق کرد که حتی شامل اشیایی مانند صندلی اداری، گیاه و سطل زباله بود، که نشانگر قدرت تکمیل‌گری این مدل در صورت مبهم بودن برخی جزئیات است.
 

پرامپت آن:
«تصویری از یک صحنه نمایش عروسکی نمدی از یک ساختمان اداری به هم ریخته ایجاد کن. نمای آن از بالا فضای اداری رباتی بامزه را نشان می‌دهد که در حال راه رفتن است. ربات دسته‌ای از کاغذها را در دست گرفته است. یک فنجان قهوه در بالای پشته کاغذها قرار دارد.

ربات از یک طرف اتاق که با مانیتورهای کامپیوتری پوشیده شده است به سمت دیگر اتاق که یک میز چوبی بلند را در خود جای داده است حرکت می‌کند. روی این میز چوبی جعبه‌های پیتزای باز وجود دارد. کف فرش دارای طرح زیگزاگ است. دیوارها به چندین نقاشی از حیوانات مختلف مزین شده‌اند.»

    نورپردازی احساسی در آپارتمان توکیو
    در این تصویر، دانشجویی زیر نور لامپ صنعتی در حال مطالعه در اتاقی با منظره بارانی و نئون‌های توکیو است. جمینای به‌خوبی تعامل نور داخلی و خارجی و بازتاب‌ها را بازآفرینی کرده است.
 

پرامپت آن:
«تصویری از دانش‌آموزی تولید کن که در آپارتمانش در توکیو مشغول مطالعه است. دانشجوی جوانی پشت میز نشسته است و از روی یک کتاب متنی باز مطالعه می‌کند. کتاب توسط یک چراغ رومیزی به سبک صنعتی منفرد روشن شده است.

میز به سمت پنجره بزرگی قرار گرفته است که مشرف به خیابان شلوغ توکیو است که با نورهای نئون رنگارنگ روشن شده است. قطرات باران در سراسر پنجره می‌پاشند و در نورهای نئون می‌درخشند. از یک سبک واقعگرایانه عکس استفاده کن.»

    پوستر فیلم با متن
    دستور ساخت پوستر سینمایی با سبک نوآر، شامل دو کارآگاه و خودرو لوکس با نام بازیگران و عنوان فیلم بود. گرچه در تایپ متن ایراداتی وجود داشت، اما با تنظیم دقیق‌تر می‌توان به نتایج بهتری رسید.
 

پرامپت آن:
«یک پوستر فیلمی به سبک هالیوود تولید کن. این پوستر یک عکس واقعی از یک کارآگاه زن و مرد را نشان می دهد که پشت یک ماشین اسپرت لوکس اردک می کشند. سبک تصویر فیلم نوآر است.

حتماً باید تنها متن روی پوستر شامل عنوان فیلم و نام بازیگران باشد. نام فیلم «افسانه‌های هوش مصنوعی» است. بازیگران فیلم «جین اسمیت» و «جان دو» نام دارند. عنوان فیلم در پایین پوستر آمده است. نام بازیگران در بالای صفحه است.»

    منظره کهکشان راه شیری
    در این مثال، عکسی با نوردهی طولانی از آسمان شب در گرند کنیون خواسته شده بود. جمینای تصویری خیره‌کننده و مناسب برای پس‌زمینه دسکتاپ خلق کرد.
 

پرامپت آن:
«تصویری با کیفیت HD از یک منظره تولید کن. این عکس با نوردهی طولانی از کهکشان راه شیری در آسمان پرستاره شب است. عکس از وسط گرند کانیون گرفته شده است. با دوربینی حرفه‌ای با کنتراست بالا و ترکیب سینمایی گرفته شده است.»

این نمونه‌ها نشان می‌دهند که برای گرفتن بهترین نتیجه از جمینای، استفاده از دستورهای دقیق، طولانی و جزئی‌نگر کلید موفقیت است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار مشابه

دکمه بازگشت به بالا