ایتنافناوری

همه‌چیز درباره هوش‌مصنوعی جدید گوگل؛ از سیستمی که به جای شما برنامه‌ریزی و اقدام می‌کند تا عینک مترجم

اغلب کنفرانس گوگل آی/او (Google I/O) را مهم‌ترین کنفرانس معرفی فناوری‌های دنیای دیجیتال و اینترنت می‌دانند، دلیل آن هم ساده است: میلیون‌ها توسعه‌دهنده در سراسر جهان در نهایت و خواه‌ناخواه باید خودشان را با تغییرات آینده در سیستم‌عامل‌ها و همچنین خدمات مختلف این غول جست‌وجو یعنی گوگل تطبیق دهند.

کنفرانس گوگل آی/او همواره از این جهت بسیار مهم بوده اما کنفرانس امسال به نوعی تفاوت‌های چشمگیری با سال‌های گذشته داشت. کنفرانس امسال روی جست‌وجوی هوش مصنوعی، عینک‌های هوشمند، ارتقای هوش مصنوعی «جمینای» و خدمات ویژه‌ای متمرکز بود که به‌زودی شیوه ارتباط، تعامل و به‌اشتراک‌گذاری ایده‌ها در محیط کار و زندگی همه ما را دگرگون خواهد کرد.

جمینای ۲.۵ سریع‌تر و باهوش‌تر خواهد شد
جمینای ۲.۵، هوش مصنوعی رایگان گوگل، دنیای برنامه‌نویسان را متحول خواهد کرد. گوگل اکنون با تغییر جدول زمانی‌اش، از چند ارتقا و به‌روزرسانی در مدل‌های جمینای ۲.۵ «پرو» و «فلش» خبر داده و اعلام کرده است که پشتیبانی از «تفکر عمیق» (Think Deep) به هوش مصنوعی امکان می‌دهد تا قبل از پاسخ دادن، از تکنیک‌های تحقیقاتی پیشرفته برای بررسی چند فرضیه استفاده کند.

به گفته گوگل، «جمینای ۲.۵ فلش» نیز به‌طور کلی ارتقا پیدا می‌کند و از الگوی استدلال گرفته تا کدنویسی و کارآمدی در پاسخگویی، همه و همه به طرز خیره‌کننده‌ای پیشرفت خواهند کرد.

علاوه بر این، مدل‌های جمینای ۲.۵ اکنون از ورودی صوتی‌ـ‌تصویری و خروجی صوتی بومی در نسخه پیش‌نمایش «اِی‌پی‌آی» (API) زنده پشتیبانی می‌کنند، که این به توسعه‌دهندگان امکان می‌دهد لحن، لهجه و سبک گفتاری مکالمات را بسازند و آن را تنظیم کنند.

گوگل با بهره‌گیری از جمینای ۲.۵ پرو، قصد دارد یک سیستم هوش مصنوعی‌ بسازد که «باهوش باشد، پس‌زمینه‌ موضوع را درک کند، و بتواند به جای شما در هر ابزاری برنامه‌ریزی و اقدام کند».
 

فراتر از این، گوگل پروژه مارینر (Mariner) را نیز توسعه داده است. این پروژه یک هوش مصنوعی عامل‌محور مبتنی بر مرورگر اکنون می‌تواند ۱۰ کار مختلف را هم‌زمان انجام دهد، از رزرو پرواز گرفته تا تحقیق و خرید. به گفته گوگل، جدیدترین نسخه این نمونه اولیه تحقیقاتی ابتدا برای مشترکین «گوگل اِی‌آی اولترا» (Google AI Ultra) در ایالات متحده آمریکا در دسترس قرار خواهد گرفت.

ابزارهای نسل بعدی برای تولیدکنندگان محتوا: فلو، ایمجن و وئو۴  (۴ Imagen, Veo و Flow)
یکی از شگفت‌انگیزترین ابزارهای رونمایی‌شده در کنفرانس گوگل آی/او ۲۰۲۵، نسخه‌های جدید مدل‌های رسانه‌ای مولد گوگل به نام‌‌های ایمج۴، وِئو۴ و فلو (Veo 3, Imagen 4, Flow) است.

به گفته گوگل، وِئو۴ اکنون از تولید صدای ورودی مانند صدای ترافیک در خیابان شلوغ، آواز پرندگان در پارک یا حتی گفتگوی بین شخصیت‌ها پشتیبانی می‌کند. پیش‌تر، این تولیدکننده ویدیویی فقط می‌توانست ورودی‌های تصویری را تجسم کند و پخش ویدیو بی‌صدا بود که این امر، محتوا را در مقایسه با ویدیوهای واقعی کسل‌کننده می‌کرد.

گوگل در عین حال، برای افزایش کیفیت خروجی ویدیو فلو را معرفی کرده است. ابزاری که به تولیدکنندگان امکان می‌دهد نحوه تولید ویدیوها را، از زاویه و حرکت دوربین گرفته تا بازیگران و مکان فیلم‌برداری، تنظیم کنند.

افزون بر این، ایمج۴ نیز از نظر دقت و وضوح ارتقا یافته است. به‌ویژه در جزئیاتی مانند بافت پارچه، قطرات آب و موی حیوانات در ویدئوها. این تولیدکننده تصویر می‌تواند محتوا را در نسبت‌های مختلف تصویر و تا وضوح ۲کِی (2k)  تولید کند.

عینک‌های «اندروید اِکس‌آر» ما را شبیه به ربات‌های هوشمند می‌کند
یکی از خیره‌کننده‌ترین فناوری‌های ارائه‌شده در کنفرانس گوگل آی/او ۲۰۲۵ پیشرفت‌ عینک‌های «اِکس‌آر» (Android XR) بود. اندروید اِکس‌آر نخستین بار در دسامبر سال گذشته میلادی معرفی شد، اما گوگل در آن زمان بیشتر تمرکزش روی معرفی کلی نرم‌افزارهایی بود که برای هدست‌های اکس‌آر و واقعیت مجازی طراحی شده بودند نه معرفی دقیق یا کامل پلتفرم (بستر). اینک گوگل در مراسم گوگل آی/او ۲۰۲۵، تمرکز خود را به سمت عینک‌های «اندروید اِکس‌آر» معطوف کرده است.

این فناوری پوشیدنی‌ اعجاب‌انگیز کاربرد روزمره‌ای دارد که می‌تواند از دوربین‌ها، میکروفون‌ها و بلندگوها برای تفسیر آنچه می‌بینید استفاده کند و به کمک جمینای به پرسش‌های شما پاسخ دهد. بسیاری از شرکت‌های بزرگ فناوری، ازجمله متا و اپل، همین رویکرد را درباره فناوری‌های پوشیدنی‌ دارند، اما گوگل احتمالا در این زمینه از آ‌ن‌ها پیشی گرفته است.
 

گوگل با رونمایی از قابلیت‌های جمینای در «اندروید اِکس‌آر» و صفحه‌نمایش قابل تنظیم داخل لنز، نشان داد که کاربران چگونه می‌توانند هنگام قدم زدن در خیابان سیستم جهت‌یابی را مقابل چشمانشان مشاهده کنند. این فناوری به نوعی شبیه به  نمایشگرهای هدآپ دیسپلی (HUD) است که در برخی خودروهای مدرن وجود دارد.

با استفاده از این فناوری قادر خواهید بود پیامک‌های دریافتی را مشاهده کنید و به آن‌ها پاسخ دهید، مکالمات را هم‌زمان ترجمه کنید، و بدون نیاز به درآوردن گوشی از جیبتان، تنها از طریق دستورات صوتی، از مناظر بیرون عکس بگیرید.

گوگل در عین حال برای جذب مخاطبان گسترده‌تر، با برندهای مشهور عینک مانند واربی پارکر و جنتل مانستر (Gentle Monster و Warby Parker) نیز همکاری می‌کند تا عینک‌های هوشمند شیک‌تری تولید کند. گوگل درمورد زمان عرضه عینک‌های «اندروید اِکس‌آر» می‌گوید که این محصولات اواخر سال جاری میلادی به بازار خواهند آمد.

ابزارهای هوش مصنوعی که شاید نمی‌دانستید به آن‌ها نیاز دارید
ابزار دیگری که در کنفرانس گوگل آی/او ۲۰۲۵ معرفی شد این است که اکنون گوگل در جیمیل، پاسخ‌های هوشمند شخصی‌سازی‌شده‌ای را معرفی کرده که پاسخ‌های قبلی شما را به یک مخاطب یا رشته ایمیل، چه رسمی باشند، چه خودمانی و مکالمه‌محور، بررسی می‌کند تا پاسخ‌هایی مطابق با لحن و زمینه ایجاد کند.

همچنین یک ویژگی پاک‌سازی صندوق ورودی اضافه شده که به شما اجازه می‌دهد از جمینای بخواهید ایمیل‌های یک فرستنده خاص را در بازه زمانی مشخصی حذف کند.

علاوه بر این، جمینای در صورتی که تشخیص دهد می‌خواهید در یک گفتگوی جیمیلی قرار ملاقاتی تنظیم کنید، زمان‌های پیشنهادی برای جلسه را ارائه خواهد داد، و شما را از باز کردن گوگل میت یا تقویم گوگل (Calendar یا Meet) بی‌نیاز می‌کند.

گوگل میت نیز قابلیت ترجمه گفتار به‌صورت تقریبا هم‌زمان را ارائه می‌دهد تا کلمات گفته‌شده طرف مقابل را به زبان ترجیحی شنونده ترجمه می‌کند.

«گوگل بیم»؛ کنفرانس‌های سه‌بعدی آینده
در کنفرانس گوگل آی/او ۲۰۲۵ همچنین نسخه بازطراحی‌شده «پراجکت استارلاین» (Project Starline) با نام جدید «گوگل بیم» (Google Beam) معرفی شد. این پلتفرم برای ویدیوکنفرانس‌های سه‌بعدی بدون نیاز به تجهیزات پوشیدنی طراحی شده است و به طور خلاصه از آرایه‌ای متشکل از شش دوربین برای ردیابی حرکات و بازسازی سه‌بعدی چهره در نرخ ۶۰ فریم بر ثانیه استفاده می‌کند.

پراجکت استارلاین چند سال پیش هنگامی‌ که تماس‌های ویدیویی دو بعدی کسل‌کننده را بدون نیاز به تجهیزات بزرگ، به شبیه‌سازی‌های واقعی چهره‌به‌چهره تبدیل می‌کرد، سر و صدای زیادی به پا کرد. این فناوری اکنون با نام رسمی «گوگل بیم» شناخته می‌شود.
 

گوگل بیم با استفاده از هوش مصنوعی، ویدیوهای معمولی دوبعدی را مشابه فناوری چندلایه‌ای که در پردازش ویدیوی فضایی اپل و متا دیده می‌شود، به تجربیاتی واقع‌گرایانه و سه‌بعدی تبدیل می‌کند.

به گفته گوگل، هدف نهایی این فناوری، ایجاد یک پلتفرم ارتباطی است که از طریق حرکات واقعی بدن، اشارات و تماس چشمی بین آ‌ن‌ها، به افراد حس اعتماد و درک عمیق‌تری از یکدیگر را بدهد.

گوگل برای کمک به گسترش این پلتفرم در حوزه تجاری، با شرکت اچ‌پی همکاری می‌کند تا دستگاه‌های ارتباطی مجهز به «گوگل بیم» را تولید کند.

هوش مصنوعی همه چیز را برعهده می‌گیرد: از پرو لباس تا پرداخت نهایی
با آنکه فناوری‌های رونمایی‌شده در کنفرانس گوگل آی/او ۲۰۲۵ متعددند اما ممکن است همه آن‌ها برای زندگی روزمره و کاربران عادی قابل استفاده نباشند. یکی از پرکاربردترین قابلیت‌‌هایی که در جریان این مراسم از آن رونمایی شد، فناوری جدیدی برای تجربه خرید آنلاین است که  به کاربران امکان خواهد داد لباس‌های مد نظر خود را به‌ طور مجازی و صرفا با استفاده از عکسشان بپوشند و پرو کنند.

این ویژگی شگفت‌انگیز که در حال حاضر فقط به شکل آزمایشی در بخش «سرچ لبز» (Search Labs) در آمریکا در دسترس است، یک پیشرفت بزرگ در راستای شخصی‌سازی تجربه خرید آنلاین به شمار می‌رود. کاربران با فعال کردن این گزینه خواهند توانست در بین نتایج جست‌وجوی خود در گوگل و در کنار گزینه‌های خرید شلوار، پیراهن و دامن، گزینه‌ای به اسم «Try it on» را ببیند. گوگل در ادامه از آن‌ها خواهد خواست عکسی تمام‌قد از خود را بارگذاری کنند تا هوش مصنوعی از این طریق تصویری از کاربر را با لباس مورد نظر تولید کند.

گوگل می‌گوید این ویژگی براساس مدلی از هوش مصنوعی ساخته شده که درکی دقیق از شکل بدن انسان و نیز جزئیات لباس‌ها دارد و نحوه تا خوردن، کش آمدن یا قرار گرفتن پارچه‌های متفاوت بر روی بدن‌های مختلف را می‌شناسد.

گوگل در عین حال، قابلیت‌های دیگری را نیز برای تجربه بهتر در خرید آنلاین معرفی کرده است. این غول فناوری قصد دارد تجربه خرید از طریق «اِی‌آی مُد» (AI Mode) را نیز توسعه دهد و از این رو اعلام کرده است که این قابلیت با پشتیبانی هوش مصنوعی جمینای اکنون در اختیار کاربران بیشتری قرار گرفته است و به آن‌ها امکان می‌دهد در فرایند خرید آنلاین تجربه جدیدی داشته باشند.

برای نمونه کاربر می‌تواند به «اِی‌آی مُد» بگوید که دنبال کیفی مناسب برای سفر تابستانی به یک منطقه جنگلی و بارانی مشخص می‌گردد. گوگل بر مبنای تحلیل شرایط، می‌تواند کیف‌هایی را به او معرفی کند که برای مثال ضدآب باشند و مناسب همان سفری باشند که کاربر اعلام کرده است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار مشابه

دکمه بازگشت به بالا