
ویدئوی تعاملی؛ تجربهای فراتر از تماشا
این مدل که در حال حاضر بهصورت «نسخه آزمایشی اولیه» از طریق وب در دسترس قرار گرفته، هر چهل میلیثانیه یک فریم ویدئویی تولید و پخش میکند. کاربران میتوانند همانند بازیهای سهبعدی، در ویدئو حرکت کرده و از طریق کنترلهای ساده، بخشهای مختلف آن را کاوش کنند.
اودیسه در وبلاگ رسمی خود توضیح میدهد: «با توجه به وضعیت فعلی جهان و سوابق کنشی کاربران، مدل ما تلاش میکند تا وضعیت بعدی جهان را پیشبینی کند.»
این مدل جدید، نمایندهای از نسل آتی مدلهای جهانی است که قابلیتهایی از جمله:
• تولید پیکسلهایی با ظاهر کاملاً واقعی
• حفظ انسجام و ثبات مکانی
• یادگیری از ویدئوها
و تولید جریانهای تصویری منسجم تا پنج دقیقه یا بیشتر را در خود جای داده است.
رقابت فناوری؛ از دیپمایند تا مایکروسافت
استارتاپ اودیسه تنها بازیگر این میدان نیست. شرکتهای بزرگ و تیمهای تحقیقاتی از جمله:
• DeepMind
• آزمایشگاه World Labs به سرپرستی Fei-Fei Li
• مایکروسافت
• Decart
در حال توسعه مدلهایی با قابلیتهای مشابه هستند. آنها بر این باورند که چنین مدلهایی، آینده رسانههای تعاملی مانند فیلمها، بازیها و شبیهسازیهای پیشرفته آموزشی برای رباتها را شکل خواهند داد.
نگرانیهای خلاقان؛ تأثیرات اجتماعی هوش مصنوعی
درحالیکه شرکتها به دنبال بهرهبرداری از این فناوری هستند، فعالان حوزه خلاقیت و هنر نگرانیهایی جدی دارند. به طور مثال، گزارش Wired از استفاده گسترده Activision Blizzard از هوش مصنوعی برای کاهش هزینهها پرده برداشته است.
مطالعهای در سال ۱۴۰۳ توسط انجمن انیمیشن ایالات متحده نشان داده است که بیش از ۱۰۰ هزار شغل در حوزه فیلم، تلویزیون و انیمیشن در معرض تهدید مستقیم این فناوری قرار دارند.
در پاسخ به این نگرانیها، شرکت اودیسه تأکید دارد که هدفش همکاری با متخصصان خلاق است، نه جایگزینی آنها: «ویدئوی تعاملی دریچهای است به شکلهای نوینی از سرگرمی؛ جایی که داستانها بهصورت در لحظه و بدون محدودیتهای مرسوم تولید و بررسی میشوند.»
این شرکت معتقد است که در آینده، تمامی محتواهای ویدئویی – از آموزش و تبلیغات گرفته تا سرگرمی و سفر – به شکل تعاملی عرضه خواهند شد و این تحول، با پشتیبانی اودیسه تحقق خواهد یافت.
چالشهای فنی در نسخه اولیه
• نسخه فعلی این مدل با چالشهایی همراه است که شرکت نیز به آن اذعان دارد.
• محیطهای تولیدشده گاه تار و تحریفشده هستند.
• ثبات مکانی تضمینشده نیست و تغییر ناگهانی محیط، تجربه کاربر را تحت تأثیر قرار میدهد.
با این حال، تیم اودیسه قول داده است که این مشکلات بهسرعت برطرف شوند.
عملکرد فنی و هزینه استفاده
این مدل در حال حاضر قادر است ویدئوهایی با نرخ ۳۰ فریم بر ثانیه تولید کند. برای پردازش این حجم، از خوشههای پردازشی مبتنی بر کارتهای Nvidia H100 استفاده میشود و هزینه پخش برای هر «ساعت کاربر» بین یک تا دو دلار اعلام شده است.
مسیر آینده؛ واقعگرایی و تعامل جهانی
اودیسه برنامههای توسعه آینده خود را چنین اعلام کرده است:
• ارتقاء بازنمایی دقیق پویاییها و تثبیت حالتهای زمانی و مکانی
• گسترش تعاملات از سطح حرکتی به سطح «تعامل با جهان»
• یادگیری اعمال باز از ویدئوهای در مقیاس بزرگ
دادههای واقعی به جای دادههای عمومی
برخلاف بسیاری از رقبا، اودیسه از سیستمی اختصاصی برای جمعآوری داده استفاده میکند. این سیستم شامل دوربین ۳۶۰ درجهای است که روی کولهپشتی نصب میشود و مناظر واقعی را ضبط میکند. تیم توسعه معتقد است این دادهها میتوانند کیفیتی بالاتر از دادههای عمومی و اینترنتی به مدلها ببخشند.
سرمایهگذاران و شرکای کلیدی
تا کنون، شرکت اودیسه موفق به جذب ۲۷ میلیون دلار سرمایه از مجموعههایی همچون شده است:
• EQT Ventures
• GV
• Air Street Capital
همچنین، اد کتمول، بنیانگذار پیکسار و رئیس پیشین استودیوهای انیمیشن والت دیزنی، عضو هیئتمدیره این استارتاپ است.
نتیجهگیری
فناوری توسعهیافته توسط اودیسه، گامی مهم در مسیر تولید محتوای تعاملی و واقعگرایانه است. اگرچه چالشهای فنی و اجتماعی پیشرو وجود دارد، اما این فناوری نویدبخش آیندهای است که در آن مرز میان تولید، تجربه و تعامل، باریکتر از همیشه خواهد بود.