ایتنافناوری

سقوط Llama 4؛ چرا توسعه‌دهندگان همچنان به سراغ Llama 3 می‌روند؟

روز سه‌شنبه، شرکت متا میزبان نخستین کنفرانس توسعه‌دهندگان هوش مصنوعی خود با نام LlamaCon در دفتر مرکزی منلو پارک خواهد بود.

به گزارش ایتنا و به نقل از تک‌کرانچ، هدف این رویداد، راهنمایی توسعه‌دهندگان در ساخت برنامه‌های کاربردی مبتنی بر مدل‌های متن‌باز Llama است. با این حال، برخلاف یک سال پیش که این مسیر هموارتر به نظر می‌رسید، امروز متا با چالش‌های جدی در رقابت با رقبایی مانند DeepSeek (در حوزه مدل‌های باز) و OpenAI (در بخش مدل‌های تجاری بسته) روبه‌رو است.
 

لحظه‌ای سرنوشت‌ساز برای متا

کنفرانس LlamaCon در شرایطی برگزار می‌شود که متا تلاش می‌کند اکوسیستم Llama را گسترش دهد. هرچند جذب توسعه‌دهندگان ممکن است در گرو ارائه مدل‌های به‌روز و کارآمد باشد، اما دستیابی به این هدف به سادگی گذشته نیست.
 

شروعی امیدوارکننده، اما افولی ناگهانی

ارائه Llama 4 توسط متا در اوایل این ماه، با انتقادهایی همراه بود، چرا که در برخی معیارهای عملکرد، پشت سر مدل‌هایی مانند R1 و V3 محصول DeepSeek قرار گرفت. این در حالی است که Llama 3.1 405B (مدل قبلی متا) با استقبال چشمگیری روبه‌رو شده بود. مارک زاکربرگ، مدیرعامل متا، این مدل را «قدرتمندترین مدل بنیادی موجود» خوانده بود که حتی با GPT-4o (مدل برتر OpenAI در آن زمان) رقابت می‌کرد.

جرمی نیکسون، میزبان هکاتون‌های هوش مصنوعی در سانفرانسیسکو، عرضه Llama 3 را «لحظه‌ای تاریخی» توصیف کرده بود. این مدل نه‌تنها عملکردی پیشرفته داشت، بلکه به توسعه‌دهندگان آزادی عمل می‌داد تا آن را روی پلتفرم‌های مختلف اجرا کنند. حتی امروز نیز Llama 3.3 دانلودهای بیشتری نسبت به Llama 4 دارد.
 

 

چالش‌های Llama 4: از بنچمارک‌های بحث‌برانگیز تا مدل‌های حذف‌شده

یکی از نقاط ضعف Llama 4، ابهام در نتایج بنچمارک‌ها بود. متا نسخه‌ای بهینه‌شده از مدل Maverick را برای آزمون LM Arena استفاده کرد که به رتبه اول دست یافت، اما این نسخه هرگز منتشر نشد. نسخه عمومی Maverick عملکرد ضعیف‌تری داشت و این موضوع انتقاد جامعه توسعه‌دهندگان را برانگیخت.

یون استویکا، از بنیانگذاران LM Arena و استاد دانشگاه برکلی، به تک‌کرانچ گفت:
«متا باید به‌صورت شفاف اعلام می‌کرد که مدل مورد استفاده در آزمون با نسخه عمومی متفاوت است. این اتفاق اعتماد جامعه را کاهش می‌دهد، اما آنها می‌توانند با ارائه مدل‌های بهتر، دوباره این اعتماد را جلب کنند.»
 

حذف مدل استدلال: نشانه‌ای از عجله؟

نکته قابل تأمل دیگر، عدم ارائه مدل استدلال در خانواده Llama 4 بود. این مدل‌ها که توانایی تحلیل سوالات قبل از پاسخ‌دهی را دارند، اخیراً توسط بسیاری از رقبا عرضه شده‌اند. متا اگرچه روی چنین مدلی کار می‌کند، اما زمان دقیقی برای انتشار آن اعلام نکرده است.

ناتان لمبرت، محقق مؤسسه Ai2، معتقد است این تصمیم نشان‌دهنده عجله متا در عرضه است:
«چرا متا نتوانست مانند رقبا یک مدل استدلال ارائه دهد؟ این سوال بی‌پاسخ مانده است. به نظر می‌رسد این یک اشتباه غیرمنطقی در مدیریت محصول بوده است.»
 

رقبای جدید و فشار فزاینده

رقبای متا، مانند علی‌بابا، با عرضه مدل‌هایی مانند Qwen 3 (که در معیارهای کدنویسی از برخی محصولات OpenAI و گوگل پیشی گرفته) فشار را افزایش داده‌اند. راوید شوارتز-زیو، پژوهشگر هوش مصنوعی در دانشگاه نیویورک، معتقد است متا برای بازگشت به رقابت، باید مدل‌های قوی‌تری ارائه دهد، حتی اگر این کار مستلزم ریسک‌های فناورانه باشد.
 

آینده مبهم متا

با خروج جوئل پینو (معاون تحقیقات هوش مصنوعی متا) و گزارش‌های داخلی از «رکود تحقیقاتی» در این شرکت، آینده متا در این حوزه نامشخص به نظر می‌رسد. LlamaCon فرصتی است برای متا تا نشان دهد آیا می‌تواند در رقابت با غول‌هایی مانند OpenAI، گوگل و xAI پیروز شود یا خیر. در غیر این صورت، ممکن است روزبه‌روز از قافله عقب بماند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار مشابه

دکمه بازگشت به بالا