
به گزارش ایتنا و به نقل از تککرانچ، این ابزار که Open Computer Agent نام دارد، از طریق وب در دسترس کاربران است و روی یک ماشین مجازی لینوکس اجرا میشود؛ ماشینی که بهصورت پیشفرض چندین نرمافزار از جمله مرورگر فایرفاکس را در اختیار دارد.
مشابه با ابزار Operator در OpenAI، کاربران میتوانند از این عامل بخواهند وظایفی مانند «یافتن دفتر مرکزی Hugging Face در پاریس از طریق گوگل مپ» را انجام دهد. عامل بهصورت خودکار برنامههای لازم را باز میکند و مراحل مربوط به اجرای درخواست را پیش میبرد.
Open Computer Agent در انجام وظایف ساده عملکرد قابل قبولی دارد، اما در اجرای درخواستهای پیچیدهتر مانند جستجوی بلیت پرواز، با خطاهایی همراه بود. همچنین این عامل در مواجهه با تستهای CAPTCHA ناتوان است و نمیتواند آنها را پشت سر بگذارد.

نکته دیگر اینکه برای استفاده از این ابزار، کاربر باید مدتی در یک صف مجازی منتظر بماند؛ زمانی که بسته به میزان ترافیک ممکن است بین چند ثانیه تا چند دقیقه متغیر باشد.
هدف اصلی تیم Hugging Face از توسعه این ابزار، ساخت یک عامل قدرتمند برای کنترل کامل رایانهها نبود؛ بلکه آنها قصد داشتند نشان دهند که مدلهای هوش مصنوعی متنباز، بهمرور زمان قدرتمندتر میشوند و اجرای آنها در زیرساختهای ابری نیز مقرونبهصرفهتر خواهد شد.
ایمریک روچر، یکی از اعضای تیم توسعه عاملها در Hugging Face، در صفحهای در شبکه اجتماعی X نوشت: «با پیشرفت مداوم مدلهای بینایی، این مدلها قادر خواهند بود کارهای پیچیدهتری را در قالب عاملها اجرا کنند. برخی از این مدلها قابلیت «پایهگذاری داخلی» دارند؛ به این معنا که میتوانند هر عنصر موجود در تصویر را بر اساس مختصات آن شناسایی کرده و روی هر بخشی از تصویر یا صفحهنمایش (مثلاً در یک ماشین مجازی) کلیک کنند.»
با وجود آنکه این فناوری هنوز به بلوغ کامل نرسیده، اما حوزه عاملهای هوش مصنوعی (Agentic AI) در حال جذب سرمایهگذاریهای گسترده است. شرکتها نیز در تلاش هستند با بهرهگیری از این عاملها، بهرهوری خود را افزایش دهند.
بر اساس نتایج یک نظرسنجی جدید، ۶۵ درصد از شرکتها در حال آزمایش استفاده از عاملهای هوش مصنوعی هستند. همچنین گزارش مؤسسه Markets and Markets پیشبینی میکند که ارزش بازار عاملهای هوش مصنوعی از ۷.۸۴ میلیارد دلار در سال ۲۰۲۵ به ۵۲.۶۲ میلیارد دلار تا سال ۲۰۳۰ افزایش خواهد یافت.