Компанія Hugging Face випустила у вільний доступ нового ІІ-агента під назвою Open Computer Agent. Цей агент працює на віртуальній машині з операційною системою Linux у хмарі та має попередньо встановлені додатки, включаючи браузер Firefox. Користувачі можуть доручати агенту виконання різноманітних завдань, наприклад, знайти штаб-квартиру Hugging Face в Парижі за допомогою Google Maps.

Open Computer Agent ефективно справляється з простими запитами. Проте під час тестування виявлено, що агент має труднощі з виконанням складніших завдань, таких як пошук авіарейсів, та не здатен проходити CAPTCHA. Крім того, перед використанням агентом може знадобитися деякий час очікування в черзі, що залежить від поточного навантаження на систему.
Метою запуску Open Computer Agent є демонстрація того, що відкриті моделі штучного інтелекту стають дедалі функціональнішими та доступнішими для використання в хмарній інфраструктурі. За словами Емеріка Руше, члена команди розробників агентів у Hugging Face, сучасні моделі комп’ютерного зору здатні керувати складними робочими процесами, включаючи взаємодію з елементами інтерфейсу на віртуальній машині.
We're launching Computer Use in smolagents! 🥳
— m_ric (@AymericRoucher) May 6, 2025
-> As vision models become more capable, they become able to power complex agentic workflows. Especially Qwen-VL models, that support built-in grounding, i.e. ability to locate any element in an image by its coordinates, thus to… pic.twitter.com/mI8MuWZkIS
Попри те, що технології ІІ-агентів ще потребують вдосконалення, вони привертають усе більше уваги та інвестицій. За даними недавнього опитування KPMG, 65% компаній експериментують з ІІ-агентами. Згідно з прогнозами Markets and Markets, ринок ІІ-агентів зросте з 7,84 млрд доларів у 2025 році до 52,62 млрд доларів до 2030 року.