До этого скилла у меня был отдельный pet-hate: задачи вида «проверь, что сценарий регистрации на стейдже не сломан». Писать Playwright-тесты ради разового прогона — лень, делать руками — скучно, просить Claude — бесполезно, он же живой сайт не видит.
Поставил
agent-browser
(в Awesome Agent Skills он же встречается как
) и этот класс задач у меня закрылся. Агент получает настоящий браузер — не догадки по DOM, а нормальную сессию Chromium. Он реально открывает страницу, делает снимок, получает ссылки на элементы вида
и дальше кликает, заполняет, скроллит, перетаскивает, загружает файлы, работает с iframe и диалогами.
Что зашло в работу
Стабильные ref-селекторы. Агент не ломается от того, что у кнопки поменялся класс — он цепляется за свой ref из свежего снимка.
Перехват сети. Я мокаю ответы API прямо из промпта, для auth-флоу подставляю заголовки — без возни с логинами.
Параллельные сессии с разными cookies — удобно тестировать роли (admin vs user) одновременно.
Подключается облачный Chromium (Browserbase, Browser Use, Kernel) одним флагом — на слабом Mac это спасение.
Есть поддержка iOS Simulator через Appium. Мобильный Safari тестируется без отдельного стенда.
Где применяю
Smoke-тесты перед релизом, ресёрч конкурентов, сбор данных с JS-рендером, парсинг внутренних панелей без API, автоматизация рутинных действий в веб-интерфейсах SaaS.
Как поставить
На сайте
и в репозитории
VoltAgent/awesome-agent-skills
лежит актуальная версия с инструкциями. У скилла 14k+ звёзд на GitHub, поддержка Claude Code, Cursor, Codex, Gemini CLI и Copilot.
Минус, о котором стоит знать
Вкладки живут реальное время и реальные ресурсы. Я всегда запускаю в изолированной песочнице и с таймаутом — иначе агент зависнет на модалке и спалит токены. В остальном — золото.