Веб-агенты LangChain и AgentQL: новая эра парсинга без селекторов

Новости

Разработчики представили демонстрацию автономных ИИ-агентов, использующих связку LangChain и AgentQL для интеллектуального извлечения данных. Технология позволяет отказаться от хрупких селекторов и автоматически адаптироваться к изменениям структуры веб-страниц.

Разработчики реализовали систему на базе специализированного языка запросов AgentQL, который интегрирован в экосистему LangChain для создания автономных веб-агентов. Бэкенд инструмента построен на фреймворке FastAPI с использованием языка Python. Для тестирования запросов предусмотрен интерфейс Swagger. Управление браузером и навигация по сайтам осуществляются через библиотеку автоматизации Playwright.

В ходе демонстрации система успешно распознала названия тарифных планов и актуальные цены на сайте monday.com без предварительной настройки селекторов. ИИ-агент в реальном времени обработал структуру страницы и сформировал список доступных опций: бесплатные, базовые, стандартные, профессиональные и корпоративные тарифы. Такой подход исключает ошибки парсинга при обновлении верстки ресурса, так как алгоритм ориентируется на содержание конкретных элементов.

Новый инструмент автоматизирует мониторинг цен конкурентов в банковской сфере и страховании. Компании получают возможность собирать данные для маркетинговых исследований без необходимости постоянной поддержки кода скраперов. Для работы системы пользователю требуется предоставить ключ API AgentQL вместе с автоматизацией через библиотеку Playwright. Технология ориентирована на сектора экономики, требующие оперативного анализа рыночных предложений.