Проблемы в работе Агентов метрик

Если Агенты метрик установлены, но логи отсутствуют, необходимо выяснить от какой части системы отсутвуют данные. Для этого перейдите в веб-интерфейс VictoriaMetrics. Он доступен по ссылке:

https://<vision_ip>/vision/victoriametrics/vmui

Здесь <vision_ip> — IP-адрес сервера Визион.

В открывшемся интерфейсе вы сможете проверить наличие временных рядов в системе, используя PromQL-запросы.

Имя пользователя и пароль технической учётной записи указываются в файле _deploy_settings.yml, расположенном в корне дистрибутива.

При недоступности интерфейса VictoriaMetrics проверьте работу сервисов victoriametrics_st.service и nginx.service.

Важно
Все изменения в файлах конфигурации агентов/экспортеров выполненные вручную, могут быть перезаписаны при переустановке компонента из интерфейса.

Отсутствие данных с Прокси метрик#

PromQL-запрос:

up{_pak_id="<ИМЯ-ПАК>", job="vmagent_proxy"}

Если временной ряд отсутствует, проверьте работоспособность сервиса vision_vmagent_proxy.service на узле, где он установлен (выбирается при установке Агентов метрик).

Если сервис имеет статус active, но данных в базе временных рядов нет, убедитесь, что с узла, где расположен Прокси метрик, есть возможность отправлять данные в VictoriaMetrics по HTTPS.

Например, результат выполнения этой команды должен быть OK:

curl -k https://<user>:<pass>@<ip-vision>/vision/victoriametrics/health

Отсутствие данных с Агентов метрик#

PromQL-запросы:

up{_node_id="<ИМЯ-СЕРВЕРА>", job="vmagent_agent"}
up{_vm_id="<ИМЯ-ВМ>", job="vmagent_agent"}

Если временной ряд отсутствует, проверьте работоспособность сервиса vision_vmagent_agent.service на узле, где он установлен.

Если сервис имеет статус active, но данных в базе временных рядов нет, убедитесь, что с узла, где расположен Агент, есть возможность отправлять данные в Прокси по HTTPS через порт 8430.

Например, результат выполнения этой команды должен быть OK:

curl -k https://<user>:<pass>@<ip-vision>:8430/health

Отсутствие данных с плагинов (экспортеры/скреперы)#

PromQL-запросы:

up{_node_id="<ИМЯ-СЕРВЕРА>", job="<ИМЯ-ПЛАГИНА>"}
up{_vm_id="<ИМЯ-ВМ>", job="<ИМЯ-ПЛАГИНА>"}

Если временной ряд отсутствует, проверьте работоспособность сервиса vision_<ИМЯ-ПЛАГИНА>.service на узле, где он установлен (только в случае экспортера).

Если временной ряд присутствует, но его значение равно 0, проверьте параметры плагина в интерфейсе Визиона на корректность. Например, данные авторизации, адрес сервиса/источника метрик, порт и т. п.

Превышение таймаута сбора метрик с помощью плагинов#

PromQL-запрос:

scrape_duration_seconds{_pak_id="<ИМЯ-ПАК>"} > scrape_timeout_seconds{_pak_id="<ИМЯ-ПАК>"} * 0.5

График с данным запросом отображает проблемы с продолжительностью сбора метрик.

Если временные ряды присутствуют, то необходимо в интерфейсе Визиона в параметрах соответствующих плагинов (имя плагина соответствует метке job) увеличить таймаут в поле Scrape Timeout.

Важно
Значение Scraper Timeout не должно превышать значение Scrape Interval.