Справочник метрик

Все метрики группируются путём указания объекта иерархии, к которому они относятся. Например, метрики сервера, собираемые различными способами (локально с ОС или через протокол IPMI) должны быть отнесены к объекту типа node.

Метрики типа PROMQL#

Метрики, получаемые из экспортеров, собираемые с инструментированных эндпоинтов или вычисляемые с использованием правил перезаписи Prometheus

Базовые метрики

Метрики, применяемые во всех ПАК

Состояние компонента мониторинга vmagent#

Автоматически собираются после установки агента метрик.

Название Описание
vmagent_availability_status Состояние доступности компонента мониторинга vmagent. Возвращает значение 0, если компонент недоступен. Возвращает значение 1, если компонент доступен.

Plagent#

Автоматически собираются после установки Plagent.

Название Описание Генерируемые метки
plagent_build_info Информация о версии, ревизии, ветке, goversion, на основе которого был собран plagent, а также goos и goarch branch, revision, goarch, goversion, goos, tags, version
plagent_plugin_error_count Количество ошибок вызова плагинов plagent name
plagent_plugin_info Информация об имени плагина и его версии name, version
plagent_sudo_available Статус доступности sudo во время запуска plagent

Описание меток:

  • branch — ветка,
  • revision — ревизия Plagent,
  • goarch — GOARCH,
  • goversion — версия Go,
  • goos — GOOS,
  • tags — теги,
  • version — версия компонента,
  • name — имя плагина.

Коммутатор#

Собираются snmp_exporter’ом

Название Описание Генерируемые метки
ifAdminStatus Желаемое состояние интерфейса — 1.3.6.1.2.1.2.2.1.7. IfAlias, ifDescr, ifIndex, ifName
ifConnectorPresent Этот объект имеет значение 1, если подуровень интерфейса имеет физический разъем, и значение 2 в противном случае. - 1.3.6.1.2.1.31.1.1.1.17 IfAlias, ifDescr, ifIndex, ifName
ifCounterDiscontinuityTime Значение sysUpTime в последний раз, когда в одном или нескольких счетчиках этого интерфейса произошел сбой — 1.3.6.1.2.1.31.1.1.1.19. IfAlias, ifDescr, ifIndex, ifName
ifHCInBroadcastPkts Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.9 IfAlias, ifDescr, ifIndex, ifName
ifHCInMulticastPkts Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по многоадресному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.8 IfAlias, ifDescr, ifIndex, ifName
ifHCInOctets Общее количество октетов, полученных по интерфейсу, включая символы кадрирования — 1.3.6.1.2.1.31.1.1.1.6 IfAlias, ifDescr, ifIndex, ifName
ifHCInUcastPkts Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые не были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.7 IfAlias, ifDescr, ifIndex, ifName
ifHCOutBroadcastPkts Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы широковещательному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.13 IfAlias, ifDescr, ifIndex, ifName
ifHCOutMulticastPkts Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы многоадресному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.12 IfAlias, ifDescr, ifIndex, ifName
ifHCOutOctets Общее количество октетов, передаваемых из интерфейса, включая символы кадрирования - 1.3.6.1.2.1.31.1.1.1.10. IfAlias, ifDescr, ifIndex, ifName
ifHCOutUcastPkts Общее количество пакетов, которые запросили передать протоколы более высокого уровня, и которые не были адресованы по групповому или широковещательному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.11 IfAlias, ifDescr, ifIndex, ifName
ifHighSpeed Оценка текущей пропускной способности интерфейса в единицах 1 000 000 бит в секунду - 1.3.6.1.2.1.31.1.1.1.15 IfAlias, ifDescr, ifIndex, ifName
ifInBroadcastPkts Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.3 IfAlias, ifDescr, ifIndex, ifName
ifInDiscards Количество входящих пакетов, которые были выбраны для отбрасывания, хотя ошибок не было обнаружено, чтобы предотвратить их доставку в протокол более высокого уровня - 1.3.6.1.2.1.2.2.1.13 IfAlias, ifDescr, ifIndex, ifName
ifInErrors Для пакетно-ориентированных интерфейсов количество входящих пакетов, содержащих ошибки, препятствующие их доставке протоколу более высокого уровня - 1.3.6.1.2.1.2.2.1.14. IfAlias, ifDescr, ifIndex, ifName
ifInMulticastPkts Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по групповому адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.2 IfAlias, ifDescr, ifIndex, ifName
ifInNUcastPkts Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.2.2.1.12 IfAlias, ifDescr, ifIndex, ifName
ifInOctets counter ifInOctets Общее количество октетов, полученных по интерфейсу, включая символы кадрирования — 1.3.6.1.2.1.2.2.1.10. IfAlias, ifDescr, ifIndex, ifName
ifInUcastPkts Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые не были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.2.2.1.11 IfAlias, ifDescr, ifIndex, ifName
ifInUnknownProtos Для пакетно-ориентированных интерфейсов количество полученных через интерфейс пакетов, которые были отброшены из-за неизвестного или неподдерживаемого протокола — 1.3.6.1.2.1.2.2.1.15. IfAlias, ifDescr, ifIndex, ifName
ifIndex Уникальное значение, большее нуля, для каждого интерфейса — 1.3.6.1.2.1.2.2.1.1. IfAlias, ifDescr, ifIndex, ifName
ifLastChange Значение sysUpTime на момент перехода интерфейса в текущее рабочее состояние — 1.3.6.1.2.1.2.2.1.9. IfAlias, ifDescr, ifIndex, ifName
ifLinkUpDownTrapEnable Указывает, следует ли генерировать ловушки linkUp/linkDown для этого интерфейса — 1.3.6.1.2.1.31.1.1.1.14. IfAlias, ifDescr, ifIndex, ifName
ifMtu Размер самого большого пакета, который можно отправить/получить на интерфейсе, указанный в октетах - 1.3.6.1.2.1.2.2.1.4. IfAlias, ifDescr, ifIndex, ifName
ifNumber Количество сетевых интерфейсов (независимо от их текущего состояния), присутствующих в этой системе. - 1.3.6.1.2.1.2.1
ifOutBroadcastPkts Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы на широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.5 IfAlias, ifDescr, ifIndex, ifName
ifOutDiscards Количество исходящих пакетов, которые были выбраны для отбрасывания, даже если не было обнаружено ошибок, предотвращающих их передачу - 1.3.6.1.2.1.2.2.1.19 IfAlias, ifDescr, ifIndex, ifName
ifOutErrors Для пакетно-ориентированных интерфейсов количество исходящих пакетов, которые не удалось передать из-за ошибок - 1.3.6.1.2.1.2.2.1.20. IfAlias, ifDescr, ifIndex, ifName
ifOutMulticastPkts Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы многоадресному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.4 IfAlias, ifDescr, ifIndex, ifName
ifOutNUcastPkts Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы на многоадресный или широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.2.2.1.18 IfAlias, ifDescr, ifIndex, ifName
ifOutOctets Общее количество октетов, передаваемых из интерфейса, включая символы кадрирования — 1.3.6.1.2.1.2.2.1.16. IfAlias, ifDescr, ifIndex, ifName
ifOutQLen Длина очереди выходных пакетов (в пакетах). - 1.3.6.1.2.1.2.2.1.21. IfAlias, ifDescr, ifIndex, ifName
ifOutUcastPkts Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые не были адресованы на групповой или широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.2.2.1.17 IfAlias, ifDescr, ifIndex, ifName
ifPhysAddress Адрес интерфейса на подуровне протокола — 1.3.6.1.2.1.2.2.1.6. IfAlias, ifDescr, ifIndex, ifName, ifPhysAddress
ifPromiscuousMode Этот объект имеет значение false(2), если этот интерфейс принимает только пакеты/кадры, адресованные этой станции - 1.3.6.1.2.1.31.1.1.1.16 IfAlias, ifDescr, ifIndex, ifName
ifSpecific Ссылка на определения MIB, специфичные для конкретного носителя, используемого для реализации интерфейса - 1.3.6.1.2.1.2.2.1.22 IfAlias, ifDescr, ifIndex, ifName
ifSpeed Оценка текущей пропускной способности интерфейса в битах в секунду — 1.3.6.1.2.1.2.2.1.5 IfAlias, ifDescr, ifIndex, ifName
ifType_info Тип интерфейса - 1.3.6.1.2.1.2.2.1.3 (EnumAsInfo) IfAlias, ifDescr, ifIndex, ifName, ifType
sysUpTime Время (в сотых долях секунды) с момента последней повторной инициализации части управления сетью системы. - 1.3.6.1.2.1.1.3

Описание меток:

  • ifAlias — описание или псевдоним интерфейса.
  • ifDescr — текстовое описание интерфейса.
  • ifIndex — уникальный индекс интерфейса в системе.
  • ifName — логическое имя интерфейса.
  • ifPhysAddress — физический (MAC) адрес интерфейса.
  • ifType — тип интерфейса (например, ethernetCsmacd).

Сервисы ОС#

Собираются systemd_exporter’ом

Название Описание Генерируемые метки
systemd_unit_info Мета-дата про все unit name, type, mount_type, service_type, state
systemd_unit_state Состояние systemd unit name, type
systemd_socket_refused_connections_total Суммарное число отклонённых сокет-соединений name
systemd_timer_last_trigger_seconds Время, прошедшее с последнего триггера name
systemd_watchdog_enabled Сторожевой таймер запущен
systemd_watchdog_last_ping_monotonic_seconds Время, прошедшее с момента последнего успешного сигнала watchdog от службы, измеренное в монотонных секундах
systemd_watchdog_last_ping_time_seconds Время последнего успешного пинга от systemd watchdog
systemd_watchdog_runtime_seconds Время работы службы с момента последнего успешного сигнала watchdog
systemd_unit_active_enter_time_seconds Последний раз, когда unit перешёл в активное состояние name
systemd_unit_active_exit_time_seconds Последний раз, когда unit вышел из активного состояния name
systemd_unit_inactive_enter_time_seconds Последний раз, когда unit перешёл в неактивное состояние name, type
systemd_unit_inactive_exit_time_seconds Последний раз, когда unit вышел из неактивного состояния name, type
systemd_unit_tasks_current Текущее число задач на каждый systemd unit name
systemd_unit_tasks_max Максимальное число задач на каждый systemd unit name, type
systemd_unit_start_time_seconds Время запуска unit с 01.01.70 name, type
systemd_service_restart_total Количество перезапусков службы
systemd_service_ip_egress_bytes Общее количество исходящей информации в байтах
systemd_service_ip_ingress_bytes Общее количество входящей информации в байтах
systemd_service_ip_ingress_packets_total Общее количество входящих сетевых пакетов, отправленных службой
systemd_service_ip_egress_packets_total Общее количество исходящих сетевых пакетов, отправленных службой
systemd_socket_accepted_connections_total Суммарное количество принятых сокет-соединений name
`systemd_socket_current_connections Текущее число сокет-соединений name

Описание меток:

  • name — Наименование unit
  • type — Категория unit (service, timer, target, mount, socket, …)
  • mount_type — Тип файловой системы для type=“mount” (binfmt_misc, configfs, debugfs, ext4, — fusectl, hugetlbfs, mqueue, tracefs, vfat)
  • service_type — Тип сервиса (simple, exec, forking, oneshot, dbus, notify, notify-reload, idle)
  • state — Состояние unit (activating/active/deactivating/failed/inactive)

Метки:

Метрика Метки
systemd_unit_info name, type, mount_type, service_type, state
systemd_unit_state name, type
systemd_unit_tasks_current name
systemd_unit_tasks_max name
systemd_unit_start_time_seconds name, type
systemd_socket_accepted_connections_total name
systemd_socket_current_connections name
systemd_socket_refused_connections_total name
systemd_timer_last_trigger_seconds name
systemd_unit_active_enter_time_seconds name, type
systemd_unit_active_exit_time_seconds name, type
systemd_unit_inactive_enter_time_seconds name, type
systemd_unit_inactive_exit_time_seconds name, type

МХД.О/ШлюзS3МодульКомпрессии#

Собираются путем опроса Prometheus-эндпоинта компонента S3 шлюза — сервиса компрессии S3 (s3gateway-compression-server). Собирается s3gateway_compression_server_scraper.

Название Описание Метки
s3_compressor_after_compression_bytes Размер данных после сжатия
s3_compressor_after_decompression_bytes Размер данных после распаковки
s3_compressor_before_compression_bytes Размер данных для сжатия
s3_compressor_before_decompression_bytes Размер данных для распаковки
s3_compressor_build_info Информация о сборке шлюза (в метках) branch, goversion, revision, version
s3_compressor_compress_operations Количество операций сжатия
`s3_compressor_decompress_operations Количество операций распаковки

Описание меток:

  • branch — Ветка сборки шлюза.
  • goversion — Версия go сборки.
  • revision — Ревизия сьорки
  • version — Версия сборки шлюза.

МХД.О/Кластер Хранения#

Собираются путем опроса Prometheus-эндпоинта компонента S3 шлюза — сервиса ostor (s3gateway-ostor-server) В данные момент метрики на согласовании, представлена текущая реализация. Собираются s3gateway_ostor_server_scraper.

Название Описание Метки
vstorage_cluster_space Параметры объёма дискового пространства кластера хранения cluster_name, type
vstorage_cluster_status Информация о кластере хранения cluster_id, cluster_name, status
vstorage_cs_chunks Количество чанков CS по статусам кластера хранения cluster_name, cs_id, status
vstorage_cs_replicas Количество реплик CS кластера хранения cluster_name, cs_id
vstorage_cs_space Параметры объёма дискового пространства CS кластера хранения (в байтах) cluster_name, cs_id, type
vstorage_cs_status Статус CS кластера хранения cluster_name, cs_host, cs_id, status
vstorage_mds_mem_usage Использование памяти MDS кластера хранения cluster_name, mds_id
vstorage_mds_status Статус MDS кластера хранения cluster_name, mds_host, mds_id, status
vstorage_mds_uptime Время работы MDS кластера хранения cluster_name, mds_id

Описание меток:

  • cluster_id — идентификатор кластера.
  • cluster_name — имя кластера хранения.
  • cs_host — хост, на котором находится CS.
  • cs_id — идентификатор чанка CS.
  • mds_host — хост, на котором находится MDS.
  • mds_id — идентификатор MDS.
  • status — статус компонента (например, “healthy”, “blocked”, “active”).
  • type — тип объёма дискового пространства.

МВ.ВРМ#

Собираются путем опроса Prometheus-эндпоинта компонента ВРМ.

Название Описание Метки
supv_vrm_broker_active_connections Активные соединения vrm
supv_vrm_broker_active_sessions Активные сессии vrm
supv_vrm_health_all_ok Общее состояние ВРМ vrm
supv_vrm_health_broker_manager Состояние брокер менеджера vrm
supv_vrm_health_conf Состояние конфигураций vrm
supv_vrm_health_db_read Состояние БД на чтение vrm
supv_vrm_health_db_write Состояние БД на запись vrm
supv_vrm_health_redis_read Доступ к КЭШ БД (Redis) на чтение vrm
supv_vrm_health_redis_write Доступ к КЭШ БД (Redis) на запись vrm

Описание меток:

  • vrm — имя ВРМ.

МБД.П/Spectrum_agent#

Собираются путем опроса Prometheus-эндпоинта компонента Spectrum_agent. Собираются spectrum_agent_scraper.

Название Описание
spectrum_autovacuum_duration Длительность процессов autovacuum секунд
spectrum_autovacuum_proc_count Количество процессов autovacuum
spectrum_autovacuum_tx_until_wraparound Транзакций до wraparound
spectrum_database_size_bytes Размер базы данных байт
spectrum_lag_storage_flush_diff_bytes Количество байт, записанных, но ещё не сброшенных на диск на данной реплике
spectrum_lag_storage_pending_diff_bytes Количество байт, ожидающих передачи на реплику
spectrum_lag_storage_replay_diff_bytes Количество байт, сброшенных на диск, но ещё не воспроизведенных на реплике
spectrum_lag_storage_total_lag_diff_bytes Суммарное отставание реплики в байтах
spectrum_lag_storage_write_diff_bytes Количество байт, переданных на реплику, но ещё не записанных на диск
spectrum_postgresql_sessions_count Количество сессий
spectrum_postgresql_sessions_count_total Количество сессий общее
spectrum_postgresql_sessions_locks Количество сессий в ожидании Lock
spectrum_table_dead_tuples_count Таблицы по количеству dead tuples
spectrum_table_heap_blks_hit_count Таблицы попаданию в буферный кэш
spectrum_table_heap_blks_read_count Таблицы по чтению с диска
spectrum_table_size_bytes Таблицы по объёму байт
spectrum_table_toast_size_bytes Таблицы по объёму байт таблиц TOAST
spectrum_top10_table_dead_tuples_count_topk Топ 10 таблиц по количеству dead tuples
spectrum_top10_table_heap_blks_hit_count_topk Топ 10 таблиц по попаданию в буферный кэш
spectrum_top10_table_heap_blks_read_count_topk Топ 10 таблиц по чтению с диска
spectrum_top10_table_size_bytes_topk Топ 10 таблиц по объёму байт
spectrum_top10_table_toast_size_bytes_topk Топ 10 таблиц по объёму байт таблиц TOAST
spectrum_wal_archiver_failed_count Количество ошибок архивации WAL
spectrum_wal_count Количество WAL
spectrum_wal_size_bytes Объём WAL байт
spectrum_wal_temp_count Количество WAL temp-файлов
spectrum_wal_temp_size_bytes Объём WAL temp-файлов байт
spectrum_wal_time_from_last_checkpoint_sec Время с последней записи контрольной точки (CHECKPOINT) секунд

МБД.С/Kafka#

Собираются kafka_exporter’ом и graphite_exporter’ом

Метрика Описание
kafka_broker_info Информация о брокере Kafka.
kafka_brokers Количество брокеров в кластере Kafka.
kafka_consumergroup_members Количество участников в потребительской группе.
kafka_topic_partition_current_offset Текущий смещение брокера для Топика/Раздела.
kafka_topic_partition_in_sync_replica Количество синхронизированных реплик для Топика/Раздела.
kafka_topic_partition_leader ID лидера брокера для этого Топика/Раздела.
kafka_topic_partition_leader_is_preferred 1, если Топик/Раздел использует предпочтительного брокера.
kafka_topic_partition_oldest_offset Самое старое смещение брокера для Топика/Раздела.
kafka_topic_partition_replicas Количество реплик для Топика/Раздела.
kafka_topic_partition_under_replicated_partition 1, если Топик/Раздел не имеет достаточного количества реплик.
kafka_topic_partitions Количество разделов для Топика.

Описание меток:

  • address — IP кафка-сервера
  • id — ID брокера
  • consumergroup — Имя потребительской группы
  • partition — раздел
  • topic — Топик
  • service — Имя сервиса, к которому относится значение
  • type — тип метрики
  • host — узел, с которого собрана метрика
  • cluster — кластер, к которому относится собранная метрика

Метки и метрики:

Метрика Метки
kafka_broker_info address, id
kafka_consumergroup_members partition, topic, consumergroup
kafka_topic_partition_current_offset partition, topic
kafka_topic_partition_in_sync_replica partition, topic
kafka_topic_partition_leader partition, topic
kafka_topic_partition_leader_is_preferred partition, topic
kafka_topic_partition_oldest_offset partition, topic
kafka_topic_partition_replicas partition, topic
kafka_topic_partition_under_replicated_partition partition, topic
kafka_topic_partitions topic
kafka_session_zookeeper_sync_connects_per_sec service, type, host, cluster

МДИ.О/Patroni и PostgreSQL#

Таблица метрик#

Метрика Описание
patroni_cluster_unlocked Состояние блокировки кластера Patroni: 1 — разблокирован, 0 — заблокирован
patroni_dcs_last_seen Время последней связи Patroni с DCS в формате Unix timestamp
patroni_failsafe_mode_is_active Состояние аварийного режима (failsafe) Patroni: 1 — активен, 0 — нет
patroni_is_paused Состояние паузы автоматического failover-переключения Primary/Replica (Patroni): 1 — пауза, 0 — нет
patroni_pending_restart Состояние необходимости перезагрузки (Patroni): 1 — требуется, 0 — нет
patroni_postgres_in_archive_recovery Режим восстановления из архива PostgreSQL (Patroni): 1 — активно, 0 — нет
patroni_postgres_running Состояние PostgreSQL (Patroni): 1 — запущен, 0 — остановлен
patroni_postgres_server_version Версия PostgreSQL (Patroni) в числовом формате
patroni_postgres_state Числовое представление состояния PostgreSQL
patroni_postgres_streaming Состояние потоковой репликации PostgreSQL (Patroni): 1 — streaming, 0 — нет
patroni_postgres_timeline Состояние timeline PostgreSQL для узла Patroni: > 0 — текущая, 0 — не работает
patroni_postmaster_start_time Время запуска Postmaster (Patroni) в формате Unix timestamp
patroni_primary Роль узла Patroni: 1 — primary/лидер, 0 — replica
patroni_quorum_standby Узел в роли кворумной реплики Patroni: 1 — кворумная, 0 — нет
patroni_replica Узел в роли реплики Patroni: 1 — реплика, 0 — нет
patroni_standby_leader Узел в роли standby-лидера Patroni: 1 — standby лидер, 0 — нет
patroni_sync_standby Узел в роли синхронной реплики Patroni: 1 — синхронная, 0 — нет
patroni_version Версия Patroni, целочисленное
patroni_xlog_location Текущее местоположение записи WAL PostgreSQL для узла Patroni (для лидера)
patroni_xlog_paused Состояние паузы журнала транзакций PostgreSQL для узла Patroni: 1 — пауза, 0 — нет
patroni_xlog_received_location Текущее местоположение принятого WAL PostgreSQL для узла Patroni (для реплики)
patroni_xlog_replayed_location Текущее местоположение воспроизведённого WAL PostgreSQL для узла Patroni (для реплики)
patroni_xlog_replayed_timestamp Временная метка примененного WAL PostgreSQL для узла Patroni в формате Unix timestamp

Таблица меток#

  • scope — имя кластера Patroni/PostgreSQL;

  • name — имя узла Patroni в кластере.

Метки и метрики:

Метрика Метки
patroni_cluster_unlocked scope, name
patroni_dcs_last_seen scope, name
patroni_failsafe_mode_is_active scope, name
patroni_is_paused scope, name
patroni_pending_restart scope, name
patroni_postgres_in_archive_recovery scope, name
patroni_postgres_running scope, name
patroni_postgres_server_version scope, name
patroni_postgres_state scope, name
patroni_postgres_streaming scope, name
patroni_postgres_timeline scope, name
patroni_postmaster_start_time scope, name
patroni_primary scope, name
patroni_quorum_standby scope, name
patroni_replica scope, name
patroni_standby_leader scope, name
patroni_sync_standby scope, name
patroni_version scope, name
patroni_xlog_location scope, name
patroni_xlog_paused scope, name
patroni_xlog_received_location scope, name
patroni_xlog_replayed_location scope, name
patroni_xlog_replayed_timestamp scope, name

VControl/Состояние кластера#

Таблица метрик#

Метрика Описание
vcontrol_clickhouse_enabled Статус включения ClickHouse
vcontrol_clickhouse_up Статус работоспособности ClickHouse
vcontrol_db_read_state Статус доступности ClickHouse для чтения
vcontrol_db_write_state Статус доступности ClickHouse для записи
vcontrol_memdb_read_state Статус доступности Redis для чтения
vcontrol_memdb_write_state Статус доступности Redis для записи
vcontrol_redis_server_master Является ли сервер Redis мастером
vcontrol_redis_server_subjective_status Доступен ли сервер Redis с текущего хоста
vcontrol_redis_server_objective_status Доступен ли сервер Redis с кластера
vcontrol_redis_server_master_connection Подключен ли slave-сервер Redis к master
vcontrol_sentinel_status Статус сервера Redis Sentinel
vcontrol_vip_status Статус виртуального IP
vcontrol_backend_status Статус сервера бэкенда
vcontrol_manager_status Статус управляющих узлов
vcontrol_agent_status Статус клиентских узлов
vcontrol_cluster_status Статус кластера МВ.С
vcontrol_node_online_count Статус узлов МВ.С
vcontrol_cluster_balancing_percent Информация о балансировке кластера vControl
vcontrol_storage_info Информация о типе хранилища vControl
vcontrol_storage_status Статус работоспособности хранилища vControl
vcontrol_storage_memory_mbytes_total Общий объём хранилища vControl в мегабайтах
vcontrol_storage_memory_mbytes_used Использованный объём хранилища vControl в мегабайтах

Таблица меток#

Метрика Название метки Описание метки
vcontrol_clickhouse_enabled protocol Протокол подключения
vcontrol_clickhouse_enabled ip_address Адрес БД ClickHouse
vcontrol_clickhouse_enabled port Порт БД ClickHouse
vcontrol_clickhouse_up protocol Протокол подключения
vcontrol_clickhouse_up ip_address Адрес БД ClickHouse
vcontrol_clickhouse_up port Порт БД ClickHouse
vcontrol_db_read_state ip_address Адрес основной БД
vcontrol_db_write_state ip_address Адрес основной БД
vcontrol_redis_server_master ip_address Адрес сервера Redis
vcontrol_redis_server_master port Порт
vcontrol_redis_server_subjective_status ip_address Адрес сервера Redis
vcontrol_redis_server_subjective_status port Порт сервера Redis
vcontrol_redis_server_objective_status ip_address Адрес сервера Redis
vcontrol_redis_server_objective_status port Порт сервера Redis
vcontrol_redis_server_master_connection ip_address Адрес сервера Redis
vcontrol_redis_server_master_connection port Порт
vcontrol_redis_server_master_connection master_ip_address Адрес мастера
vcontrol_redis_server_master_connection master_port Порт мастера
vcontrol_sentinel_status ip_address Адрес Sentinel
vcontrol_sentinel_status port Порт
vcontrol_vip_status ip_address Адрес
vcontrol_backend_status ip_address Адрес сервера бэкенда
vcontrol_backend_status port Порт
vcontrol_manager_status ip_address Адрес управляющего узла
vcontrol_manager_status port Порт
vcontrol_agent_status ip_address Адрес клиентского узла
vcontrol_agent_status port Порт
vcontrol_cluster_balancing_percent cluster_id ID кластера
vcontrol_storage_info storage_name Имя хранилища vControl
vcontrol_storage_info storage_type Тип хранилища vControl
vcontrol_storage_info external_storage_id ID хранилища vControl
vcontrol_storage_info cluster_id ID кластера, к которому относится хранилище
vcontrol_storage_status external_storage_id ID хранилища vControl
vcontrol_storage_status cluster_id ID кластера, к которому относится хранилище
vcontrol_storage_memory_mbytes_total external_storage_id ID хранилища vControl
vcontrol_storage_memory_mbytes_total cluster_id ID кластера, к которому относится хранилище
vcontrol_storage_memory_mbytes_used external_storage_id ID хранилища vControl
vcontrol_storage_memory_mbytes_used cluster_id ID кластера, к которому относится хранилище

Avanpost/Состояние FAM#

Метрика Описание
http_requests_error_in_flight Количество запросов к Avanpost FAM, завершившихся с ошибкой
http_requests_in_flight Количество запросов в систему Avanpost FAM, которые ещё не завершены
http_response_duration_bucket Распределение продолжительности входящих запросов Avanpost FAM
http_response_duration_count Общее количество входящих запросов Avanpost FAM
http_response_duration_sum Суммарная продолжительность входящих запросов Avanpost FAM
idp_account_disable_counter Количество отключенных учётных записей Avanpost FAM
idp_active_session_gauge Количество активных сессий Avanpost FAM
idp_application_authentication_counter Количество аутентификаций в каждом приложении Avanpost FAM
idp_authentication_factor_counter Количество проверенных факторов аутентификации Avanpost FAM
idp_global_session_counter Общее количество созданных сессий Avanpost FAM
idp_user_lock_counter Общее количество блокировок пользователей Avanpost FAM

Таблица меток#

  • code - код HTTP-ответа.

  • method - HTTP-метод.

  • factor - фактор, по которому собрана статистика.

  • application - приложение, по которому собрана статистика.

  • le - квантиль.

Метрика Метки
idp_application_authentication_counter application
idp_authentication_factor_counter factor
http_response_duration_sum code, method
http_response_duration_count code, method
http_response_duration_bucket code, method, le

Метрики типа LOGSQL#

Метрики, получаемые на основе логов

МХД.О#

|=== | Метрика | Описание | Формула | Период сбора

s3gw_proxy_http_response#

Коды ответов сервера за последнюю минуту.

Формула для расчёта:

filename:"/var/log/skala-s3gw-proxy/proxy.log" |_time:1m | extract "<_> <_> <_> <_> <_> <_> <_> <code> "| stats by (code, _pak_id,hostname) count(*) as count

Период сбора — 1 минута.

s3gw_control_http_response#

Коды ответов сервера за последнюю минуту.

Формула для расчёта:

filename:"/var/log/skala-s3gw-control/control.log" |_time:1m | extract "<_> <_> <_> <_> <_> <_> <_> <code> " | stats by (code, _pak_id,hostname) count(*) as count

Период сбора — 1 минута.

Метка для всех метрик: code — код состояния HTTP.