Все метрики группируются путём указания объекта иерархии, к которому они относятся. Например, метрики сервера, собираемые различными способами (локально с ОС или через протокол IPMI) должны быть отнесены к объекту типа node.
Метрики типа PROMQL#
Метрики, получаемые из экспортеров, собираемые с инструментированных эндпоинтов или вычисляемые с использованием правил перезаписи Prometheus
Базовые метрики
Метрики, применяемые во всех ПАК
Состояние компонента мониторинга vmagent#
Автоматически собираются после установки агента метрик.
| Название | Описание |
|---|---|
vmagent_availability_status |
Состояние доступности компонента мониторинга vmagent. Возвращает значение 0, если компонент недоступен. Возвращает значение 1, если компонент доступен. |
Plagent#
Автоматически собираются после установки Plagent.
| Название | Описание | Генерируемые метки |
|---|---|---|
plagent_build_info |
Информация о версии, ревизии, ветке, goversion, на основе которого был собран plagent, а также goos и goarch | branch, revision, goarch, goversion, goos, tags, version |
plagent_plugin_error_count |
Количество ошибок вызова плагинов plagent | name |
plagent_plugin_info |
Информация об имени плагина и его версии | name, version |
plagent_sudo_available |
Статус доступности sudo во время запуска plagent |
Описание меток:
- branch — ветка,
- revision — ревизия Plagent,
- goarch — GOARCH,
- goversion — версия Go,
- goos — GOOS,
- tags — теги,
- version — версия компонента,
- name — имя плагина.
Коммутатор#
Собираются snmp_exporter’ом
| Название | Описание | Генерируемые метки |
|---|---|---|
ifAdminStatus |
Желаемое состояние интерфейса — 1.3.6.1.2.1.2.2.1.7. | IfAlias, ifDescr, ifIndex, ifName |
ifConnectorPresent |
Этот объект имеет значение 1, если подуровень интерфейса имеет физический разъем, и значение 2 в противном случае. - 1.3.6.1.2.1.31.1.1.1.17 | IfAlias, ifDescr, ifIndex, ifName |
ifCounterDiscontinuityTime |
Значение sysUpTime в последний раз, когда в одном или нескольких счетчиках этого интерфейса произошел сбой — 1.3.6.1.2.1.31.1.1.1.19. | IfAlias, ifDescr, ifIndex, ifName |
ifHCInBroadcastPkts |
Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.9 | IfAlias, ifDescr, ifIndex, ifName |
ifHCInMulticastPkts |
Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по многоадресному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.8 | IfAlias, ifDescr, ifIndex, ifName |
ifHCInOctets |
Общее количество октетов, полученных по интерфейсу, включая символы кадрирования — 1.3.6.1.2.1.31.1.1.1.6 | IfAlias, ifDescr, ifIndex, ifName |
ifHCInUcastPkts |
Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые не были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.7 | IfAlias, ifDescr, ifIndex, ifName |
ifHCOutBroadcastPkts |
Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы широковещательному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.13 | IfAlias, ifDescr, ifIndex, ifName |
ifHCOutMulticastPkts |
Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы многоадресному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.12 | IfAlias, ifDescr, ifIndex, ifName |
ifHCOutOctets |
Общее количество октетов, передаваемых из интерфейса, включая символы кадрирования - 1.3.6.1.2.1.31.1.1.1.10. | IfAlias, ifDescr, ifIndex, ifName |
ifHCOutUcastPkts |
Общее количество пакетов, которые запросили передать протоколы более высокого уровня, и которые не были адресованы по групповому или широковещательному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.11 | IfAlias, ifDescr, ifIndex, ifName |
ifHighSpeed |
Оценка текущей пропускной способности интерфейса в единицах 1 000 000 бит в секунду - 1.3.6.1.2.1.31.1.1.1.15 | IfAlias, ifDescr, ifIndex, ifName |
ifInBroadcastPkts |
Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по широковещательному адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.3 | IfAlias, ifDescr, ifIndex, ifName |
ifInDiscards |
Количество входящих пакетов, которые были выбраны для отбрасывания, хотя ошибок не было обнаружено, чтобы предотвратить их доставку в протокол более высокого уровня - 1.3.6.1.2.1.2.2.1.13 | IfAlias, ifDescr, ifIndex, ifName |
ifInErrors |
Для пакетно-ориентированных интерфейсов количество входящих пакетов, содержащих ошибки, препятствующие их доставке протоколу более высокого уровня - 1.3.6.1.2.1.2.2.1.14. | IfAlias, ifDescr, ifIndex, ifName |
ifInMulticastPkts |
Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по групповому адресу на этом подуровне - 1.3.6.1.2.1.31.1.1.1.2 | IfAlias, ifDescr, ifIndex, ifName |
ifInNUcastPkts |
Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.2.2.1.12 | IfAlias, ifDescr, ifIndex, ifName |
ifInOctets counter ifInOctets |
Общее количество октетов, полученных по интерфейсу, включая символы кадрирования — 1.3.6.1.2.1.2.2.1.10. | IfAlias, ifDescr, ifIndex, ifName |
ifInUcastPkts |
Количество пакетов, доставленных этим подуровнем на более высокий (под)уровень, которые не были адресованы по групповому или широковещательному адресу на этом подуровне - 1.3.6.1.2.1.2.2.1.11 | IfAlias, ifDescr, ifIndex, ifName |
ifInUnknownProtos |
Для пакетно-ориентированных интерфейсов количество полученных через интерфейс пакетов, которые были отброшены из-за неизвестного или неподдерживаемого протокола — 1.3.6.1.2.1.2.2.1.15. | IfAlias, ifDescr, ifIndex, ifName |
ifIndex |
Уникальное значение, большее нуля, для каждого интерфейса — 1.3.6.1.2.1.2.2.1.1. | IfAlias, ifDescr, ifIndex, ifName |
ifLastChange |
Значение sysUpTime на момент перехода интерфейса в текущее рабочее состояние — 1.3.6.1.2.1.2.2.1.9. | IfAlias, ifDescr, ifIndex, ifName |
ifLinkUpDownTrapEnable |
Указывает, следует ли генерировать ловушки linkUp/linkDown для этого интерфейса — 1.3.6.1.2.1.31.1.1.1.14. | IfAlias, ifDescr, ifIndex, ifName |
ifMtu |
Размер самого большого пакета, который можно отправить/получить на интерфейсе, указанный в октетах - 1.3.6.1.2.1.2.2.1.4. | IfAlias, ifDescr, ifIndex, ifName |
ifNumber |
Количество сетевых интерфейсов (независимо от их текущего состояния), присутствующих в этой системе. - 1.3.6.1.2.1.2.1 | |
ifOutBroadcastPkts |
Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы на широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.5 | IfAlias, ifDescr, ifIndex, ifName |
ifOutDiscards |
Количество исходящих пакетов, которые были выбраны для отбрасывания, даже если не было обнаружено ошибок, предотвращающих их передачу - 1.3.6.1.2.1.2.2.1.19 | IfAlias, ifDescr, ifIndex, ifName |
ifOutErrors |
Для пакетно-ориентированных интерфейсов количество исходящих пакетов, которые не удалось передать из-за ошибок - 1.3.6.1.2.1.2.2.1.20. | IfAlias, ifDescr, ifIndex, ifName |
ifOutMulticastPkts |
Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы многоадресному адресу на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.31.1.1.1.4 | IfAlias, ifDescr, ifIndex, ifName |
ifOutNUcastPkts |
Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые были адресованы на многоадресный или широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.2.2.1.18 | IfAlias, ifDescr, ifIndex, ifName |
ifOutOctets |
Общее количество октетов, передаваемых из интерфейса, включая символы кадрирования — 1.3.6.1.2.1.2.2.1.16. | IfAlias, ifDescr, ifIndex, ifName |
ifOutQLen |
Длина очереди выходных пакетов (в пакетах). - 1.3.6.1.2.1.2.2.1.21. | IfAlias, ifDescr, ifIndex, ifName |
ifOutUcastPkts |
Общее количество пакетов, которые запросили передать протоколы более высокого уровня и которые не были адресованы на групповой или широковещательный адрес на этом подуровне, включая те, которые были отброшены или не отправлены - 1.3.6.1.2.1.2.2.1.17 | IfAlias, ifDescr, ifIndex, ifName |
ifPhysAddress |
Адрес интерфейса на подуровне протокола — 1.3.6.1.2.1.2.2.1.6. | IfAlias, ifDescr, ifIndex, ifName, ifPhysAddress |
ifPromiscuousMode |
Этот объект имеет значение false(2), если этот интерфейс принимает только пакеты/кадры, адресованные этой станции - 1.3.6.1.2.1.31.1.1.1.16 | IfAlias, ifDescr, ifIndex, ifName |
ifSpecific |
Ссылка на определения MIB, специфичные для конкретного носителя, используемого для реализации интерфейса - 1.3.6.1.2.1.2.2.1.22 | IfAlias, ifDescr, ifIndex, ifName |
ifSpeed |
Оценка текущей пропускной способности интерфейса в битах в секунду — 1.3.6.1.2.1.2.2.1.5 | IfAlias, ifDescr, ifIndex, ifName |
ifType_info |
Тип интерфейса - 1.3.6.1.2.1.2.2.1.3 (EnumAsInfo) | IfAlias, ifDescr, ifIndex, ifName, ifType |
sysUpTime |
Время (в сотых долях секунды) с момента последней повторной инициализации части управления сетью системы. - 1.3.6.1.2.1.1.3 |
Описание меток:
- ifAlias — описание или псевдоним интерфейса.
- ifDescr — текстовое описание интерфейса.
- ifIndex — уникальный индекс интерфейса в системе.
- ifName — логическое имя интерфейса.
- ifPhysAddress — физический (MAC) адрес интерфейса.
- ifType — тип интерфейса (например, ethernetCsmacd).
Сервисы ОС#
Собираются systemd_exporter’ом
| Название | Описание | Генерируемые метки |
|---|---|---|
systemd_unit_info |
Мета-дата про все unit | name, type, mount_type, service_type, state |
systemd_unit_state |
Состояние systemd unit | name, type |
systemd_socket_refused_connections_total |
Суммарное число отклонённых сокет-соединений | name |
systemd_timer_last_trigger_seconds |
Время, прошедшее с последнего триггера | name |
systemd_watchdog_enabled |
Сторожевой таймер запущен | |
systemd_watchdog_last_ping_monotonic_seconds |
Время, прошедшее с момента последнего успешного сигнала watchdog от службы, измеренное в монотонных секундах | |
systemd_watchdog_last_ping_time_seconds |
Время последнего успешного пинга от systemd watchdog | |
systemd_watchdog_runtime_seconds |
Время работы службы с момента последнего успешного сигнала watchdog | |
systemd_unit_active_enter_time_seconds |
Последний раз, когда unit перешёл в активное состояние | name |
systemd_unit_active_exit_time_seconds |
Последний раз, когда unit вышел из активного состояния | name |
systemd_unit_inactive_enter_time_seconds |
Последний раз, когда unit перешёл в неактивное состояние | name, type |
systemd_unit_inactive_exit_time_seconds |
Последний раз, когда unit вышел из неактивного состояния | name, type |
systemd_unit_tasks_current |
Текущее число задач на каждый systemd unit | name |
systemd_unit_tasks_max |
Максимальное число задач на каждый systemd unit | name, type |
systemd_unit_start_time_seconds |
Время запуска unit с 01.01.70 | name, type |
systemd_service_restart_total |
Количество перезапусков службы | |
systemd_service_ip_egress_bytes |
Общее количество исходящей информации в байтах | |
systemd_service_ip_ingress_bytes |
Общее количество входящей информации в байтах | |
systemd_service_ip_ingress_packets_total |
Общее количество входящих сетевых пакетов, отправленных службой | |
systemd_service_ip_egress_packets_total |
Общее количество исходящих сетевых пакетов, отправленных службой | |
systemd_socket_accepted_connections_total |
Суммарное количество принятых сокет-соединений | name |
| `systemd_socket_current_connections | Текущее число сокет-соединений | name |
Описание меток:
- name — Наименование unit
- type — Категория unit (service, timer, target, mount, socket, …)
- mount_type — Тип файловой системы для type=“mount” (binfmt_misc, configfs, debugfs, ext4, — fusectl, hugetlbfs, mqueue, tracefs, vfat)
- service_type — Тип сервиса (simple, exec, forking, oneshot, dbus, notify, notify-reload, idle)
- state — Состояние unit (activating/active/deactivating/failed/inactive)
Метки:
| Метрика | Метки |
|---|---|
systemd_unit_info |
name, type, mount_type, service_type, state |
systemd_unit_state |
name, type |
systemd_unit_tasks_current |
name |
systemd_unit_tasks_max |
name |
systemd_unit_start_time_seconds |
name, type |
systemd_socket_accepted_connections_total |
name |
systemd_socket_current_connections |
name |
systemd_socket_refused_connections_total |
name |
systemd_timer_last_trigger_seconds |
name |
systemd_unit_active_enter_time_seconds |
name, type |
systemd_unit_active_exit_time_seconds |
name, type |
systemd_unit_inactive_enter_time_seconds |
name, type |
systemd_unit_inactive_exit_time_seconds |
name, type |
МХД.О/ШлюзS3МодульКомпрессии#
Собираются путем опроса Prometheus-эндпоинта компонента S3 шлюза — сервиса компрессии S3 (s3gateway-compression-server). Собирается s3gateway_compression_server_scraper.
| Название | Описание | Метки |
|---|---|---|
s3_compressor_after_compression_bytes |
Размер данных после сжатия | |
s3_compressor_after_decompression_bytes |
Размер данных после распаковки | |
s3_compressor_before_compression_bytes |
Размер данных для сжатия | |
s3_compressor_before_decompression_bytes |
Размер данных для распаковки | |
s3_compressor_build_info |
Информация о сборке шлюза (в метках) | branch, goversion, revision, version |
s3_compressor_compress_operations |
Количество операций сжатия | |
| `s3_compressor_decompress_operations | Количество операций распаковки |
Описание меток:
branch— Ветка сборки шлюза.goversion— Версия go сборки.revision— Ревизия сьоркиversion— Версия сборки шлюза.
МХД.О/Кластер Хранения#
Собираются путем опроса Prometheus-эндпоинта компонента S3 шлюза — сервиса ostor (s3gateway-ostor-server) В данные момент метрики на согласовании, представлена текущая реализация. Собираются s3gateway_ostor_server_scraper.
| Название | Описание | Метки |
|---|---|---|
vstorage_cluster_space |
Параметры объёма дискового пространства кластера хранения | cluster_name, type |
vstorage_cluster_status |
Информация о кластере хранения | cluster_id, cluster_name, status |
vstorage_cs_chunks |
Количество чанков CS по статусам кластера хранения | cluster_name, cs_id, status |
vstorage_cs_replicas |
Количество реплик CS кластера хранения | cluster_name, cs_id |
vstorage_cs_space |
Параметры объёма дискового пространства CS кластера хранения (в байтах) | cluster_name, cs_id, type |
vstorage_cs_status |
Статус CS кластера хранения | cluster_name, cs_host, cs_id, status |
vstorage_mds_mem_usage |
Использование памяти MDS кластера хранения | cluster_name, mds_id |
vstorage_mds_status |
Статус MDS кластера хранения | cluster_name, mds_host, mds_id, status |
vstorage_mds_uptime |
Время работы MDS кластера хранения | cluster_name, mds_id |
Описание меток:
cluster_id— идентификатор кластера.cluster_name— имя кластера хранения.cs_host— хост, на котором находится CS.cs_id— идентификатор чанка CS.mds_host— хост, на котором находится MDS.mds_id— идентификатор MDS.status— статус компонента (например, “healthy”, “blocked”, “active”).type— тип объёма дискового пространства.
МВ.ВРМ#
Собираются путем опроса Prometheus-эндпоинта компонента ВРМ.
| Название | Описание | Метки |
|---|---|---|
supv_vrm_broker_active_connections |
Активные соединения | vrm |
supv_vrm_broker_active_sessions |
Активные сессии | vrm |
supv_vrm_health_all_ok |
Общее состояние ВРМ | vrm |
supv_vrm_health_broker_manager |
Состояние брокер менеджера | vrm |
supv_vrm_health_conf |
Состояние конфигураций | vrm |
supv_vrm_health_db_read |
Состояние БД на чтение | vrm |
supv_vrm_health_db_write |
Состояние БД на запись | vrm |
supv_vrm_health_redis_read |
Доступ к КЭШ БД (Redis) на чтение | vrm |
supv_vrm_health_redis_write |
Доступ к КЭШ БД (Redis) на запись | vrm |
Описание меток:
vrm— имя ВРМ.
МБД.П/Spectrum_agent#
Собираются путем опроса Prometheus-эндпоинта компонента Spectrum_agent. Собираются spectrum_agent_scraper.
| Название | Описание |
|---|---|
spectrum_autovacuum_duration |
Длительность процессов autovacuum секунд |
spectrum_autovacuum_proc_count |
Количество процессов autovacuum |
spectrum_autovacuum_tx_until_wraparound |
Транзакций до wraparound |
spectrum_database_size_bytes |
Размер базы данных байт |
spectrum_lag_storage_flush_diff_bytes |
Количество байт, записанных, но ещё не сброшенных на диск на данной реплике |
spectrum_lag_storage_pending_diff_bytes |
Количество байт, ожидающих передачи на реплику |
spectrum_lag_storage_replay_diff_bytes |
Количество байт, сброшенных на диск, но ещё не воспроизведенных на реплике |
spectrum_lag_storage_total_lag_diff_bytes |
Суммарное отставание реплики в байтах |
spectrum_lag_storage_write_diff_bytes |
Количество байт, переданных на реплику, но ещё не записанных на диск |
spectrum_postgresql_sessions_count |
Количество сессий |
spectrum_postgresql_sessions_count_total |
Количество сессий общее |
spectrum_postgresql_sessions_locks |
Количество сессий в ожидании Lock |
spectrum_table_dead_tuples_count |
Таблицы по количеству dead tuples |
spectrum_table_heap_blks_hit_count |
Таблицы попаданию в буферный кэш |
spectrum_table_heap_blks_read_count |
Таблицы по чтению с диска |
spectrum_table_size_bytes |
Таблицы по объёму байт |
spectrum_table_toast_size_bytes |
Таблицы по объёму байт таблиц TOAST |
spectrum_top10_table_dead_tuples_count_topk |
Топ 10 таблиц по количеству dead tuples |
spectrum_top10_table_heap_blks_hit_count_topk |
Топ 10 таблиц по попаданию в буферный кэш |
spectrum_top10_table_heap_blks_read_count_topk |
Топ 10 таблиц по чтению с диска |
spectrum_top10_table_size_bytes_topk |
Топ 10 таблиц по объёму байт |
spectrum_top10_table_toast_size_bytes_topk |
Топ 10 таблиц по объёму байт таблиц TOAST |
spectrum_wal_archiver_failed_count |
Количество ошибок архивации WAL |
spectrum_wal_count |
Количество WAL |
spectrum_wal_size_bytes |
Объём WAL байт |
spectrum_wal_temp_count |
Количество WAL temp-файлов |
spectrum_wal_temp_size_bytes |
Объём WAL temp-файлов байт |
spectrum_wal_time_from_last_checkpoint_sec |
Время с последней записи контрольной точки (CHECKPOINT) секунд |
МБД.С/Kafka#
Собираются kafka_exporter’ом и graphite_exporter’ом
| Метрика | Описание |
|---|---|
kafka_broker_info |
Информация о брокере Kafka. |
kafka_brokers |
Количество брокеров в кластере Kafka. |
kafka_consumergroup_members |
Количество участников в потребительской группе. |
kafka_topic_partition_current_offset |
Текущий смещение брокера для Топика/Раздела. |
kafka_topic_partition_in_sync_replica |
Количество синхронизированных реплик для Топика/Раздела. |
kafka_topic_partition_leader |
ID лидера брокера для этого Топика/Раздела. |
kafka_topic_partition_leader_is_preferred |
1, если Топик/Раздел использует предпочтительного брокера. |
kafka_topic_partition_oldest_offset |
Самое старое смещение брокера для Топика/Раздела. |
kafka_topic_partition_replicas |
Количество реплик для Топика/Раздела. |
kafka_topic_partition_under_replicated_partition |
1, если Топик/Раздел не имеет достаточного количества реплик. |
kafka_topic_partitions |
Количество разделов для Топика. |
Описание меток:
address— IP кафка-сервераid— ID брокераconsumergroup— Имя потребительской группыpartition— разделtopic— Топикservice— Имя сервиса, к которому относится значениеtype— тип метрикиhost— узел, с которого собрана метрикаcluster— кластер, к которому относится собранная метрика
Метки и метрики:
| Метрика | Метки |
|---|---|
kafka_broker_info |
address, id |
kafka_consumergroup_members |
partition, topic, consumergroup |
kafka_topic_partition_current_offset |
partition, topic |
kafka_topic_partition_in_sync_replica |
partition, topic |
kafka_topic_partition_leader |
partition, topic |
kafka_topic_partition_leader_is_preferred |
partition, topic |
kafka_topic_partition_oldest_offset |
partition, topic |
kafka_topic_partition_replicas |
partition, topic |
kafka_topic_partition_under_replicated_partition |
partition, topic |
kafka_topic_partitions |
topic |
kafka_session_zookeeper_sync_connects_per_sec |
service, type, host, cluster |
МДИ.О/Patroni и PostgreSQL#
Таблица метрик#
| Метрика | Описание |
|---|---|
patroni_cluster_unlocked |
Состояние блокировки кластера Patroni: 1 — разблокирован, 0 — заблокирован |
patroni_dcs_last_seen |
Время последней связи Patroni с DCS в формате Unix timestamp |
patroni_failsafe_mode_is_active |
Состояние аварийного режима (failsafe) Patroni: 1 — активен, 0 — нет |
patroni_is_paused |
Состояние паузы автоматического failover-переключения Primary/Replica (Patroni): 1 — пауза, 0 — нет |
patroni_pending_restart |
Состояние необходимости перезагрузки (Patroni): 1 — требуется, 0 — нет |
patroni_postgres_in_archive_recovery |
Режим восстановления из архива PostgreSQL (Patroni): 1 — активно, 0 — нет |
patroni_postgres_running |
Состояние PostgreSQL (Patroni): 1 — запущен, 0 — остановлен |
patroni_postgres_server_version |
Версия PostgreSQL (Patroni) в числовом формате |
patroni_postgres_state |
Числовое представление состояния PostgreSQL |
patroni_postgres_streaming |
Состояние потоковой репликации PostgreSQL (Patroni): 1 — streaming, 0 — нет |
patroni_postgres_timeline |
Состояние timeline PostgreSQL для узла Patroni: > 0 — текущая, 0 — не работает |
patroni_postmaster_start_time |
Время запуска Postmaster (Patroni) в формате Unix timestamp |
patroni_primary |
Роль узла Patroni: 1 — primary/лидер, 0 — replica |
patroni_quorum_standby |
Узел в роли кворумной реплики Patroni: 1 — кворумная, 0 — нет |
patroni_replica |
Узел в роли реплики Patroni: 1 — реплика, 0 — нет |
patroni_standby_leader |
Узел в роли standby-лидера Patroni: 1 — standby лидер, 0 — нет |
patroni_sync_standby |
Узел в роли синхронной реплики Patroni: 1 — синхронная, 0 — нет |
patroni_version |
Версия Patroni, целочисленное |
patroni_xlog_location |
Текущее местоположение записи WAL PostgreSQL для узла Patroni (для лидера) |
patroni_xlog_paused |
Состояние паузы журнала транзакций PostgreSQL для узла Patroni: 1 — пауза, 0 — нет |
patroni_xlog_received_location |
Текущее местоположение принятого WAL PostgreSQL для узла Patroni (для реплики) |
patroni_xlog_replayed_location |
Текущее местоположение воспроизведённого WAL PostgreSQL для узла Patroni (для реплики) |
patroni_xlog_replayed_timestamp |
Временная метка примененного WAL PostgreSQL для узла Patroni в формате Unix timestamp |
Таблица меток#
-
scope— имя кластера Patroni/PostgreSQL; -
name— имя узла Patroni в кластере.
Метки и метрики:
| Метрика | Метки |
|---|---|
patroni_cluster_unlocked |
scope, name |
patroni_dcs_last_seen |
scope, name |
patroni_failsafe_mode_is_active |
scope, name |
patroni_is_paused |
scope, name |
patroni_pending_restart |
scope, name |
patroni_postgres_in_archive_recovery |
scope, name |
patroni_postgres_running |
scope, name |
patroni_postgres_server_version |
scope, name |
patroni_postgres_state |
scope, name |
patroni_postgres_streaming |
scope, name |
patroni_postgres_timeline |
scope, name |
patroni_postmaster_start_time |
scope, name |
patroni_primary |
scope, name |
patroni_quorum_standby |
scope, name |
patroni_replica |
scope, name |
patroni_standby_leader |
scope, name |
patroni_sync_standby |
scope, name |
patroni_version |
scope, name |
patroni_xlog_location |
scope, name |
patroni_xlog_paused |
scope, name |
patroni_xlog_received_location |
scope, name |
patroni_xlog_replayed_location |
scope, name |
patroni_xlog_replayed_timestamp |
scope, name |
VControl/Состояние кластера#
Таблица метрик#
| Метрика | Описание |
|---|---|
vcontrol_clickhouse_enabled |
Статус включения ClickHouse |
vcontrol_clickhouse_up |
Статус работоспособности ClickHouse |
vcontrol_db_read_state |
Статус доступности ClickHouse для чтения |
vcontrol_db_write_state |
Статус доступности ClickHouse для записи |
vcontrol_memdb_read_state |
Статус доступности Redis для чтения |
vcontrol_memdb_write_state |
Статус доступности Redis для записи |
vcontrol_redis_server_master |
Является ли сервер Redis мастером |
vcontrol_redis_server_subjective_status |
Доступен ли сервер Redis с текущего хоста |
vcontrol_redis_server_objective_status |
Доступен ли сервер Redis с кластера |
vcontrol_redis_server_master_connection |
Подключен ли slave-сервер Redis к master |
vcontrol_sentinel_status |
Статус сервера Redis Sentinel |
vcontrol_vip_status |
Статус виртуального IP |
vcontrol_backend_status |
Статус сервера бэкенда |
vcontrol_manager_status |
Статус управляющих узлов |
vcontrol_agent_status |
Статус клиентских узлов |
vcontrol_cluster_status |
Статус кластера МВ.С |
vcontrol_node_online_count |
Статус узлов МВ.С |
vcontrol_cluster_balancing_percent |
Информация о балансировке кластера vControl |
vcontrol_storage_info |
Информация о типе хранилища vControl |
vcontrol_storage_status |
Статус работоспособности хранилища vControl |
vcontrol_storage_memory_mbytes_total |
Общий объём хранилища vControl в мегабайтах |
vcontrol_storage_memory_mbytes_used |
Использованный объём хранилища vControl в мегабайтах |
Таблица меток#
| Метрика | Название метки | Описание метки |
|---|---|---|
vcontrol_clickhouse_enabled |
protocol | Протокол подключения |
vcontrol_clickhouse_enabled |
ip_address | Адрес БД ClickHouse |
vcontrol_clickhouse_enabled |
port | Порт БД ClickHouse |
vcontrol_clickhouse_up |
protocol | Протокол подключения |
vcontrol_clickhouse_up |
ip_address | Адрес БД ClickHouse |
vcontrol_clickhouse_up |
port | Порт БД ClickHouse |
vcontrol_db_read_state |
ip_address | Адрес основной БД |
vcontrol_db_write_state |
ip_address | Адрес основной БД |
vcontrol_redis_server_master |
ip_address | Адрес сервера Redis |
vcontrol_redis_server_master |
port | Порт |
vcontrol_redis_server_subjective_status |
ip_address | Адрес сервера Redis |
vcontrol_redis_server_subjective_status |
port | Порт сервера Redis |
vcontrol_redis_server_objective_status |
ip_address | Адрес сервера Redis |
vcontrol_redis_server_objective_status |
port | Порт сервера Redis |
vcontrol_redis_server_master_connection |
ip_address | Адрес сервера Redis |
vcontrol_redis_server_master_connection |
port | Порт |
vcontrol_redis_server_master_connection |
master_ip_address | Адрес мастера |
vcontrol_redis_server_master_connection |
master_port | Порт мастера |
vcontrol_sentinel_status |
ip_address | Адрес Sentinel |
vcontrol_sentinel_status |
port | Порт |
vcontrol_vip_status |
ip_address | Адрес |
vcontrol_backend_status |
ip_address | Адрес сервера бэкенда |
vcontrol_backend_status |
port | Порт |
vcontrol_manager_status |
ip_address | Адрес управляющего узла |
vcontrol_manager_status |
port | Порт |
vcontrol_agent_status |
ip_address | Адрес клиентского узла |
vcontrol_agent_status |
port | Порт |
vcontrol_cluster_balancing_percent |
cluster_id | ID кластера |
vcontrol_storage_info |
storage_name | Имя хранилища vControl |
vcontrol_storage_info |
storage_type | Тип хранилища vControl |
vcontrol_storage_info |
external_storage_id | ID хранилища vControl |
vcontrol_storage_info |
cluster_id | ID кластера, к которому относится хранилище |
vcontrol_storage_status |
external_storage_id | ID хранилища vControl |
vcontrol_storage_status |
cluster_id | ID кластера, к которому относится хранилище |
vcontrol_storage_memory_mbytes_total |
external_storage_id | ID хранилища vControl |
vcontrol_storage_memory_mbytes_total |
cluster_id | ID кластера, к которому относится хранилище |
vcontrol_storage_memory_mbytes_used |
external_storage_id | ID хранилища vControl |
vcontrol_storage_memory_mbytes_used |
cluster_id | ID кластера, к которому относится хранилище |
Avanpost/Состояние FAM#
| Метрика | Описание |
|---|---|
http_requests_error_in_flight |
Количество запросов к Avanpost FAM, завершившихся с ошибкой |
http_requests_in_flight |
Количество запросов в систему Avanpost FAM, которые ещё не завершены |
http_response_duration_bucket |
Распределение продолжительности входящих запросов Avanpost FAM |
http_response_duration_count |
Общее количество входящих запросов Avanpost FAM |
http_response_duration_sum |
Суммарная продолжительность входящих запросов Avanpost FAM |
idp_account_disable_counter |
Количество отключенных учётных записей Avanpost FAM |
idp_active_session_gauge |
Количество активных сессий Avanpost FAM |
idp_application_authentication_counter |
Количество аутентификаций в каждом приложении Avanpost FAM |
idp_authentication_factor_counter |
Количество проверенных факторов аутентификации Avanpost FAM |
idp_global_session_counter |
Общее количество созданных сессий Avanpost FAM |
idp_user_lock_counter |
Общее количество блокировок пользователей Avanpost FAM |
Таблица меток#
-
code- код HTTP-ответа. -
method- HTTP-метод. -
factor- фактор, по которому собрана статистика. -
application- приложение, по которому собрана статистика. -
le- квантиль.
| Метрика | Метки |
|---|---|
idp_application_authentication_counter |
application |
idp_authentication_factor_counter |
factor |
http_response_duration_sum |
code, method |
http_response_duration_count |
code, method |
http_response_duration_bucket |
code, method, le |
Метрики типа LOGSQL#
Метрики, получаемые на основе логов
МХД.О#
|=== | Метрика | Описание | Формула | Период сбора
s3gw_proxy_http_response#
Коды ответов сервера за последнюю минуту.
Формула для расчёта:
filename:"/var/log/skala-s3gw-proxy/proxy.log" |_time:1m | extract "<_> <_> <_> <_> <_> <_> <_> <code> "| stats by (code, _pak_id,hostname) count(*) as count
Период сбора — 1 минута.
s3gw_control_http_response#
Коды ответов сервера за последнюю минуту.
Формула для расчёта:
filename:"/var/log/skala-s3gw-control/control.log" |_time:1m | extract "<_> <_> <_> <_> <_> <_> <_> <code> " | stats by (code, _pak_id,hostname) count(*) as count
Период сбора — 1 минута.
Метка для всех метрик: code — код состояния HTTP.