Обзор эксплуатации и сопровождения

​Процесс эксплуатации и сопровождения в ИТ подразумевает, что ИТ-отдел предприятия использует технические средства для управления ИТ-системой. Это комплексный, сложный и специфический процесс. Обычные сервисы по эксплуатации и сопровождению в ИТ включают в себя управление программным и аппаратным обеспечением. В рамках управления программным обеспечением ключевым аспектом эксплуатации и сопровождения является поддержание стабильности и эффективности работы устройств с помощью ОС.

​Это осуществляется, в частности, путем отслеживания динамических изменений показателей производительности, таких как ресурсы ЦП, памяти и ввода-вывода на устройстве, что позволяет эффективно предотвращать или выявлять связанные с ними проблемы. Например, по разным причинам может быть перегружен ЦП, что снижает скорость реагирования сервиса. В этом случае требуется мониторинг загрузки ЦП. Если использование памяти остается высоким в течение длительного времени, нужно использовать инструмент анализа памяти для мониторинга соответствующих процессов или оборудования. Когда падает эффективность операций чтения/записи, нужно отслеживать данные ввода-вывода для оценки производительности системы ввода-вывода.

​Кроме того, при возникновении такой проблемы, как сбой, взаимоблокировка или поломка системы, нужно произвести процедуру поиска и устранения неисправностей в ОС, чтобы быстро найти и устранить ее. Например, можно запустить kdump для сбора информации о ядре системы, а затем проанализировать эти сведения. Если требуется изменить системный пароль, войдите в однопользовательский режим и измените пароль пользователя root. Файловая система может быть повреждена из-за частых принудительных включений и отключений питания. Если ОС не удается восстановить файловую систему автоматически, нужно восстановить ее вручную. Например, можно изменить содержимое drop_caches, чтобы освободить память вручную. Кроме того, при возникновении сбоя необходимо собирать информацию, такую как журналы и файлы устройств, актуальную на момент возникновения сбоя, чтобы можно было всесторонне проанализировать его первопричину.

​Таким образом, знакомство с инструментами для анализа производительности ОС и операциями по устранению сбоев является ключом к внедрению комплексного управления эксплуатацией и сопровождением в ИТ-сфере.