
Мониторинг
Мониторинг ИТ-инфраструктуры и бизнес-функций представляет собой полный цикл решений, направленных на выявление потенциальных и реальных сбоев в работе:
- серверного и коммутационного оборудования;
- систем хранения данных;
- системного и прикладного программного обеспечения;
- сервисов с точки зрения бизнеса.
Мониторинг позволяет эффективно реагировать на проблемы, в том числе устранять их до того, как о сбое узнают и сообщат недовольные клиенты.
Задачи мониторинга:
- выявление отклонений (исключительных ситуаций). Пороговые значения отклонения настраиваются исходя из целей и задач системы/компании. Они бывают низкого, среднего и критического уровня;
- сбор и хранение статистической информации, которая может быть оформлена в виде отчетов о сбоях для дальнейшего принятия мер по предотвращению и исключению повторных ситуаций;
- предсказание возможных нештатных ситуаций на основании данных предыдущих периодов.
Объект мониторинга
– любой элемент ИТ-инфраструктуры, бизнес-процесса или прикладного ПО: сервер, операционная система, сетевой элемент, СУБД и прочие, которым необходимо обеспечить штатную и стабильную работоспособность.
Объект мониторинга может быть любым: локальным, виртуальным, сетевым и т. д.
Использование мониторинга позволяет оперативно узнать о проблемах и восстановить сервис максимально быстро, без непосредственного участия Заказчика путем выполнения предписанного действия (регламента).
При помощи мониторинга Вы можете:
- автоматизировать процесс наблюдения за функционированием ИС, перевести реагирование на инциденты из ручного в автоматизированный режим;
- повысить скорость и качество реакции на технические сбои;
- повысить скорость восстановления стабильной работы сервиса 24/7;
- снизить расходы на поддержание работы системы благодаря повышению отказоустойчивости;
- выявить на ранней стадии ошибки и недочеты в работе сети и оборудования, попытки проникновения в систему, ИБ-инциденты.
- минимизировать технические риски в работе компании;
- контроль работоспособности сервисов в режиме реального времени;
- оперативная оценка и решение критических инцидентов, которые способны существенно повлиять на бизнес.
Способы оповещения о сбоях и восстановления работоспособности:
- звонок\сообщение (почта, мессенджеры, смс) по факту сбоя;
- оповещение по факту сбоя и восстановления без прямого привлечения к работам заказчика.
После каждого сбоя проводится:
- анализ причин возникновения сбоя/инцидента;
- разработка нового правила мониторинга с целью исключения повторения ситуации.
