Комплексный IT-мониторинг как обязательный инструмент для компаний в современных реалия

IT-мониторинг как явление достаточно привычен и понятен, но на практике его применения возникает полный рассинхрон головы с руками. Постоянное усложнение и разрастание самих инфраструктур ужесточает и требования к качеству их поддержки, а следовательно — и к решениям для мониторинга. Поэтому ситуации, когда непонятно, как собрать качественную систему мониторинга, или же когда собранная не дает ожидаемых результатов, не являются чем-то необычным. Чтобы вы могли этого избежать, мы расскажем, какой должна быть современная система комплексного IT-мониторинга как на уровне формирования требований, так и во время подбора конкретных инструментов.

Как устроены современные IT-инфраструктуры и как их усложнение меняет задачи мониторинга

Как известно, IT-инфраструктура — это совокупность IT-компонентов, которые используются для обеспечения нормального функционирования процессов в организации. Глобально, типичная IT-инфраструктура состоит из трех высокоуровневых элементов:

    Аппаратное оборудование: серверы, коммутаторы, маршрутизаторы и все, что физически существует как устройство и интегрировано в общую систему.
    Сеть: качество соединения в локальной сети и Интернете, движение трафика, и другие процессы взаимодействия систем и людей между собой
    Приложения: программное обеспечение на серверах, в облаке или на конечных точках, которое используется в компании.

Инфраструктура 20 лет назад имела такое же строение, однако сейчас в каждый из этих пунктов входит в десятки раз больше составляющих и способов их взаимодействия. Традиционно инфраструктуры строились on-premise, то есть полностью размещались на мощностях компании. С развитием технологий появились облачные и смешанные (гибридные) инфраструктуры. Полный или частичный переезд в облако дал ряд весомых преимуществ, но одновременно ухудшил видимость процессов и сделал инфраструктуру зависимой от внешних обстоятельств, на которые компания-владелец не может повлиять.
Развитие бизнеса также играет роль в усложнении IT. Бренды разрастаются, у них появляется куча точек сбыта, новые офисы в разных точках одной страны или всего мира. При этом их деятельность также расширяется — например, компания Google, которая начинала как поисковый сервис, сейчас является еще и разработчиком мобильной ОС, поставщиком облачных услуг и владельцем ряда сервисов вроде YouTube. Появление целых департаментов и новых направлений не может не влиять на разветвленность и сложность инфраструктуры.

Также IT-инфраструктура компаний усложняется из-за необходимости улучшать и упрощать пользовательский опыт. Объясним: инфраструктура условного банка состоит из кучи микросервисных приложений, различных технологий разработки и поддержки, и все это обслуживается целой «армией» специалистов. Но благодаря этому у клиента есть возможность сделать денежный перевод с мобильного телефона за считанные секунды.

Можно констатировать разницу: раньше IT-мониторинг означал лишь наблюдение за элементами on-premise-инфраструктуры, в то время, как сегодня к нему добавляется необходимость мониторить облачные сервисы, пользовательский опыт, работу десятков приложений и тому подобное. Проблема на любом из этих компонентов может повлиять на общую производительность IT-инфраструктуры, а потому все они должны быть под наблюдением.

Требования к IT-мониторингу и проблемы с их соблюдением

Учитывая компоненты инфраструктуры, можно сделать очевидный вывод: для качественного мониторинга нужно иметь информацию обо всех указанных компонентах. С этим могут возникать сложности, поскольку далеко не каждое решение мониторинга умеет собирать данные на всех уровнях — от сети до конечного пользователя приложений. Напротив, часто это отдельные фокусные решения для мониторинга отдельных узлов.
Существуют следующие решения мониторинга: Мониторинг производительности приложений (APM). Мониторинг сети, в том числе решения для обеспечения видимости сети, анализа производительности и безопасности (NPM, NDR). ● Мониторинг состояния аппаратной части инфраструктуры, то есть инфраструктурный мониторинг (IM). Мониторинг конечных пользователей и их цифрового опыта — End-user experience monitoring (EUEM).
Иногда компании действительно достаточно одного вида мониторинга, но это специфические случаи и касаются они преимущественно малого и среднего бизнеса. Бизнес enterprise-уровня традиционно нуждается во всем и сразу. Напрашивается вариант с использованием нескольких отдельных решений, которые вместе охватят все необходимые уровни инфраструктуры. Не будем говорить, что так не делают, но отметим, что это лишь более комплексное, хотя все еще не полное решение задачи. Причин этому есть несколько, а их анализ поможет сформировать требования к мониторингу в целом.

Мониторинг должен охватывать все элементы инфраструктуры и все факторы, влияющие на нее

Использование нескольких видов мониторинга не дает комплексного представления о работе инфраструктуры в целом. Если компания при анализе работы инфраструктуры игнорирует анализ отдельной ее части, то понятно, что такой мониторинг не может быть эффективным. Следует учитывать вообще все факторы, которые могут влиять на работу инфраструктуры. Чтобы действительно получать полную информацию для взвешенных решений нужно анализировать взаимодействие пользователей с приложениями и сетью, получать данные из облака и сканировать трафик на предмет угроз.

Данные необходимо обрабатывать централизованно

Часто отдельные решения мониторинга используются отдельными отделами. Например, системные администраторы используют инфраструктурный мониторинг, тогда как мониторинг приложений используется отделами разработки и тестирования. Все это не способствует улучшению видимости; наоборот, у отделов, работающих с различными элементами инфраструктуры и различными решениями мониторинга, есть разные представления о ее состоянии.

Сбор правильных и полных данных различными системами мониторинга теоретически дает все необходимое для получения выводов, но не сами выводы. Это как угадать все буквы на телевикторине, но не составить из них загаданное слово. Чтобы сделать этот шаг, данные надо собирать централизованно в единую систему мониторинга, к которой будут иметь доступ и IT-команды, и команды по кибербезопасности. Это позволит устранить слепые зоны и видеть полноценную картину всем IT-отделам.

Система мониторинга должна понимать отклонения от нормы

Последнее требование заключается в возможности системы понимать состояние нормы и правильно интерпретировать отклонения от нее. Это завершит мониторинг, все больше приближая получаемые данные к виду выводов, а не отчетов.
Просто сравните условно два системных уведомления:

Время отклика сервиса X составляет ..... количество ошибок 404: ...

Работа сервиса Х ухудшилась на ...% в результате получения пакетов с хоста ХХ, [Смотреть схему зависимостей]

Чтобы получить такой результат, система мониторинга должна быть комплексной в полном смысле этого слова. Конечно, можно рассчитывать на качество и наличие возможностей для взаимной интеграции решений, а можно поискать готовую полнофункциональную платформу, которая разрабатывалась именно для комплексного мониторинга инфраструктуры.

Рассмотрим пример такой платформы комплексного мониторинга от Riverbed.

Как работает комплексный мониторинг от Riverbed?

Платформа комплексного мониторинга от Riverbed состоит из нескольких решений, которые могут работать в качестве самостоятельных инструментов, но больше всего пользы приносят именно в связке. В целом они охватывают мониторинг инфраструктуры, сети, приложений и пользовательского опыта.
Если разобрать платформу на составляющие, получим следующее:
Управление IT-инфраструктурой с помощью Alluvio NetIM. Это классический мониторинг компонентов инфраструктуры, который предоставляет информацию о ее топологии и взаимосвязи. Безагентная архитектура позволяет получать полное представление того, как инфраструктура влияет на сеть и приложения и, как следствие, на качество обслуживания потребителей. Анализ трафика с Alluvio NetProfiler. Обеспечивает быстрый мониторинг сети. Решение может выявлять зависимости между сервисами в гибридной сети, определять состояние нормы и сигнализировать об отклонениях от нее. Более глубокий анализ зависимостей в сети благодаря захвату и анализу пакетов данных — Alluvio AppResponse. Решение углубляет анализ сети, добавляя данные о работе приложений и рабочих процессах к анализу сетевого трафика. Оно сочетает сетевую криминалистику, аналитику приложений и мониторинг опыта конечных пользователей в одном решении, позволяя решать проблемы с сетью и приложениями еще до того, как с ними столкнутся конечные потребители. ● Производительность приложений и их взаимодействие с конечным пользователем с помощью Alluvio Aternity — многофункционального решения. С одной стороны оно обеспечивает захват всех транзакций и процессов внутри приложений для их дальнейшего анализа и выявления проблем. С другой, будучи развернутым как агент на конечных устройствах, решение позволяет считывать данные о взаимодействии пользователей с приложениями и понимать, какой реальный опыт использования сервисов они получают.
Финальный этап — обеспечить удобную работу с полученным массивом данных для IT-специалистов. Сбор данных из 4+ решений по отдельности нельзя назвать эффективным мониторингом, поэтому все эти решения объединяет Alluvio Portal, который, собственно, и превращает их в платформу комплексного мониторинга. Portal позволяет создавать интерактивные дашборды, объединяя в одном интерфейсе все собранные данные и предоставляя целостное представление об инфраструктуре, приложениях, сети и пользовательском опыте.

Вывод

Комплексный мониторинг постепенно превратился в must have для большинства организаций. Особенно это касается компаний уровня enterprise, которые часто строят гибридные разветвленные IT-инфраструктуры и должны при этом всем соответствовать высоким стандартам относительно качества работы цифровых продуктов. Отсутствие мониторинга в таких случаях просто заберет у таких компаний возможность своевременного выявления и устранения проблем.

В то же время это означает, что мониторинг не может существовать просто «для галочки». Это должен быть действенный комплексный инструмент, который действительно упрощает ежедневную рутину специалистов и позволяет значительно повысить эффективность поддержки и оптимизации IT-инфраструктуры. В настоящее время комплексный мониторинг Riverbed является одним из тех решений, которые наиболее полно соответствуют этим требованиям.