Комплексний IT-моніторинг як обов'язковий інструмент для компаній в сучасних реаліях

ІТ-моніторинг як явище є досить звичним та зрозумілим. Та це одна з тих історій, коли на практиці виникає повний розсинхрон голови з руками. Постійне ускладнення та розростання самих інфраструктур ускладнює і вимоги до підтримки, а як наслідок — і до якості моніторингу. Тому ситуації, коли незрозуміло, як зібрати якісну систему моніторингу, або ж коли зібрана і працююча не дає очікуваних результатів, не є чимось незвичним. Щоб цього уникнути, розповімо в цій статті про те, якою має бути сучасна система комплексного ІТ-моніторингу як на рівні формування вимог, так і на рівні використання конкретних інструментів.

Як саме влаштовані сучасні ІТ-інфраструктури і як їх ускладнення змінює завдання моніторингу

Як відомо, ІТ-інфраструктура — це сукупність ІТ-компонентів, які використовуються для забезпечення нормального функціонування процесів в організації. Глобально, типова ІТ-інфраструктура складається з трьох високорівневих елементів:

    Апаратне обладнання: сервери, комутатори, маршрутизатори та все, що фізично існує як пристрій та інтегроване в загальну систему.
    Мережа: якість зʼєднання в локальній мережі та Інтернеті, рух трафіку, та інші процеси взаємодії систем і людей між собою
    Додатки: програмне забезпечення на серверах, у хмарі чи на кінцевих точках, яке використовується в компанії.

Інфраструктура 20 років тому також мала таку будову, проте зараз до кожного з цих пунктів входить в десятки разів більше складників та способів їх взаємодії. Традиційно інфраструктури будувались on-premise, тобто повністю розміщувались на потужностях компанії. З розвитком технологій з'явились хмарні та змішані (гібридні) інфраструктури. Повний чи частковий перехід у хмару дав ряд вагомих переваг, але водночас погіршив видимість процесів та зробив інфраструктуру залежною, зокрема, від зовнішніх обставин, на які компанія-власник не може вплинути.
Розвиток бізнесу також відіграє роль в ускладненні IT-інфраструктури. Бренди розростаються, в них з'являється купа точок збуту, нові офіси в різних кутках якоїсь країни або всього світу. Водночас їхня діяльність також розширюється - наприклад, компанія Google, яка починала як пошуковий сервіс, зараз є ще й розробником мобільної ОС, постачальником хмарних послуг і власником низки сервісів на кшталт YouTube. Поява цілих департаментів і нових напрямків не може не впливати на розгалуженість і складність інфраструктури.
Також ІТ-інфраструктура компаній ускладнюється через необхідність покращувати та спрощувати користувацький досвід. Пояснимо: інфраструктура умовного банку складається з купи мікросервісних додатків, різних технологій розробки та підтримки, і все це підтримується цілою “армією” фахівців. Саме тому у вас є можливість зробити грошовий переказ з мобільного телефону за лічені секунди.
Можна констатувати різницю: раніше ІТ-моніторинг передбачав лише спостереження за елементами on-premise-інфраструктури, в той час як сьогодні до нього додається необхідність моніторити хмарні сервіси, користувацький досвід, роботу десятків додатків тощо. Проблема з будь-яким із цих компонентів може вплинути на загальну продуктивність ІТ-інфраструктури, а тому всі вони мають бути під наглядом.

Вимоги до ІТ-моніторингу та проблеми з їх дотриманням

З огляду на компоненти інфраструктури, можна зробити очевидний висновок: для якісного моніторингу потрібно мати інформацію про всі вказані компоненти. З цим можуть виникати складнощі, оскільки далеко не кожне рішення моніторингу вміє збирати дані на всіх рівнях — від мережі до кінцевого користувача додатків. Навпаки, часто це окремі фокусні рішення для моніторингу окремих вузлів.
● Існують такі рішення моніторингу: ● Моніторинг продуктивності додатків (APM). ● Моніторинг мережі, зокрема, рішення для забезпечення видимості мережі, аналізу продуктивності та безпеки (NPM, NDR). ● Моніторинг стану апаратної частини інфраструктури, тобто інфраструктурний моніторинг (IM). ● Моніторинг кінцевих користувачів та їхнього цифрового досвіду – End-user experience monitoring (EUEM).
Іноді для компанії справді достатньо одного виду моніторингу, але це специфічні випадки і стосуються вони переважно малого та середнього бізнесу. Бізнес enterprise-рівня традиційно потребує всього і відразу. Напрошується варіант з використанням декількох окремих рішень, які разом охоплять всі необхідні рівні інфраструктури. Не будемо казати, що так не роблять, але зазначимо, що це лише більш комплексне, хоча все ще не повне розв'язання завдання. Причин для цього є декілька, а їх аналіз допоможе сформувати вимоги до моніторингу загалом.

Моніторинг повинен охоплювати всі елементи інфраструктури та всі чинники, що на неї впливають

Викристання декількох видів моніторингу не дає комплексного уявлення про роботу інфраструктури в цілому. Якщо компанія під час аналізу роботи інфраструктури ігнорує аналіз окремої її частини, то зрозуміло, що такий моніторинг не може бути ефективним. Слід враховувати взагалі всі чинники, які можуть впливати на роботу інфраструктури. Щоб справді отримувати повну інформацію для зважених рішень потрібно аналізувати взаємодію користувачів з додатками та мережею, отримувати дані з хмари та сканувати трафік на предмет загроз.

Дані необхідно збирати та аналізувати централізовано

Часто окремі рішення моніторингу використовуються окремими відділами. Наприклад, системні адміністратори використовують інфраструктурний моніторинг, тоді як моніторинг додатків використовується відділами розробки та тестування. Все це не сприяє покращенню видимості; навпаки, у відділах, що працюють з різними елементами інфраструктури та різними рішеннями моніторингу, є різні уявлення про її стан.

Збір правильних та повних даних різними системами моніторингу теоретично дає все необхідне для отримання висновків, але не самі висновки. Це ніби вгадати всі букви у телевікторині, але не скласти з них загадане слово. Щоб зробити цей крок, дані треба збирати централізовано в єдину систему моніторингу, до якої матимуть доступ і ІТ-команди, і команди з кібербезпеки. Це дозволить усунути сліпі зони та бачити повноцінну картину всім ІТ-відділам.

Система моніторингу має розуміти відхилення від норми

Остання вимога полягає в можливості системи розуміти стан норми та правильно інтерпретувати відхилення від неї. Це довершить моніторинг, все більше наближаючи отримувані дані до вигляду висновків, а не звітів.
Просто порівняйте умовно два системні сповіщення:

Час відгуку сервісу X становить…..кількість помилок 404: …

Робота сервісу Х погіршилась на …% в результаті отримання пакетів з хоста ХХ, [Дивитись схему залежностей]

Щоб отримати такий результат, система моніторингу має бути комплексною в повному розумінні цього слова. Звісно, можна розраховувати на якість та наявність можливостей для взаємної інтеграції рішень, а можна пошукати готову повнофункціональну платформу, що розроблялась саме для комплексного моніторингу інфраструктури.
Розглянемо приклад такої платформи комплексного моніторингу від Riverbed.

Як працює комплексний моніторинг від Riverbed?

Платформа комплексного моніторингу від Riverbed складається з декількох рішень, які можуть працювати як самостійні інструменти, але найбільше користі приносять саме у зв'язці. Загально вони охоплюють моніторинг інфраструктури, мережі, додатків та користувацького досвіду.
Якщо ж розібрати платформу на складники, отримаємо таке: ● Управління ІТ-інфраструктурою за допомогою Alluvio NetIM. Це класичний моніторинг компонентів інфраструктури, який надає інформацію про її топологію та взаємозв'язки. Безагентна архітектура дозволяє отримувати повне уявлення того, як інфраструктура впливає на мережу та додатки і, як наслідок, на якість обслуговування споживачів. ● Аналіз трафіку з Alluvio NetProfiler. Забезпечує швидкий моніторинг мережі. Рішення може виявляти залежності між сервісами у гібридній мережі, визначати стан норми та сигналізувати про відхилення від неї. ● Більш глибокий аналіз залежностей у мережі завдяки захопленню та аналізу пакетів даних — Alluvio AppResponse. Рішення поглиблює аналіз мережі, додаючи дані про роботу додатків та робочі процеси до аналізу мережевого трафіку. Воно поєднує мережеву криміналістику, аналітику додатків і моніторинг досвіду кінцевих користувачів в одному рішенні, дозволяючи розвʼязувати проблеми з мережею та додатками ще до того, як з ними зіткнуться кінцеві споживачі. ● Продуктивність додатків та їх взаємодія з кінцевим користувачем за допомогою Alluvio Aternity — багатофункціонального рішення. З одного боку воно забезпечує захоплення всіх транзакцій та процесів всередині додатків для їх подальшого аналізу та виявлення проблем. З іншого, будучи розгорнутим як агент на кінцевих пристроях, рішення дозволяє зчитувати дані про взаємодію користувачів з додатками та розуміти, який реальний досвід використання сервісів вони отримують.
Фінальний етап — забезпечити зручну роботу з отриманим масивом даних для ІТ-спеціалістів. Збирання даних з 4+ рішень окремо не можна назвати ефективним моніторингом, тому всі ці рішення об'єднує Alluvio Portal, який, власне, і перетворює їх у платформу комплексного моніторингу. Portal дозволяє створювати інтерактивні дашборди, об'єднуючи в одному інтерфейсі всі зібрані дані та надаючи цілісне уявлення про інфраструктуру, додатки, мережу та користувацький досвід.

Висновок

Комплексний моніторинг поступово перетворився на must have для більшості організацій. Особливо це стосується компаній рівня enterprise, які часто будують гібридні розгалужені ІТ-інфраструктури та водночас повинні відповідати високим стандартам стосовно якості роботи цифрових продуктів. Відсутність моніторингу в таких випадках просто забере у цих компаній можливість своєчасного виявлення та усунення проблем.
Водночас це означає, що моніторинг не може існувати просто «заради галочки». Це має бути дієвий комплексний інструмент, який справді спрощує щоденну рутину фахівців та дозволяє значно підвищити ефективність підтримки та оптимізації ІТ-інфраструктури. На цей час комплексний моніторинг Riverbed є одним із тих рішень, які найповніше відповідають цим вимогам.