Best Practice,

Se un servizio cloud cade nel deserto e non c’è nessuno a sentirlo…

Quale potrebbe essere l’effetto di un fermo di un servizio in cloud se esso non è controllato da un valido sistema di monitoraggio? Il crash passerebbe inosservato… oppure no?

Se anche i tecnici possono non accorgersi di un malfunzionamento, gli utenti di un servizio se ne accorgono immediatamente. Ha così inizio una serie di comunicazioni – prima segnalazioni, poi lamentele – destinate a creare molto più rumore di quanto ne avrebbe creato una segnalazione automatica, proattiva, e gestita con i giusti meccanismi di esclation interni. 

Tanto rumore per nulla? Decisamente no. Un malfunzionamento non gestito prima di diventare di pubblico dominio può portare pesanti conseguenze, sia sul mercato, sia a livello interno all’azienda. L’effetto di mercato è piuttosto chiaro: l’esperienza d’uso negativa, oltre a creare un danno di immagine, può arrivare a far perdere quote di mercato anche rilevanti all’azienda. Forse meno evidente, ma ugualmente rilevante, è la capacità di eventi simili di scuotere anche gli assetti interni alle organizzazioni. Tipicamente, infatti, incidenti di business rilevanti comportano l’analisi dell’accaduto e la ricerca di responsabilità. L’operato di manager e decisori – responsabili del corretto funzionamento del servizio – viene messo in discussione, alla ricerca di eventuali errori o mancanze.  

Se l’azienda ha investito in un servizio digitale in cloud ritenendolo importante per il suo business dovrebbe anche sincerarsi di attuare un opportuno piano di monitoring e di segnalazione degli incident, non lasciando al caso, o peggio ancora ad un approccio emergenziale, la gestione degli stessi quando dovessero verificarsi.  

Il cloud provider è responsabile del monitoraggio dell’infrastruttura e della manutenzione dei server online, ma è chi gestisce il prodotto digitale che deve preoccuparsi di monitorare end-to-end lo stato di salute effettivo dell’applicazione

Private , Public o Hybrid: ogni Cloud può essere monitorato

Certo, monitorare un servizio in cloud può essere complesso, tanto più nei casi in cui ci si trovi a operare con sistemi di cloud pubblico o ibrido, che tipicamente presentano più ostacoli rispetto al monitoraggio del cloud privato.

Nel cloud pubblico, il provider è responsabile di (quasi) tutto, dalla gestione dell’infrastruttura di basso livello agli SLA relativi ai servizi consumati, dall’affidabilità del ferro alla sua manutenzione ed evoluzione. Il minor impegno per l’azienda cliente, però, non implica la totale negligenza del monitoring: tutt’altro. Più il sistema è complesso, più un fallimento (per quanto improbabile, dati i livelli di SLA dei principali cloud provider pubblici) in un punto del sistema si trasmette al resto dello stesso, causando una degradazione del livello di servizio (SLA) che, nella peggiore delle ipotesi, può compromettere, a sua volta, i parametri di servizio offerti dall’azienda stessa ai suoi clienti. 

Se da un lato sono fondamentali parole chiave quali l’High Availability, la Redundancy e la Fault Tolerance, sia a livello infrastrutturale che applicativo, dall’altro non può mancare un sistema in grado di stabilire, in maniera tempestiva, che è in corso un evento che sta degradando le performance applicative ad un punto tale da essere notato dagli utenti finali. 

Non è possibile escludere a priori il verificarsi di un incident, nè prevederne con ampio anticipo il suo verificarsi. L’unico modo per gestirlo in modo efficace è prevedere in anticipo  le modalità di gestione, che dovranno includere la messa in atto di una comunicazione proattiva verso i suoi clienti, utile a preservare – o addirittura migliorare – l’immagine aziendale. L’utente finale può venire così tempestivamente avvisato di quanto sta accadendo, rassicurato sulla pronta presa in carico del problema e aggiornato puntualmente sulla sua gestione.  I benefici di questo approccio sono evidenti: il cliente finale del servizio cloud monitorato è consapevole della situazione e generalmente più disposto ad accordare fiducia all’operato dell’azienda, che si sta dimostrando trasparente nei suoi confronti. Anche le sollecitazioni al supporto tecnico saranno minori, cosa che si tradurrà in una maggiore capacità di concentrarsi sulla soluzione della situazione.

 Gli ambienti cloud ibridi combinano cloud privati e pubblici e condividono con questi ultimi  molte delle preoccupazioni relative alla visibilità. Inoltre sono tendenzialmente complessi, costituiti da più componenti diversi, collegati a più fonti diverse di dati e altamente distribuiti e dinamici. I problemi identificati in precedenza si applicano, moltiplicati, anche a questi tipi di impianti.

La scelta tra cloud pubblico, privato, o ibrido -che li comprende entrambi- dipende dalle caratteristiche del progetto che si intende realizzare. In ogni caso, il monitoraggio del corretto funzionamento dei prodotti digitali è necessario. Esperienza e conoscenza sono gli elementi necessari per implementare  sistemi di monitoraggio adeguati alla specifica natura del sistema in cloud che ospita la soluzione.

Ti piace leggere?

A noi piace scrivere, dai un’occhiata alle nostre guide e approfondimenti

Library di Innovazione Digitale
       .--.                   .---.
   .---|__|           .-.     |~~~|
.--|===|--|_          |_|     |~~~|--.
|  |===|  |'\     .---!~|  .--|   |--|
|%%|   |  |.'\    |===| |--|%%|   |  |
|%%|   |  |\.'\   |   | |__|  |   |  |
|  |   |  | \  \  |===| |==|  |   |  |
|  |   |__|  \.'\ |   |_|__|  |~~~|__|
|  |===|--|   \.'\|===|~|--|%%|~~~|--|
^--^---'--^    `-'`---^-^--^--^---'--' 

Best practice per il monitoraggio del cloud

Per far sì che la soluzione di monitoraggio del cloud funzioni in modo efficace in termini sia di prevenzione sia di efficientamento dei sistemi, è utile tenere a mente alcuni punti chiave:

Identificare indicatori di prestazioni chiave (KPI) e altre metriche che influiscono su business e UX. Gli ambienti cloud presentano diversi elementi da poter monitorare, ma alcuni sono più rilevanti di altri. È dunque indispensabile definire quali KPI e metriche privilegiare per strutturare il sistema di monitoraggio.

Organizzare l’architettura per garantirne una sua buona observability (link). comprendere le relazioni tra le singole risorse e inserire tali informazioni nel sistema di monitoraggio è fondamentale per una comprensione più completa di come un problema all’interno di un componente possa influenzare l’applicazione più ampia.

Stabilire limiti di tolleranza operativa precisi. Diverse applicazioni hanno diversi livelli di minimi di servizio indispensabili all’efficace funzionamento. È importante definire parametri precisi per ciascuno di essi, così da prevedere la variazione automatica del numero di server per mantenere i livelli di prestazione.

Consolidare tutti i dati all’interno di un’unica piattaforma centralizzata. È importante che tutti i dati di monitoraggio, del cloud e non solo, siano gestiti in modo organico, normalizzati e messi a disposizione in un unico framework d’analisi, così da poter disporre di una visione completa dell’operatività del sistema.

Definire il processo di escalation ed i ruoli coinvolti. È fondamentale che, in caso di incident, a seconda della complessità dell’organizzazione e del servizio, sia previsto un preciso insieme di ruoli in grado di prendere in carico i segnali del sistema di monitoring, analizzarli, ed eventualmente scaricarli ad incident, consapevoli delle comunicazioni che il sistema sarà in grado di realizzare verso il parco clienti.

Definire accuratamente la comunicazione durante la situazione emergenziale . È altrettanto imperativo che, in caso di incident, l’azienda sia preventivamente strutturata per realizzare una comunicazione corretta verso i proprio clienti, trovando il giusto equilibrio tra trasparenza e tempestività; la comunicazione in stato di emergenza non deve essere né ignorata (una non comunicazione è una comunicazione), né improvvisata.

Bottega52 offre alle aziende la possibilità di concentrarsi sulla gestione del loro business con la consapevolezza di avere un sistema di monitoraggio affidabile e continuo dei propri prodotti digitali in cloud, gestito, definito e parametrizzato in modo funzionale alle specifiche di ciascuna singola applicazione. 

Hai visto qui?

Abbiamo molti altri articoli da leggere, vai a vedere!

Insights52
,---------------------------------------.---------.    
|                                       |         |    
|    ,-----------------------------.    |    .    |    
|    |                             |    |    |    |    
|    |    ,-------------------.    |    |    |    |    
|    |    |                   |    |    |    |    |    
|    |    `----     ,----     |    |    |    |    |    
|    |              | @       |    |    |    |    |    
|    |    ,---------"---------:    |    `----'    |    
|    |    |                   |    |              |    
|    `----:    ,---------.    |    `---------.    |    
|         |    |         |    |              |    |    
|    .    |    |    .    |    |     ---------'    |    
|    |    |    |    |    |    |                   |    
:----'    |    |    |    |    |    ,--------------:    
|         |    |    |    |    |    |              |    
|    .    |    `----'    |    |    |     ----.    |    
|    |    |              |    |    |         |    |    
|    `----"---------     |    |    `---------'    |    
|                        |    |                   |    
`------------------------'    `-------------------'