Comment la surveillance du réseau permet d'assurer la disponibilité et la santé du centre de données


Découvrez comment la surveillance du réseau donne aux équipes informatiques les outils nécessaires pour maintenir un centre de données sain qui alimente l'activité.


Table des matières :

Le centre de données moderne d'aujourd'hui

  • L'informatique passe du statut de support à celui d'acteur de l'entreprise.
  • Résultats technologiques de la pandémie de COVID-19

Causes et conséquences des temps d'arrêt dans le climat économique actuel, dominé par le numérique.

  • Les erreurs simples qui entraînent des temps d'arrêt
  • Prix à payer pour les interruptions de service

Pourquoi chaque entreprise a besoin de la surveillance du réseau

  • Une complexité croissante dans le centre de données signifie une complexité croissante sur le réseau.
  • Comment la surveillance du réseau transforme la réactivité en proactivité

Protéger la santé du centre de données grâce à la surveillance du réseau

 


Le centre de données moderne d'aujourd'hui

L'informatique passe du statut de support à celui d'acteur de l'entreprise.

Aujourd'hui, la technologie de l'information est intégrée ; l'informatique ne fait pas seulement partie de l'entreprise - elle est l'entreprise. Le concept traditionnel du centre de données a disparu depuis longtemps, tout comme les exigences fondamentales des clients du passé. Les centres de données doivent fonctionner comme une passerelle vers l'informatique et assumer simultanément le rôle d'une équipe d'exploitation externalisée. Le modèle traditionnel de centre de données en silo ne s'applique plus.

Pratiquement toutes les entreprises ont adopté, ou sont en train d'adopter, une infrastructure de calcul plus élastique. Le cloud public entre en jeu lorsque des charges de travail éphémères sont nécessaires, tandis que le cloud privé ou l'environnement de colocation fournit la plate-forme de base elle-même. Les centres de données fournissent généralement aux entreprises les ressources dont elles ont besoin et les moyens de les éliminer lorsqu'elles ne sont plus nécessaires.

  • "Les dépenses mondiales des utilisateurs finaux en services de cloud public devraient augmenter de 18,4 % en 2021 pour atteindre un total de 304,9 milliards de dollars, contre 257,5 milliards de dollars en 2020."

Gartner, Gartner prévoit que les dépenses des utilisateurs finaux de l'informatique en nuage public dans le monde entier augmenteront de 18 % en 2021.

  • Dans le même temps, le centre de données d'entreprise est bien vivant. Alors que de nombreuses charges critiques sont migrées vers le cloud public, plus de la moitié des charges de travail devraient rester dans des centres de données sur site en 2022 (Uptime Institute).2

En outre, la conformité reste importante, associée à la nécessité d'une gouvernance. Les coûts associés à la mise en service de machines à la demande sont importants. Par conséquent, l'accès en libre-service dont les entreprises ont besoin doit être proposé parallèlement à des mécanismes de gouvernance et de contrôle, tout en préservant la liberté des utilisateurs.

En outre, le rôle des logiciels est incontestable. La création de services logiciels autour des sauvegardes, de la gestion des adresses IP, de l'IaaS, du PaaS, c'est-à-dire de tous les services imaginables, est un élément majeur de l'infrastructure des centres de données modernes. En définitive, l'interface entre l'entreprise et le centre de données sera pilotée par des logiciels.

Résultats technologiques de la pandémie de COVID-19

Enfin, il faut tenir compte des implications de la pandémie de COVID-19 :

  • La crise du COVID-19 a accéléré les transitions vers le cloud. En fait, les dépenses liées au cloud ont augmenté de 37 % pour atteindre 29 milliards de dollars au cours du premier trimestre de 2020. Il est probable que cette tendance se poursuive, car le travail virtuel renforce le besoin de services technologiques hors site qui soient évolutifs, sécurisés, fiables et rentables (PWC).3
  • L'augmentation sans précédent du travail à distance a exacerbé le besoin d'un accès plus rapide aux données. Par conséquent, l'industrie informatique accorde une attention accrue aux équipements de réseau et aux communications comme elle ne l'a jamais fait auparavant. Les déploiements de réseaux 5G et l'adoption d'équipements 5G s'accélèrent (Deloitte).4

Il est impossible d'examiner de plus près le centre de données moderne sans tenir compte de l'impact de la crise du COVID-19 sur le secteur technologique. La pandémie a entraîné une transition quasi nocturne vers des équipes de travail presque entièrement distantes, ainsi qu'une augmentation massive des appareils BYOD. Les solutions de sécurité et les solutions définies par logiciel ont été adoptées avec une fréquence accrue. Les organisations ayant progressivement utilisé le réseau d'une manière qui n'avait pas été prévue, le monde des technologies de l'information s'est vu rappeler son importance cruciale.

"L'augmentation du travail à distance due à COVID-19 a renforcé l'importance et la fiabilité des centres de données et des réseaux qui les soutiennent."

-Data Centers Critical to Business Operations, North American Data Center Report H1 2020, CBRE Research5


Causes et conséquences des temps d'arrêt dans le climat économique actuel, dominé par le numérique.

Les erreurs simples qui entraînent des temps d'arrêt

Le lien le plus flagrant entre la santé globale du centre de données et la surveillance du réseau est probablement le risque de temps d'arrêt. Tout centre de données comporte le risque d'un événement non planifié qui entraîne une panne. La vérité est que les pannes se produisent. Même avec la technologie la plus avancée et la redondance intégrée, l'informatique travaille toujours avec des systèmes imparfaits.

Le plus souvent, les temps d'arrêt sont causés par des erreurs relativement simples :

  • Manque de documentation sur le réseau
  • Informations limitées sur les configurations de réseau
  • Des moyens inefficaces pour identifier et suivre les dispositifs sur le réseau
  • Impossibilité d'identifier les connexions ISP
  • Manque de visibilité sur les performances
  • Incapacité à identifier les causes profondes

"La panne va se produire, le temps d'arrêt va se produire, mais ce que vous faites ensuite est ce qui définit si c'était un gros temps d'arrêt ou une bavure."

-Jordan MacPherson, gestionnaire de programme, Park Place Technologies

 

Prix à payer pour les interruptions de service

En fin de compte, la plus grande conséquence d'un temps d'arrêt dans le climat numérique actuel est l'incapacité de se rétablir en tant qu'entreprise, bien que l'impulsion puisse varier. Une entreprise a peut-être perdu des employés parce qu'elle n'a pas pu les payer à temps en raison de la panne des systèmes informatiques. Ou peut-être le service offert n'a-t-il pas été fourni à temps parce que les systèmes n'étaient pas disponibles ou performants. D'autres conséquences incluent, sans s'y limiter, la perte de productivité, la perte de revenus et des coûts qui ne peuvent être quantifiés, tels que l'abandon d'initiatives informatiques, la dégradation du moral des équipes informatiques et les opportunités perdues sur le marché (Mission Critical Magazine).6

  • Selon un rapport de l'Agence fédérale de gestion des urgences (FEMA), 40 % des entreprises ne rouvrent pas leurs portes après une catastrophe. En outre, 25 % d'entre elles font faillite dans l'année qui suit.7
  • La United States Small Business Administration a constaté que plus de 90 % des entreprises font faillite dans les deux ans qui suivent une catastrophe.8
  • Selon une étude de l'ITIC, une majorité écrasante (98 %) d'organisations déclarent qu'une seule heure d'indisponibilité leur coûte 100 000 dollars ou plus, et 81 % affirment que le coût horaire est de 300 000 dollars ou plus.9

Pourquoi chaque entreprise a besoin de la surveillance du réseau

Une complexité croissante dans le centre de données signifie une complexité croissante sur le réseau.

Le centre de données a évolué, tout comme la surveillance du réseau. Aujourd'hui, le logiciel règne sur le centre de données ; il existe des routeurs, des commutateurs, des réseaux définis par logiciel, etc. Les équipes informatiques sont chargées de mesurer et de gérer des activités réseau étendues et disparates. Les équipes informatiques sont chargées de mesurer et de gérer des activités réseau étendues et disparates. Les environnements informatiques multicouches sur lesquels les organisations s'appuient introduisent un nouveau niveau de complexité dans la surveillance du réseau, ce qui a un impact sur la façon dont les administrateurs réseau supervisent des éléments tels que la latence, les performances et d'autres détails critiques du réseau.

Quel que soit le secteur d'activité, chaque organisation a besoin d'une visibilité sur le réseau et d'une intelligence exploitable pour prendre les décisions appropriées avec un temps de réponse rapide. Par essence, l'informatique est construite sur le réseau ; tout nécessite une connectivité réseau pour fonctionner. En l'absence de visibilité, de gestion des performances ou d'analyse du réseau, il est impossible d'établir des liens entre le réseau et tout ce à quoi il est connecté. Les administrateurs réseau ont besoin de visibilité sur le réseau par le biais de la surveillance du réseau pour prendre diverses décisions tactiques et stratégiques. La planification des ressources, l'ajustement des performances et les mesures de sécurité sont autant de garanties conséquentes contre les temps d'arrêt. Par exemple, si une entreprise prévoit d'ajouter des ressources telles qu'une nouvelle application de productivité, il est extrêmement difficile d'anticiper la quantité appropriée de bande passante que l'application demandera. Ce type de retard, dans un environnement commercial aussi rapide et axé sur le client, peut gravement limiter le potentiel de croissance et d'agilité d'une entreprise.

Cependant, avec le bon système de surveillance du réseau, il devient possible de surveiller efficacement les ressources et les performances, des applications aux services, pour finalement soutenir les opérations du centre de données dans son ensemble.

Comment la surveillance du réseau transforme la réactivité en proactivité

"Dans ma journée d'administrateur réseau, je suis chargé d'assister l'utilisateur final. Si quelqu'un prend son ordinateur portable et ne parvient pas à se connecter à une application ou à un site web, le problème arrive rapidement sur mon bureau. Grâce à la surveillance du réseau, je peux trouver l'origine de ce problème rapidement et facilement."

-Eric Felton, administrateur de réseau, Park Place Technologies

Qu'il s'agisse d'un serveur qui tombe en panne, d'une base de données qui ne se copie pas ou d'un ingénieur qui découvre un problème, le réseau est souvent soupçonné en premier. Les utilisateurs se tournent généralement vers les administrateurs de réseau pour obtenir de l'aide et, bien sûr, ces derniers aimeraient probablement pouvoir répondre "Oui, et nous avons des signes clignotants géants qui indiquent directement le problème". Malheureusement, la résolution des problèmes nécessite généralement une analyse à partir de la base, par exemple en se connectant à un routeur particulier ou au dispositif reliant l'utilisateur final et l'application en question, et en enquêtant.

Avec une solution de surveillance du réseau, les administrateurs ont accès à des tableaux de bord complets, lisibles par l'homme, qui donnent un aperçu des événements du réseau. Si les périphériques réseau sont bons pour collecter des données, ils sont imparfaits lorsqu'il s'agit de les afficher. La surveillance du réseau transforme les données en alertes qui sont utiles, lisibles et pertinentes.

Prenons l'exemple suivant, particulièrement pertinent au lendemain du début de la pandémie : De nombreuses entreprises ont été contraintes de recourir à des VPN lorsque la main-d'œuvre s'est soudainement éloignée. Le problème des VPN est leur limitation : une fois qu'ils sont pleins, ils sont pleins. Sans logiciel de surveillance du réseau, dans ce scénario, un utilisateur va probablement soumettre un ticket ou contacter directement le service informatique parce qu'il ne peut pas se connecter au VPN. Un administrateur du service d'assistance non armé devra identifier le VPN en question, les messages d'erreur, etc., en comptant en partie sur l'utilisateur final pour enquêter. La surveillance du réseau permet aux administrateurs de résoudre les problèmes de manière proactive ; dans ce cas, en déclenchant une alerte indiquant que le VPN est rempli à 90 %, par exemple, ce qui permet aux administrateurs de commencer à déplacer les connexions vers un autre VPN avant que cela ne devienne un problème.

C'est l'un des centaines de cas potentiels dans lesquels une solution de surveillance du réseau fait passer l'équipe réseau de l'état réactif à l'état proactif. La vie est meilleure pour les utilisateurs finaux et les administrateurs réseau, ce qui se traduit en fin de compte par une meilleure prestation de services pour l'entreprise et un centre de données plus sain pour l'organisation et ses clients.


Protéger la santé du centre de données grâce à la surveillance du réseau

"Sans le réseau, il n'y a pas de centre de données. Le réseau est son élément constitutif."

- Jordan MacPherson, gestionnaire de programme, Park Place Technologies

Considérez la pratique critique de la protection des données. Lorsque l'on parle de surveillance du réseau, le sujet de la protection des données n'est pas souvent abordé - mais peut-être devrait-il l'être. Le réseau joue un rôle dans la protection des données lorsqu'il s'agit de s'assurer de la disponibilité de la bande passante pour que les sauvegardes hors site se déroulent correctement, ou de s'assurer que le réseau est en place si une activité de reprise après sinistre doit avoir lieu et que l'informatique doit être transférée vers un site secondaire, par exemple. Bien qu'il ne s'agisse pas nécessairement d'un lien évident, la surveillance du réseau est très importante pour la protection des données et, par extension, pour le centre de données. Si l'équipe informatique n'a pas une vue complète du réseau ou ne comprend pas comment il fonctionne, les efforts de protection des données sont essentiellement rendus inutiles parce que le réseau n'est pas disponible pour les diriger.

La connectivité et la communication sont au cœur de l'informatique, et le réseau en est le facilitateur. Sans réseau, il n'y a pas de visibilité sur le stockage, par exemple, ou les installations - et sans une solide pratique de surveillance du réseau, l'équipe informatique ne disposera pas des informations nécessaires pour démontrer que la surveillance du réseau a protégé le centre de données et empêché toute perturbation potentielle.

 


Références
  1. https://www.gartner.com/en/newsroom/press-releases/2020-11-17-gartner-forecasts-worldwide-public-cloud-end-user-spending-to-grow-18-percent-in-2021
  2. https://uptimeinstitute.com/2020-data-center-industry-survey-results
  3. https://www.pwc.com/us/en/industries/tmt/library/covid19-cloud-infrastructure.html
  4. https://www2.deloitte.com/global/en/pages/about-deloitte/articles/covid-19/understanding-covid-19-s-impact-on-the-technology-sector-.html
  5. https://www.cbre.us/research-and-reports/North-America-Data-Center-Report–H1-2020
  6. https://www.missioncriticalmagazine.com/articles/92664-what-unanticipated-downtime-means-for-your-business
  7. https://www.fema.gov/
  8. https://www.sba.gov/
  9. https://itic-corp.com/blog/2016/08/cost-of-hourly-downtime-soars-81-of-enterprises-say-it-exceeds-300k-on-average/