Conceitos errados de gestão de rede: Edição 1

Livros Brancos


Nossa rede não vai falhar. Temos redundância.

Trabalhando com clientes de diferentes tamanhos e indústrias, Entuity acumulou uma experiência significativa na identificação e diagnóstico de fatores de risco da rede. Mesmo as empresas que haviam implementado o que pensavam ser políticas pró-ativas ficaram surpresas e cegas com o que Entuity software de gerenciamento de rede encontrou à espreita, logo abaixo da superfície de suas redes. A base para a maioria das questões era que as empresas simplesmente não sabiam o suficiente sobre a saúde de suas redes e não estavam cientes do perigo iminente. Este artigo é o primeiro de uma série onde analisamos conceitos errôneos comuns sobre o gerenciamento de redes através das experiências da vida real de várias empresas. O objetivo de cada questão é trazer à tona fatores de risco da rede, quantificar esses riscos com exemplos e - o mais importante - dar-lhe a receita para evitar que sua rede se torne terminal para seu negócio.

O Mito da Redundância
A maioria do pessoal de TI associa, por direito, "estabilidade" a não "colisão". A indústria reflete esta forma de pensar, padronizando o tempo médio entre falhas (MTBF) como uma medida aceita de confiabilidade. Mas com os avanços nos protocolos de hardware e comunicações, desastres naturais à parte, você pode ser pressionado a se lembrar da última vez que teve uma interrupção completa da rede. De fato, as arquiteturas modernas de rede são propositalmente construídas em redundância, ao ponto de que interrupções completas são, em grande parte, coisa do passado. Uma falsa sensação de segurança, no entanto, pode fazer com que você perca questões de instabilidade mais generalizadas e cada vez mais freqüentes.

Empresa de serviços financeiros sem visibilidade de nível de ligação
Essa foi precisamente a experiência de uma grande empresa de serviços financeiros antes de utilizar Entuity. Eles já haviam investido milhões de dólares em uma estrutura de gerenciamento de rede e gastaram milhares de meses de trabalho implantando a aplicação. Infelizmente, a estrutura não tinha a visibilidade de nível de linha para indicar que a conexão de fibra primária entre os dois principais campi da empresa havia ficado em baixo por algum tempo.

A causa? Uma equipe de construção instalando novos postes utilitários ao lado do estacionamento cortou o link de fibra de reserva. Normalmente, isto não teria sido um problema - se, isto é, a equipe de TI soubesse que o elo principal tinha falhado e tinha sido capaz de consertá-lo imediatamente. Mas como sua solução estrutural não podia ver a falha, o pessoal não sabia que sua redundância tinha sido comprometida e que eles tinham estado passando por cima do link de backup por semanas antes que ele fosse cortado. Além do pânico, dos custos de horas extras a serem reduzidos e da chamada de serviço de emergência do empreiteiro de reparo de fibra, esta interrupção afetou milhões em transações financeiras para esta empresa. Além disso, a solução estrutural foi um enorme investimento, mas não conseguiu alertá-los sobre o risco de sua redundância.

Se a empresa estivesse usando Entuity, eles teriam tido o benefício de várias características que teriam rapidamente notificado o pessoal de TI que os problemas estavam à frente. Estas características incluem inventário continuamente atualizado, mapas topológicos que fornecem indicadores visuais claros do status dos dispositivos, portas, links e serviços e um Sistema de Gerenciamento de Eventos (EMS) incorporado que elimina tempestades de eventos e permite o foco nos eventos mais importantes. Entuity também permite o monitoramento de nível de serviço, o que teria permitido à equipe definir um serviço que consistisse nos links primários e de backup.

Ao monitorar sua redundância como serviço, a equipe teria tido visibilidade em nível de porto, o que significaria que saberiam que a porta para a conexão de backup (que normalmente estava em baixo) subiu (e que agora estavam funcionando em uma conexão cara) e que a conexão primária havia falhado. Eles teriam sabido ainda mais sobre a falha subseqüente da conexão de backup.

Entuity Ajuda a Empresa de Comércio Financeiro a Evitar Desastres
Outra empresa comercial financeira descobriu o pouco que sabia sobre a saúde de sua rede durante uma avaliação de Entuity. Logo após a instalação do software em suas instalações, Entuity alertou um gerente de operações para uma falha do ventilador em um de seus switches principais. Havia um ventilador secundário ainda em operação, mas os dados de temperatura sendo coletados por Entuity mostraram claramente um aumento que seria crítico em poucos dias.

A equipe de avaliação do software fez um breve intervalo para corrigir imediatamente a situação. Ao continuar a avaliação, a investigação de um roteador central revelou uma falha secundária no fornecimento de energia - uma situação de risco. Obviamente, a equipe fez outro interlúdio intenso. Em ambos os casos, suas ferramentas atuais de monitoramento "luz vermelha, luz verde" relataram que os dispositivos estavam "para cima", mas os deixaram cegos para a iminente desgraça. Uma falha em qualquer um dos dois casos teria deixado os usuários comerciais sem acesso às aplicações comerciais de que precisam para concluir seus trabalhos. Centenas de usuários ociosos e clientes incapazes de fazer negócios teriam certamente sido um desastre.

Sumário
As conseqüências da falta de visibilidade sobre o verdadeiro estado da rede podem ser graves. As soluções tradicionais de monitoramento de rede de estrutura e ferramentas inferiores simplesmente não vão suficientemente fundo para capturar todos ou a maioria dos problemas que podem representar uma ameaça para a rede. Entuity contrasta fortemente com estes produtos, fornecendo informações detalhadas e facilmente acessíveis da rede que permitem às empresas capturar problemas potenciais antes que eles aconteçam. Recursos como a descoberta automática contínua, mapas topológicos atualizados, um EMS avançado, serviço, dispositivo e monitoramento de nível de porta e painéis e relatórios líderes da indústria permitem às empresas em todo o mundo reduzir drasticamente os fatores de risco que podem estar à espreita logo abaixo da superfície de suas redes.