redes servidores virtualização

Facilidades e desafios de uma solução hiperconvergente

Zilmar de Souza Junior

Analista de sistemas do Tribunal Regional Eleitoral do Paraná

A área de projeto, operação e serviços de datacenters é um dos principais alicerces da evolução tecnológica atualmente, pois através dos milhares de datacenters espalhados pelo globo, uma gigantesca quantidade de dados é processada diariamente, consolidando transações financeiras, cálculos científicos, interações sociais e diversas outras atividades. Naturalmente, o número de abordagens para definição de sua infraestrutura é diverso. Este artigo apresenta as facilidades e desafios de uma dessas abordagens, conhecida como hiperconvergência que provê a virtualização ao agregar diferentes camadas do datacenter em uma. Com alta escalabilidade, poder de processamento e armazenamento, essa solução busca suprir as necessidades do datacenter moderno, com gerencia facilitada e crescimento que acompanha o negócio.

O modelo de infraestrutura atual mais encontrado em datacenters envolve uma solução de armazenamento centralizado, servidores hipervisores e uma rede SAN (Storage Area Network) interligando esses componentes. Embora esse cenário esteja consolidado, ele apresenta desafios para quem o gerencia. A principal complexidade está no armazenamento, pois envolve métodos diferentes de gerência, alto custo de expansão devido ao uso de redundância de dados, necessidade de investimento em discos rígidos com grande capacidade de armazenamento e transferência de dados, switches de rede de alta velocidade, e outros pontos característicos de uma solução comercial.

Em ambientes críticos com alta demanda, a latência é uma medida importante e varia drasticamente dependendo da fonte do dado, conforme exemplificado na Tabela 1.

Portanto, além da latência das operações em disco, soma-se a latência do tráfego da rede e com o surgimento de discos rígidos mais rápidos, o gargalo de processamento é transferido para a rede. Considerando os dados de tempo para as operações, fica evidente que quanto mais próximo do processador, melhor será o desempenho computacional.

Com esses pontos em mente, surgiu a abordagem hiperconvergente, agregando em um único nó, o armazenamento e o processamento. Além disso, a utilização de grande quantidade de memória RAM possibilita a classificação dos dados, em que os mais acessados ficam disponíveis nessa área e aqueles menos acessados são escritos no disco.

Portanto, o gargalo antes encontrado não existe nesse tipo de implementação. A chamada hiperconvergência tem se tornado uma tendência de solução escalável para datacenters, justamente pela sua característica, pois sua arquitetura permite alta disponibilidade, fácil expansão, retorno de investimento e gerência centralizada. Além disso, a complexidade da infraestrutura é reduzida, já que não é necessário preocupar-se com arrays de storages, redes SAN, entre outros.

A abstração de diferentes camadas serem abstraídas por essa abordagem, implica em mudanças no leiaute das instalações do datacenter, pensando principalmente na escalabilidade. Estimar o crescimento da infraestrutura para correta alocação de recursos é um dos grandes desafios, e para isso é necessário ter instalações adequadas a níveis de refrigeração, energia e rede. Em um datacenter hiperconvergente, a forma de crescimento é diferente de um datacenter tradicional, por conta de sua arquitetura é necessário adaptar os métodos de planejamento de crescimento.


DESENVOLVIMENTO
 

Fundamentação teórica

Um datacenter é um espaço que tem por característica fornecer serviços ininterruptos. Por conta disso, é altamente complexo, formado por diversas salas que possuem características e funções próprias, com o objetivo principal de garantir a disponibilidade do ecossistema.

Os espaços ilustrados na Figura 1, podem ser brevemente descritos como:

  • Sala de Telecomunicações: responsável pela interconexão lógica do datacenter
  • Sala de Energia: responsável pela segurança elétrica e geração de energia
  • Sala de Computadores: acomoda os servidores, storages, robôs de backup e similares.
  • Sala de Operação da Rede: contém os terminais de gerência dos equipamentos e serviços do datacenter
  • Sala de Ar-condicionado: sistemas de controle de temperatura e umidade para manutenção das condições de operação dos equipamentos
  • Automação, incêndio, monitoramento: Câmeras de segurança, sistema de combate e prevenção de incêndio (gás FM-200), controle de acesso biométrico e similares.

Assim, os espaços que compõe o datacenter são essenciais para que a operação seja adequada e as métricas de negócio e disponibilidade sejam alcançadas.

Segundo Rosário (2016), a disponibilidade de um datacenter pode ser obtida matematicamente, tendo como parâmetros o tempo médio entre falhas (MTBF) e o tempo médio para reparo (MTTR).

O MTBF é uma medida que está diretamente relacionada a confiabilidade de determinado ente inserido em um datacenter, e o MTTR é o tempo médio necessário para recuperar um ente que sofreu uma falha. Estabelecendo, portanto, a seguinte relação:

𝐷𝑖𝑠𝑝𝑜𝑛𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 = 𝑀𝑇𝐵𝐹 / 𝑀𝑇𝐵𝐹 + 𝑀𝑇TR

A hiperconvergência, também conhecida como Datacenter Definido por Software (SDDC – Software Defined Datacenter), provê a virtualização ao agregar diferentes camadas do datacenter em uma: processamento, armazenamento ou rede. Oferece, ainda, a integração da gerência, suporte e escalonamento (DAVIS, 2015).

Dentre as diversas tecnologias embarcadas em um datacenter, a virtualização proporcionou um grande avanço tecnológico ao permitir que um mesmo servidor físico, chamado hipervisor, execute diversas máquinas virtuais, que podem ter seu hardware emulado ou até mesmo diretamente mapeado. Segundo Poitras (2017), isso proporcionou um uso mais eficiente do poder de processamento do servidor físico e uma abstração do Sistema Operacional em relação ao hardware. Além disso, o uso de virtualização contribui com a alta disponibilidade dos serviços de um datacenter.

No que tange a virtualização de rede, o protocolo IEEE 802.1Q definiu o padrão de redes locais virtuais (VLAN), essa tecnologia possibilita que sobre um mesmo meio físico seja possível segmentar logicamente o tráfego de dados entre nós da rede, sejam eles hosts ou outros dispositivos de rede como roteadores ou firewalls (FOROUZAN, 2008).

Cenário padrão versus cenário hiperconvergente

No modelo clássico de datacenter, a infraestrutura geralmente é similar ao ilustrado na Figura 2, onde há um hipervisor que conecta-se a um ou mais storages através de uma rede SAN.

Quando o modelo hiperconvergente é utilizado, a topologia torna-se mais simples, como exibido na Figura 3, possuindo apenas os nós do cluster e os switches de alta velocidade e baixa latência. O propósito de haver dois switches é garantir alta disponibilidade em caso de falha de um enlace ou equipamento.

A solução hiperconvergente usada como exemplo, é baseada no software Nutanix e hardware Dell, dispondo de alta capacidade de processamento e armazenamento. Existem atualmente três servidores (nós) que compõe um único cluster hiperconvergente, interligados por conexões de alta velocidade, 10Gbps, e baixíssima latência, condição indispensável para funcionamento correto da solução. Cada nó possui um conjunto de dez discos-rígidos, sendo oito deles HDDs de 1 terabyte (TB) e dois SSDs de 1.6TB. Além disso, contam com 768 gigabytes (GB) de memória RAM cada. O processamento de cada nó é feito por dois processadores Intel Xeon E5-2680 v4 2.4GHz.

A diferença entre as topologias exemplificadas na Figura 2 e Figura 3, é que enquanto no modelo tradicional o hipervisor acessava um recurso de armazenamento centralizado, na hiperconvergência os dados são armazenados em cada nó, possibilitando maior flexibilidade e escalabilidade (POITRAS, 2017). Ao formar o cluster, todos os discos são tratados com um único recurso, formando o que é chamado de storage pool, podendo ser particionado em datastores que então são apresentados ao hipervisor do cluster e utilizados pelas máquinas virtuais (VMs).

O componente responsável pelo controle de entrada e saída de dados das VMs é definido por software, chamado de Controller VM (CVM). Ele está presente em todos os nós do cluster, como exemplificado na Figura 4. Quando uma máquina virtual precisa realizar a gravação de algum dado, a CVM faz a operação salvando a informação em memória flash (SSDs) e ao mesmo tempo replica o dado para os outros nós de forma síncrona, isso garante a disponibilidade do dado mesmo com a falha de um nó.

Com o armazenamento local, elimina-se o gargalo de rede já que os dados da VM não precisam mais trafegar da storage até o hipervisor. O armazenamento na hiperconvergência possui memória flash (discos SSDs) para garantir alta taxa de transferência e discos rígidos comuns para maior volume de armazenamento com menor custo financeiro, além disso é possível categorizar os dados, onde informações mais acessadas sejam mantidas em locais de armazenamento com uma taxa de leitura e escrita muito mais rápidas que os tradicionais discos rígidos.

No caso de falha de algum nó, as máquinas virtuais afetadas são automaticamente reiniciadas em outro nó, caso os dados utilizados por elas não estejam disponíveis localmente, a CVM realizará a transferência dos dados replicados para o nó adequado.

Essas funcionalidades justificam a necessidade de utilização de conexões rápidas e de baixa latência na rede, já que em um ambiente de produção o grande volume de dados implica em uma alta taxa de replicação entre os nós.

Para auxiliar na gerência de toda essa infraestrutura, os servidores Dell contam com uma interface de gerenciamento chamada iDRAC que provê diversas informações importantes no que tange uso de energia, temperatura e uso de recursos computacionais. O console de gerenciamento do servidor, exibe as leituras de energia das fontes, indicando o consumo médio, mínimo e máximo. Além de exibir qual a dissipação de calor correspondente, conforme Figura 5. Essas informações possibilitam ao gerente do datacenter realizar ajustes necessários na refrigeração da Sala de Computadores ou na questão de energia e ainda traçar perfis de consumo.

Outras informações também podem ser visualizadas através da iDRAC, como a temperatura dos processadores e da placa mãe. A própria ferramenta gera um gráfico e possibilita a configuração de alertas quando determinada temperatura for atingida.

O cluster também possui uma interface de gerência, chamada Prism, que traz dados da utilização dos recursos computacionais, exibe configurações básicas das máquinas virtuais hospedadas na solução e serve como ferramenta para resolução de problemas.

Requisitos para implementação

O número mínimo de nós para formação de um cluster utilizando a solução Nutanix é três, assim pode-se definir os requisitos para implementação de uma solução mínima hiperconvergente.

Com auxílio das ferramentas de gerência e dados encontrados nos manuais e datasheets dos equipamentos, é possível calcular a carga térmica da solução, para que o sistema de climatização seja dimensionado corretamente.

Como a documentação já fornece a dissipação de calor por hora de cada equipamento, basta somar os valores para encontrar o total da carga térmica. Sabendo que cada fonte dos servidores tem como valor 4100 BTU/h e que existem fontes redundantes em cada nó, têm-se:

𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑠𝑒𝑟𝑣𝑖𝑑𝑜𝑟𝑒𝑠 = 6 × 4100𝐵𝑇𝑈⁄ℎ = 24.600 𝐵𝑇𝑈/ℎ

Da mesma forma, os switches têm fontes redundantes com dissipação máxima de 799,64 BTU/h, totalizando:

𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑠𝑤𝑖𝑡𝑐ℎ𝑒𝑠 = 4 × 799,64𝐵𝑇𝑈⁄ℎ = 3198,56 𝐵𝑇𝑈/ℎ

Portanto, 𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑡𝑜𝑡𝑎𝑙, será:

𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚._𝑡𝑜𝑡𝑎𝑙 = 𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑠𝑒𝑟𝑣𝑖𝑑𝑜𝑟𝑒𝑠 + 𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑠𝑤𝑖𝑡𝑐ℎ𝑒𝑠 = 27798,56 𝐵𝑇𝑈/ℎ

A unidade mais comum utilizada em projetos para ambientes de datacenter é a Tonelada de Refrigeração (TR), por isso, realizando a conversão para TR, obtém-se:

𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑇𝑅 = 𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚._𝑡𝑜𝑡𝑎𝑙 × 𝐹𝑎𝑡𝑜𝑟𝑐𝑜𝑛𝑣𝑒𝑟𝑠𝑎
𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑇𝑅 = 27798,56 × 0,00008207 = 2,28 𝑇R

Sabendo que a potência de cada fonte de energia dos nós instalados é de 1100W, deve ser considerado que os servidores terão uma demanda máxima de 6600 W por conta da redundância de fonte em cada um. Soma-se ainda, os switches que também tem fontes redundantes de 234.35W, formando um total de 937,4W. Ou seja, a carga total da solução hiperconvergente tida como exemplo será:

𝐶𝑎𝑟𝑔𝑎𝑡𝑜𝑡𝑎𝑙 = 𝐶𝑎𝑟𝑔𝑎𝑠𝑒𝑟𝑣𝑖𝑑𝑜𝑟𝑒𝑠 + 𝐶𝑎𝑟𝑔𝑎𝑠𝑤𝑖𝑡𝑐ℎ𝑒
𝐶𝑎𝑟𝑔𝑎𝑡𝑜𝑡𝑎𝑙 = 6600 + 937,4 = 7537,4

Os cálculos realizados não levam em consideração os demais componentes do datacenter e visam mensurar qual o impacto da solução hiperconvergente instalada.

Escalabilidade

A forma de crescimento de um datacenter hiperconvergente é diferente do modelo tradicional. Como cada nó acrescenta simultaneamente processamento, armazenamento e hipervisor o crescimento torna-se linear. Uma vantagem desse aspecto é que com esse modelo evita-se o superprovisionamento de recursos, podendo-se ter escalabilidade adequada ao crescimento do negócio.

Considerando que a solução é instalada em um rack padrão de 42U, como mostrado na Figura 5, e que para uma solução hiperconvergente mínima são necessários três nós e dois switches, pode-se estimar os requisitos para crescimento nó a nó até o limite máximo por rack.

Pode-se observar que cada nó tem duas conexões em cada switch, isso assegura mais uma camada de redundância por nó em caso de falha de um adaptador de rede. Assim, uma solução básica ocupa pelo menos 8U do rack e seis interfaces 10Gbps de cada switch. Adicionalmente, duas portas de cada switch serão ocupadas para conexões de up-link com o restante da rede do datacenter. Os espaços entre switches e início da posição dos nós é importante para correta acomodação e organização dos cabos.

Parte-se, portanto, de 40 portas livres para conexões de novos nós. Levando em conta que cada nó utilizará duas conexões por switch, será possível adicionar 20 nós aos switches iniciais. Assim, seguindo os cálculos realizados na Seção 2.3 pode-se estimar o impacto que cada nó trará à infraestrutura:

𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑛ó = 2 × 4100𝐵𝑇𝑈⁄ℎ = 8.200 𝐵𝑇𝑈/ℎ
𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑇𝑅_𝑛ó = 𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚._𝑛ó × 𝐹𝑎𝑡𝑜𝑟𝑐𝑜𝑛𝑣𝑒𝑟𝑠ao
𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑇𝑅_𝑛ó = 8.200,00 × 0,00008207 = 0,67 𝑇R
𝐶𝑎𝑟𝑔𝑎𝑛ó = 2 × 1100𝑊 = 2200W

Seguindo esse raciocínio, a carga máxima necessária para atender os 23 nós que usarão toda a capacidade de portas 10Gbps dos switches será:

𝐶𝑎𝑟𝑔𝑎𝑚𝑎𝑥 = 50.600W e 𝐶𝑎𝑟𝑔𝑎𝑡é𝑟𝑚_𝑇𝑅_𝑚á𝑥 = 15,41 𝑇𝑅

Nota-se ainda que essa configuração ocupará 28U do rack, possibilitando a instalação de mais switches e o contínuo crescimento da solução, respeitando a manutenção dos valores dos sistemas elétricos e de refrigeração.

A partir da ocupação total dos switches iniciais, a instalação de novos switches requer que seja realizado o cascateamento entre os switches da solução. Para isso, utiliza-se as interfaces 40Gbps, exibidas na Figura 6, que proverão um backbone de alta velocidade para a intercomunicação entre os nós.

Com a inclusão de novos nós, switches e racks para acomodá-los, uma topologia de rede que proporcionaria maior benefício à solução hiperconvergente seria a Spine-andLeaf. Essa topologia provê alta largura de banda, baixa latência e conectividade nonblocking entre os servidores (CISCO, 2016). A Figura 7 representa uma topologia típica Spine-and-Leaf.

A camada leaf é composta por switches de acesso que conectorizam os servidores, já a camada spine forma o backbone da rede interconectando todos os switches da camada inferior. Sendo uma topologia de malha completa, a comunicação entre quaisquer nós se dará em apenas um salto, a não ser que o servidor esteja no mesmo switch leaf que seu destino, dessa forma é possível ter uma latência previsível.

CONCLUSÕES  

O modelo hiperconvergente mostra-se compatível com o esperado de um datacenter que oferece serviços de qualidade e alta disponibilidade. A escalabilidade facilita o planejamento da infraestrutura necessária para atendê-lo, além de possibilitar o crescimento do datacenter de acordo com o crescimento do negócio. Contudo, é necessário que os administradores aceitem essa quebra de paradigma em relação ao modelo tradicional de datacenter para que as mudanças sejam realizadas adequadamente.

 

Planejar a infraestrutura para que a hiperconvergência seja o modelo de solução em um datacenter novo possibilita que não ocorra o superprovisionamento de recursos, por consequência, diminui os custos para sua implementação. Da mesma forma, a instalação de uma solução hiperconvergente pode ser realizada em um datacenter tradicional, esse modelo híbrido pode ser fundido a medida que os sistemas legados são desativados e novos nós hiperconvergentes são adicionados.

 

Um ponto chave a ser alcançado é o surgimento de novos players no mercado, para que soluções hiperconvergentes tornem-se mais acessíveis. Assim, também torna-se possível a superação de alguns desafios como a evolução da tecnologia embarcada, a integração da gerência com ferramentas de mercado, discos rígidos com maior taxa de leitura e escrita, fontes de energia mais eficientes e hardware com menor dissipação de calor.

 

A constante evolução da tecnologia presente nos datacenters contribua continuamente com a consolidação do modelo hiperconvergente, que por sua vez, poderá favorecer o desenvolvimento e aprimoramento da tecnologias atuais aplicadas na computação em nuvem e soluções corporativas.

 

REFERÊNCIAS

 

LOWE, Scott D.; DAVIS, David M.. Hyperconverged Infrastructure Implementation Strategies. Bluffton, Eua: Actualtech Media, 2015.

DAVIS, David M.. Hyperconvergence Fundamentals & the Maxta Advantage. Bluffton, Eua: Actualtech Media, 2015.

FACCIONI FILHO, Mauro. Conceitos e infraestrutura de datacenters. Palhoça: Unisulvirtual, 2016.

MORAES NETO, Moacyr Franco de. Gestão dos ativos do datacenter. Palhoça: Unisulvirtual, 2016.

ASSOCIAÇÃO BRASILEIRA DE NORMAS TÉCNICAS. NBR 14565: Cabeamento estruturado para edifícios comerciais e data centers. São Paulo: Abnt, 2013.

ROSÁRIO, Djan de Almeida do. Disponibilidade e qualidade operacional de datacenters. Palhoça: Unisulvirtual, 2016.

NORVIG, Peter. Teach Yourself Programming in Ten Years. Disponível em: . Acesso em: 21 maio 2017.

POITRAS, Steven. The Nutanix Bible. Disponível em: . Acesso em: 29 maio 2017.

FOROUZAN, Behrouz A.. Comunicação de Dados e Redes de Computadores. 4. ed. São Paulo: McGraw-Hill, 2008.

 

 

Author

Master User

Leave a comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Fale com a Winet