Por trás do Pandora — O cluster que não dorme

O Cluster Pandora nasceu dentro da Unifique Cloud com um propósito ousado: garantir que a gestão e os serviços críticos do ambiente permaneçam operacionais mesmo diante de falhas severas de storage, rede ou virtualização.

Mais do que um cluster de gerenciamento, o Pandora é um núcleo autônomo e distribuído de controle e orquestração, construído para operar de forma independente e manter a Unifique Cloud sob controle — mesmo quando o resto do ambiente para.


O Desafio

Em uma infraestrutura moderna, quase tudo depende da camada de gerenciamento.
Mas o time da Unifique Cloud percebeu um ponto cego:

“E se o próprio ambiente de controle cair junto com o restante da infraestrutura?”

A resposta foi criar um cluster isolado, resiliente e autossustentável, espalhado por locais físicos diferentes da infraestrutura principal, garantindo continuidade operacional e independência total.
Assim nasceu o Projeto Pandora — o cluster que não dorme.


A Arquitetura

O Pandora foi projetado sobre processadores AMD EPYC, que entregam alta densidade de núcleos, performance térmica eficiente e confiabilidade sob carga constante.
Seu armazenamento é 100% baseado em discos NVMe, garantindo latência ultrabaixa e throughput máximo, mesmo em cenários de operações simultâneas de backup, replicação e orquestração.

Cada host está conectado a todos os Top of Rack (ToR) do datacenter, com uplinks redundantes e um canal WAN exclusivo, permitindo acesso remoto e gestão plena mesmo em situações de isolamento da rede interna.
Além disso, o cluster é geograficamente distribuído, aumentando ainda mais sua tolerância a falhas físicas e elétricas.

O armazenamento roda sobre VMware vSAN configurado em RAID1, assegurando espelhamento de dados entre hosts.
E, indo além da replicação, os serviços foram intencionalmente distribuídos entre o vSAN e storages dedicadas — exemplo: quatro controladores de domínio (AD), sendo dois no vSAN e dois em storage independente.
Mesmo em uma falha total de um dos sistemas de armazenamento, os serviços de autenticação e diretório seguem em operação.


Serviços Críticos Hospedados

O Pandora é o ponto de sustentação da Unifique Cloud, abrigando não só a camada de gerenciamento, mas também serviços de produção utilizados por clientes.

Dentro dele rodam:

  • vCenter, VMware Cloud e NSX Manager – o coração da virtualização e SDN.
  • Veeam Backup & Replication – Backup Server incluindo o serviço de Cloud Connect entregue aos clientes Unifique.
  • Active Directory e PAM – autenticação, segurança e controle de privilégios.
  • Kubernetes Cluster e Load Balancer – orquestração e entrega de microsserviços internos.
  • Soluções de monitoramento da Cloud – visibilidade completa da operação.
  • Portais e dashboards das nuvens – interface de gestão e provisionamento.
  • Sistemas de inventário, como o NextBox – controle de ativos e topologia.

Com esse desenho, o Pandora garante que, mesmo durante falhas severas em storages, leafs, spines ou clusters VMware, a gestão, o monitoramento e os serviços críticos continuem operando de forma independente.

O Pandora é um ambiente construído para não ser usado — como um seguro de carro: você espera nunca precisar, mas dorme tranquilo sabendo que está protegido.

Ele existe para garantir que, em um cenário de contingência total, a Unifique nunca fique no escuro.
Mesmo que o ambiente principal sofra interrupções graves, o Pandora mantém viva a inteligência e o comando da operação.


Resiliência Total

O projeto foi desenhado para resistir a falhas múltiplas e simultâneas:

  • Falha de storage? Aplicações redundantes continuam disponíveis.
  • Perda de leaf ou spine? Conectividade mantida pelos ToRs ativos.
  • Clusters VMware fora do ar? O Pandora segue orquestrando o ambiente e coordenando a recuperação.

Os backups seguem a política 3-2-1, armazenados em storage dedicada e replicados para appliance S3 imutável, protegendo contra falhas físicas, humanas e lógicas.


Resultado

O Cluster Pandora consolidou-se como o núcleo de resiliência e governança distribuída da Unifique Cloud.
Mais do que um projeto técnico, ele representa uma filosofia de engenharia:

Alta disponibilidade não é um recurso. É uma mentalidade.

E quando o inesperado acontece, o Pandora está lá — garantindo que a Unifique siga no comando.

Continue Reading

Dell EMC Networking VEP1485 – Edge Computing

Olá pessoal, todos bem?

Consegui um Hardware da DELL para laboratório chamado VEP “Virtual Edge Platform” para rodar em meu HomeLab. E o resultado dos testes foi além do esperado. Gostaria de elencar abaixo alguns dos pontos que me fez adorar este Hardware, principalmente para fazer a função de Edge mas também como um excelente equipamento para ter em casa e executar laboratórios.

  • Baixo consumo de Energia (Monitorei a alimentação deste Hardware e o seu consumo é de 35 a 45W .
  • Tamanho reduzido, diferente de um servidor de Rack este Hardware tem o tamanho de um ThinClient.
  • Recurso de Hardaware bem interessante (16 Cores, 64GB RAM , 2 TB SSD, 6 Interfaces 1GB e 2 Interfaces 10GB SFP+)

Hoje em dia falamos muito da Jornada de migrar nossas aplicações para Nuvem, porém algumas aplicações ainda são sensíveis com questão de latência, podemos imaginar que boa parte das aplicações estejam rodando na Nuvem.

Vamos imaginar o seguinte cenário onde você precisa manter localmente serviços como um Controlador de Domínio ou algum servidor de aplicação que depende de latência baixa e com a adoção deste Hardware você pode deixar suas máquinas virtuais ou até mesmo containers rodando neste equipamento com uma réplica para Nuvem configurada.

Com a replica das máquinas deste equipamento para Nuvem no caso de um sinistro você até pode sofrer com latência, porém garante a continuidade da sua operação até realizar o FailBack.

O caso acima é um exemplo simples que pode ser implementando de várias formas, replicando com VMware fazendo uma nuvem estendida. Também é possível utilizar o VEEAM caso o Datacenter trabalhe com CloudConnect da VEEAM , você pode replicar essa máquina para dentro do seu tennant no VMware Cloud Director.

Abaixo gosto de mostrar um exemplo real e simples com VEEM , aonde o print é exatamente um ESXI rodando no VEP com várias maquinas virtuais como de VEEAM, PFsense, AD, DNS e WTS. Sendo muito parecido com senário de muitos clientes.

Foi criado no VEEAM uma réplica utilizando o CloudConnect e conforme a imagem abaixo minha VM de WTS já está replicada e aguardando ser iniciada na Cloud caso aconteça algum sinistro na borda. Isso é possível com o DR Planning  no Veeam.

Claro existe várias questões de remap de rede e roteamentos que precisam ser ajustadas para rodar na Nuvem, mas este não é o foco deste tópico.

Vamos Falar um puco sobre este equipamento?

Continue Reading