Panorama completo da falha no servidor principal da Prefeitura e o restabelecimento dos sistemas

Na última semana, enfrentamos uma situação bastante crítica no ambiente de TI da Prefeitura. Durante uma atualização do sistema operacional do servidor principal, tivemos uma queda de energia no prédio administrativo, o que acabou interrompendo o processo no pior momento possível.

Esse tipo de atualização é sempre delicado e exige que o sistema fique estável do início ao fim. Mesmo com nobreaks que seguram o servidor por até 40 minutos, dessa vez o tempo não foi suficiente para concluir o procedimento. A atualização travou numa etapa sensível, justamente na parte que envolvia a estrutura do domínio do Active Directory, que é responsável pela autenticação de usuários e pela organização de permissões em rede.

Além disso, o servidor já estava em condição frágil. Ele operava com RAID 1, mas apenas um dos HDs estava funcionando. O outro queimou no ano passado, durante o restabelecimento de energia após o desastre climático. Desde então, estávamos rodando com um único disco, e essa limitação pesou na hora de decidir o que fazer.

Diante desse cenário, optei por não tentar restaurar o ambiente antigo, pois além do risco de novas falhas, já havia erros recorrentes de autenticação e rede. A alternativa mais segura e eficiente foi reconstruir tudo em um novo sistema, aproveitando para atualizar o Windows Server para a versão 2025 e reorganizar o domínio com uma estrutura mais limpa e estável.

Alguns sistemas voltaram rapidamente. O Multi24h e o e-SUS/PEC, por exemplo, rodam em containers, o que facilita muito a portabilidade entre servidores. Já o SINAN, SISNET, AIH e SCNES também foram restaurados em seguida, assim como o sistema de arquivos em rede.

O Nextcloud, no entanto, foi o sistema mais afetado. Como ele depende de autenticação direta com o servidor via LDAP, e como todo o AD DS precisou ser recriado manualmente, a situação foi bem mais complexa. Mesmo que os usuários tenham sido recriados com os mesmos nomes de login e senha, internamente cada conta recebeu uma nova UUID. Por questões de segurança da informação, o Nextcloud não permite que um usuário, mesmo com as mesmas credenciais, acesse dados que estejam vinculados a uma UUID diferente.

Por isso, para quem usa o cliente de sincronização do Nextcloud, será necessário fazer uma nova configuração. Ao ligar o computador, o sistema pode pedir o login novamente, e será preciso criar uma nova pasta para sincronização. Isso é normal e faz parte da migração segura dos dados. Para acessar os arquivos de forma imediata, também é possível usar a rede interna, digitando \\192.168.0.200 na barra de endereços de qualquer pasta.

Durante esse processo, é possível que ainda ocorram falhas pontuais de acesso, login ou permissões em pastas específicas. Pode ser que eu tenha esquecido de restaurar algum usuário ou liberar alguma permissão, mas isso é fácil de resolver.

Conforme os dias passam, vou ajustando tudo com base nas demandas de cada setor. É só me chamar que a gente resolve.

Também aproveito para reforçar uma dúvida comum que surgiu: se a Prefeitura tem geradores, por que eles não foram utilizados? Embora os geradores não tenha ligação direta com minhas atribuições e funções, sei que recebemos geradores no ano passado, mas eles ainda não estão ligados à rede elétrica do prédio. Isso porque não basta conectar o equipamento e ligar, é necessário um projeto de adequação elétrica completo, seguindo as normas da ABNT, para evitar danos nos equipamentos, principalmente no CPD, onde ficam os servidores.

No fim do ano passado, elaborei um Estudo Técnico Preliminar para a instalação de um gerador que funcionasse de forma autônoma, ligando e desligando sozinho conforme a demanda. Na época, o custo estimado girava em torno de 45 mil reais para o gerador e cerca de 35 mil reais para adequação elétrica, incluindo projeto técnico, nova fiação e sistema de proteção. O que, em decorrência do custo, foi deixado para outro momento.

E, falando dos geradores que foram recebidos, como eles são pequenos e não suportam manter o prédio todo ligado, poderia-se estudar a adequação apenas do CPD, dessa forma, problemas com este seriam mitigados.

Apesar de que os sistemas principais foram rapidamente reestabelecidos, eu perdi muitas horas de sono nesses dois dias e tive muito trabalho, além dos de minha responsabilidade, dito disso, fica evidente que a infraestrutura de energia precisa de atenção especial. Este episódio mostrou, mais uma vez, o quanto o setor de TI é estratégico e impacta diretamente todos os outros setores da administração.

O novo ambiente agora está estável e funcional. O domínio foi refeito, os serviços de rede e DNS estão em pleno funcionamento e todos os backups podem ser restaurados rapidamente, se necessário, apesar de estamos operando com apenas um disco na RAID, mas como toda a estrutura está limpa e controlada, a reposição futura de um novo disco será tranquila e segura.

Sigo à disposição para qualquer dúvida ou problema que apareça.

Agradeço pela paciência de todos durante esse período e reforço que estou fazendo o possível para que tudo volte ao normal com mais estabilidade do que antes.