POC - Proof of Concept

Pet Care

Monitoramento Inteligente de Infraestrutura e Banco de Dados

Avaliação completa do ambiente TOTVS Protheus com identificação de problemas críticos e planejamento de soluções em tempo real.

📅 Período: Março/2026 🖥️ Servidor: SRVDATABASE1-PE 💾 Instância: TFCAR4_PRD

🎯 Resultados da POC

A ferramenta de monitoramento foi o grande diferencial na identificação de problemas críticos em tempo real, auxiliando o cliente em diversas camadas — infraestrutura, banco de dados e aplicação ERP.

🔴
5
Problemas Críticos Identificados
🟡
+30
Alertas de Performance
8
Recomendações Entregues
📊
+700
Relatórios Gerados

🖥️ Análise de Infraestrutura (05/03/2026)

O primeiro relatório identificou problemas críticos na infraestrutura do servidor de banco de dados, com impacto direto na performance do ERP.

🔴 Memória RAM Crítica

92% Utilização Total
7 GB Livre para SO
125 GB RAM Total

Apenas 7 GB livres para o Sistema Operacional. O SO não consegue manter cache adequado, causando paging e degradação de performance.

Recomendação: Upgrade de RAM para 160 GB + Configurar Max Server Memory para 128 GB

🔴 Contenção de I/O

950 Fila I/O Máxima
5.000 Picos de IOPS
350 MB/s Throughput Pico

Profundidade de fila de até 950 operações na partição C (SO), indicando que o disco não acompanha a demanda de I/O.

Recomendação: Separar discos — SO em SSD dedicado, dados SQL em partição separada

⚠️ Rotina LOJA701 — Consumo Excessivo

Usuário Rotina Memória % Uso
rec.ibirapueraLOJA701864,81 MB27%
beatrizLOJA701732,83 MB23%
farmacia001LOJA701489,83 MB18%

A rotina LOJA701 consome mais de 2 GB apenas com 3 usuários simultâneos. Análise urgente necessária.

Recomendação: Análise de código, verificação de queries ineficientes e possível refatoração

✅ SQL Server Saudável

2.051s Page Life Instance
104 GB Max Server Memory

O SQL Server está bem configurado e saudável. Páginas permanecem em cache por 34+ minutos (excelente). O problema real está na infraestrutura, não no banco.

💾 Análise de Banco de Dados (05/03/2026)

Análise integrada de dados de monitoramento diário e horário, identificando problemas de performance e gargalos no banco de dados.

CRÍTICO

Fragmentação de Índices

Índices fragmentados aumentam o tempo de execução de queries e causam mais I/O de disco. Impacto: lentidão nas consultas, aumento de I/O, consumo adicional de CPU.

CRÍTICO

Locks e Deadlocks

Presença de locks e deadlocks indica contenção de recursos. Impacto: falhas de transações, timeout de aplicações, degradação de performance.

CRÍTICO

Fila de Disco (I/O Pendente)

Fila de I/O pendente indica que o disco não consegue acompanhar a demanda. Impacto: lentidão em operações de leitura/escrita, aumento de latência.

IMPORTANTE

Top Queries por CPU e Duração

Queries consumindo CPU excessivamente e de longa duração bloqueando outras transações. Necessidade de análise de planos de execução.

🔬 Análise Aprofundada (11/03/2026)

Relatório de acompanhamento que revelou problemas estruturais críticos e a necessidade de migração para SQL Server Enterprise Edition.

⚠️ Achado Crítico: TEMPDB na Partição C

A TEMPDB está localizada na partição C (Sistema Operacional), causando contenção de I/O que afeta diretamente a performance do SQL Server. O ERP faz muito uso da TEMPDB, e o atraso em tempo de resposta nesse disco afeta todo o banco de dados.

🔴 TEMPDB na Partição C

A TEMPDB é um banco de dados crítico utilizado para operações temporárias, ordenação de dados e tabelas temporárias. Na partição C causa:

  • Contenção de I/O com operações do SO
  • Redução de performance geral
  • Aumento de latência de disco
  • Possível indisponibilidade em picos
Solução: Mover TEMPDB para disco dedicado (500MB/s, 5-7k IOPS)

🔴 Backup na Partição C

Arquivos de backup sendo gerados na partição C, causando contenção durante o backup full:

  • Pico de 360 operações pendentes na fila
  • Throughput máximo de 550 MB/s
  • Pico de 17 mil IOPS às 17:16h
  • Contenção em períodos de backup
Solução: Criar volume dedicado para Backup (mínimo 2 TB, 300 MB/s)

🏢 Necessidade de Migração para Enterprise Edition

O cliente utiliza SQL Server 2019 Standard Edition com um banco de dados de 1 TB e janela de manutenção limitada de 4 a 6 horas. A edição Standard não permite operações de manutenção online.

Standard (Atual)

  • ❌ Rebuild de Índices requer parada
  • ❌ Criação de Índices requer parada
  • ❌ Manutenção com impacto no ERP
  • ❌ Janela insuficiente para 1 TB

Enterprise (Recomendado)

  • ✅ Rebuild de índices sem interrupção
  • ✅ Criação de índices sem impacto
  • ✅ Manutenção contínua sem parada
  • ✅ Planos automatizados semanais

Impacto da Falta de Manutenção: Sem manutenção regular (que deveria ocorrer semanalmente), o banco sofrerá fragmentação crescente de índices, estatísticas desatualizadas, planos de execução subótimos e degradação progressiva de performance.

📋 Plano de Ação Recomendado

Prioridade Ação Timeline Impacto
CRÍTICA Mover TEMPDB para disco dedicado (500MB/s, 5-7k IOPS) 1-2 semanas Muito Alto
CRÍTICA Criar volume dedicado para Backup 1-2 semanas Muito Alto
CRÍTICA Upgrade de RAM: 160 GB + Max Server Memory 128 GB 1-2 semanas Muito Alto
IMPORTANTE Migrar para SQL Server Enterprise Edition Em análise Alto
IMPORTANTE Rebuild de Índices Fragmentados 1-3 dias Alto
IMPORTANTE Investigar e resolver Locks/Deadlocks 3-5 dias Alto
MODERADA Otimizar Top Queries (CPU e Duração) 1-2 semanas Médio
INFORMATIVO Implementar monitoramento contínuo com alertas Imediato Médio

📄 Relatórios Gerados

Os relatórios abaixo foram gerados durante a POC e entregues ao cliente Pet Care. Clique para visualizar cada relatório completo.

🖥️

Relatório de Infraestrutura e Banco de Dados

05/03/2026

Análise consolidada de desempenho e performance do servidor SRVDATABASE1-PE, incluindo métricas de CPU, memória, disco e rotinas críticas do ERP.

📋 Ver Relatório Completo
💾

Análise de Banco de Dados SQL Server

05/03/2026

Parecer técnico e diagnóstico de performance com análise comparativa diário vs. hora em hora, identificando fragmentação, locks e fila de disco.

📋 Ver Relatório Completo
🔬

Análise Aprofundada de Banco de Dados

11/03/2026

Relatório de acompanhamento com identificação da TEMPDB na partição C, necessidade de migração para Enterprise e plano de ação detalhado.

📋 Ver Relatório Completo
📊

Relatório SQL Server — Visão Diária

05/03/2026

Relatório automático gerado diariamente pela ferramenta de monitoramento, com visão consolidada de 24 horas de performance da instância.

📋 Ver Relatório Completo
⏱️

Relatório SQL Server — Hora em Hora

05/03/2026

Relatório automático gerado de hora em hora com granularidade detalhada: conexões ativas, fila de disco, auto growth, latência e top queries.

📋 Ver Relatório Completo

✅ Ações Realizadas

Através dos relatórios gerados e analisados, reuniões com o cliente foram realizadas e diversas mudanças foram implementadas com sucesso.

🔒 Segurança

Padronização dos servidores Protheus no domínio, com criação de usuário de serviço e permissões adequadas para gestão centralizada.

💾 Migração TEMPDB

TEMPDB do SQL Server migrada para disco performático dedicado, eliminando a concorrência com o sistema operacional na partição C.

📊 Performance

Rebuild de índices fragmentados, otimização de queries críticas e ações de manutenção preventiva implementadas no ambiente.

🖥️ Infraestrutura

Ingressar todos os servidores no domínio, criar usuário administrador para serviços e dar permissão full dos discos ao usuário criado.

📧 Evidências de Execução

As ações foram coordenadas entre as equipes TOTVS e Pet Care, com comunicação formal e execução planejada.

📋

Padronização de Servidores no Domínio

Ed Carlos Sousa — 20 de março de 2026

Conforme orientações do time de monitoramento, os seguintes passos foram executados:

  • Ingressar todos os Servidores Protheus no domínio — Time Infraestrutura
  • Criar usuário com permissão de administrador para execução dos serviços — Time Infraestrutura
  • Especificar usuário criado em todos os serviços Protheus para inicialização — Time Protheus
  • Dar permissão full dos discos para o usuário de domínio criado — Time Infraestrutura

Manutenção TempDB MSSQL Concluída

Ricardo Vogt (TIS TOTVS) — 12 de abril de 2026

O ajuste de apontamento do TempDB do Microsoft SQL Server em produção foi finalizado com sucesso, com a alteração para a nova unidade de disco conforme planejado. Após a conclusão, todos os serviços do Protheus foram devidamente inicializados, e o ambiente encontra-se disponível para a operação da Pet Care.

🏆 Conclusão da POC

A ferramenta de monitoramento provou ser o grande diferencial

Em apenas 6 dias de monitoramento (05/03 a 11/03), foi possível identificar problemas críticos que impactavam diretamente a operação do cliente, gerar diagnósticos precisos e entregar planos de ação fundamentados em dados reais.

🔍

Visibilidade Total

Monitoramento em tempo real de infraestrutura, banco de dados e aplicação ERP em uma única plataforma.

Diagnóstico Rápido

Problemas que levariam semanas para identificar manualmente foram detectados em horas pela ferramenta.

📈

Decisões Baseadas em Dados

Recomendações técnicas fundamentadas em métricas reais, eliminando achismos e priorizando ações de maior impacto.

⭐ Feedback do Cliente

"
A ferramenta é muito boa, acima das expectativas.

Conseguimos saber tudo o que está ocorrendo no ambiente tanto físico como lógico.

Ainda não consegui analisar a ferramenta por completo para sugerir melhorias. Mas ainda irei fazer.

A TOTVS está de parabéns!

Aron Kerbauy

Responsável pelo Sistema TI — Pet Care

24 de março de 2026