4 min de leitura · Guia técnico
Sinais de Alerta e Erros Comuns
Antes de otimizar, reconheça os sintomas de um servidor com desempenho comprometido:
- CPU em 100% de utilização por períodos prolongados
- Memória RAM quase totalmente consumida (swap ativo constantemente)
- Disco com I/O muito alto (lentidão ao acessar arquivos)
- Aplicações respondendo lentamente ou travando
- Conexões de rede instáveis ou timeouts frequentes
- Mensagens de erro:
Out of memory,No space left on device
Diagnóstico Passo a Passo
Passo 1: Verificar Uso de CPU e Memória
Execute o comando abaixo para visualizar processos em tempo real:
htop
Ou, se htop não estiver instalado:
top
O que procurar: Processos com %CPU ou %MEM acima de 50%. Anote o PID (ID do processo) e o nome.
Passo 2: Identificar Gargalos de Disco
Verifique operações de I/O em disco:
iotop -o
Ou, para uma visão geral rápida:
iostat -x 1 5
O que procurar: Valores altos em %util (utilização) ou await (tempo de espera).
Passo 3: Analisar Espaço em Disco
Verifique se o disco está cheio:
df -h
Identifique diretórios que consomem muito espaço:
du -sh /* | sort -rh | head -10
O que procurar: Partições com mais de 85% de utilização. Procure por arquivos temporários em /tmp, /var/log ou /var/cache.
Passo 4: Verificar Configuração de Swap
Veja se o sistema está usando swap excessivamente:
free -h
Verifique o valor de swappiness:
cat /proc/sys/vm/swappiness
O que procurar: Se Swap está sendo usado intensamente (mais de 20% do total), o servidor pode estar com falta de RAM.
Passo 5: Listar Serviços Ativos Desnecessários
Veja quais serviços estão rodando:
systemctl list-units --type=service --state=running
O que procurar: Serviços que você não reconhece ou que não são necessários para sua aplicação.
Causas Comuns de Degradação
- Processos zumbis ou travados: Aplicações que não terminam corretamente e consomem recursos
- Logs crescendo sem limite: Arquivos em
/var/logpreenchendo o disco - Cache não limpo: Arquivos temporários acumulados em
/tmpou/var/cache - Serviços desnecessários ativos: Daemons que não são usados consumindo CPU e memória
- Configuração de swap inadequada: Sistema forçado a usar disco em vez de RAM
- Limite de arquivos abertos atingido: Aplicações não conseguem abrir novos arquivos ou conexões
Soluções Rápidas por Tipo de Gargalo
Se CPU está alta:
- Identifique o processo com
htop - Verifique se é legítimo (aplicação esperada)
- Se for desnecessário, encerre com:
kill -9 PID - Se for aplicação crítica, verifique logs:
journalctl -u nome_servico -n 50
Se Memória está alta:
- Execute
free -hpara confirmar - Identifique o processo consumidor com
htop - Se swap está sendo usado, reduza swappiness:
sudo sysctl vm.swappiness=10 - Reinicie a aplicação problemática ou o servidor se necessário
Se Disco está cheio:
- Execute
df -hpara confirmar qual partição está cheia - Limpe logs antigos:
sudo journalctl --vacuum=30d - Limpe arquivos temporários:
sudo rm -rf /tmp/* /var/tmp/* - Verifique
/var/cache:sudo du -sh /var/cache/* - Se necessário, comprima ou delete logs:
sudo gzip /var/log/*.log
Se Rede está lenta:
- Verifique conectividade:
ping 8.8.8.8 - Teste latência:
mtr google.com - Verifique configuração de interface:
ethtool eth0 - Confirme se há limite de banda configurado
Checklist Final de Diagnóstico
- ☐ Executei
htope identifiquei processos com alto consumo de CPU/memória - ☐ Verifiquei espaço em disco com
df -h(nenhuma partição acima de 85%) - ☐ Confirmei uso de swap com
free -h(abaixo de 20% do total) - ☐ Listei serviços ativos e desativei os desnecessários
- ☐ Limpei arquivos temporários e logs antigos
- ☐ Anotei o PID e nome de qualquer processo anômalo para investigação posterior
Próximos Passos
Após resolver o gargalo imediato:
- Configure monitoramento contínuo com ferramentas como
PrometheuseGrafana - Implemente alertas para CPU, memória e disco acima de limites críticos
- Revise o artigo de otimização geral para ajustes de longo prazo
- Documente a causa raiz para evitar recorrência