Engenharia de Confiabilidade de Sites (SRE): Aprimore tarefas operacionais com observabilidade, automação e gerenciamento de incidentes
Por Marcelo CostaSobre o livro
A Engenharia de Confiabilidade de Sites (Site Reliability Engineering, ou SRE) estabelece conceitos e práticas para que os times aprendam a lidar com eventos inesperados, identificando prioridades e entidades envolvidas, bem como quantificando o impacto no negócio.
SREs ajudam toda a organização com a melhoria de processos através do gerenciamento de incidentes: contribuem com o desenvolvimento, testes, releases e análise da infraestrutura, pois detêm um entendimento profundo de observabilidade e ajudam a mitigar danos ao abraçar o caos da imprevisibilidade.
Neste livro, Marcelo Costa se aprofunda no mundo de SRE e no gerenciamento de incidentes. Você vai aprender a identificar quando um determinado serviço não se comporta como o esperado, a severidade de sua interrupção e como observar seus principais indicadores.
Com este material, você saberá os pontos de atenção para onde olhar na infraestrutura que abriga os sistemas, com foco em Escalabilidade, Disponibilidade e Resiliência, como são observados, aplicar tecnologias de monitoramento como Métricas, Logs, Traces, e frameworks de performance como SLOs (Objetivos de Nível de Serviço), automação de tarefas e Engenharia do Caos.
Baixe esta página em PDF para ler quando quiser, mesmo offline.
📄 Salvar PDFAvaliações dos leitores
Descubra as opiniões de outros leitores, explore avaliações detalhadas e veja se este livro realmente vale a pena para você, com base em experiências reais de quem já leu e compartilhou sua visão sobre a obra.
⭐ Reviews dos leitores




