você está aqui: Home  → Arquivo de Mensagens

A Babá do named

Colaboração: Rubens Queiroz de Almeida

Data de Publicação: 08 de novembro de 2010

Se você é o responsável pelo serviço DNS que responde pelos seus domínios (eu sou), não existe nada pior do que uma falha do servidor. Você some da face da Terra e ninguém mais consegue encontrá-lo, o que não é nem um pouco bom.

Existe um pequeno script em perl, chamado nanny.pl, que faz este monitoramento. Se o serviço named estiver fora do ar por alguma razão, ele o reativa.

Como podemos ver pelo código, o script verifica se o processo named está no ar executando o comando kill -0 tomando como argumento a identificação do processo (PID) sob o qual está rodando o named.

Vejamos como funciona:

  # kill -0 25629
  # echo $?
  0

O comando kill -0 na verdade não faz nada, apenas verifica se o processo existe e se um sinal pode ser enviado a ele. O resultado, em bash, fica na variável $?. Se o processo existe, o código de retorno é 0 e tudo está bem. Se não existir, o código de retorno é 1 e, neste caso, o processo deve ser reiniciado.

  # kill -9 25629

Matei o processo named.

  # kill -0 25629
  -su: kill: (25629) - Processo inexistente
  # echo $?
  1

E como esperávamos, o kill -0 retornou um erro.

Mas não é só isto. É feito também um teste com o comando dig. Se der erro, o processo named é reiniciado.

Na seção Sysadmin tem uma série de artigos ilustrando a instalação, configuração e uso do DNS em um servidor próprio. Boa leitura!

nanny.pl

  #!/usr/bin/perl
  #
  # Copyright (C) 2004  Internet Systems Consortium, Inc. ("ISC")
  # Copyright (C) 2000, 2001  Internet Software Consortium.
  #
  # Permission to use, copy, modify, and distribute this software for any
  # purpose with or without fee is hereby granted, provided that the above
  # copyright notice and this permission notice appear in all copies.
  #
  # THE SOFTWARE IS PROVIDED "AS IS" AND ISC DISCLAIMS ALL WARRANTIES WITH
  # REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF MERCHANTABILITY
  # AND FITNESS.  IN NO EVENT SHALL ISC BE LIABLE FOR ANY SPECIAL, DIRECT,
  # INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM
  # LOSS OF USE, DATA OR PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE
  # OR OTHER TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR
  # PERFORMANCE OF THIS SOFTWARE.
  
  # $Id: nanny.pl,v 1.9 2004/03/05 05:04:27 marka Exp $
  
  # A simple nanny to make sure named stays running.
  
  $pid_file_location = '/var/run/named.pid';
  $nameserver_location = 'localhost';
  $dig_program = 'dig';
  $named_program =  'named';
  
  fork() && exit();
  
  for (;;) {
  	$pid = 0;
  	open(FILE, $pid_file_location) || goto restart;
  	$pid = <FILE>;
  	close(FILE);
  	chomp($pid);
  
  	$res = kill 0, $pid;
  
  	goto restart if ($res == 0);
  
  	$dig_command =
  	       "$dig_program +short . \@$nameserver_location > /dev/null";
  	$return = system($dig_command);
  	goto restart if ($return == 9);
  
  	sleep 30;
  	next;
  
   restart:
  	if ($pid != 0) {
  		kill 15, $pid;
  		sleep 30;
  	}
  	system ($named_program);
  	sleep 120;
  }


 

 

Veja a relação completa dos artigos de Rubens Queiroz de Almeida

Opinião dos Leitores

Leandro Godoy
30 Dez 2010, 11:57
Como ele obteve o PID do processo?
Pois se ele consegue consegue identificar o PID do processo significa que pelo menos ele está no ar.... se está funcionando é outra coisa, mas isto pode ser validade pelo #dig.

Abraços
Osvaldohp
26 Nov 2010, 09:02
Como o Nelson falou tem o monit que sempre usei até mesmo para monitorar outros serviços. Faz o serviço dele direitinho.Recomendo.

OSvaldo H Peixoto
http://osvaldohp.blogspot.com/
Nelson
09 Nov 2010, 16:29
Ah sim, soluções não faltam :-)

Só lembrando que o "service" não está disponível em todas as distribuições. Por exemplo, o Debian Lenny não a possui (enquanto que o Debian Squeeze já possuirá).
Marcelo
09 Nov 2010, 16:01
Nelson,

Outra solucao, nem melhor nem pior, usa o bom e velho bash com crontab.

service named status 2>&1 >> /dev/null || service named restart

Para os leitores, vamos por partes:
service named status 2>&1 checa se o named esta rodando e se nao estiver, o || cuida de rodar a segunda parte, que restarta o servico "educadamente"...

Pode-se ainda adicionar um >> /var/log/restart_log pra logar a saida do restart no arquivo restart_log ou mesmo um | mail -s "Atencao, o named foi restartado!" fulano@dominio pra enviar um e-mail ao admin relatando o ocorrido.
Nelson
08 Nov 2010, 01:40
Tem o monit para monitoração de serviços:
http://mmonit.com/monit/
*Nome:
Email:
Me notifique sobre novos comentários nessa página
Oculte meu email
*Texto:
 
  Para publicar seu comentário, digite o código contido na imagem acima
 


Powered by Scriptsmill Comments Script