Track – recurso del #cluster

Pacemaker_logoA veces los recursos de pacemaker fallan al darle START o STOP y no se sabe por que y si el recurso no levanta el árbol de recursos falla y si eso falla entonces el aplicativo no levanta y si el aplicativo no levanta …. TENEMOS UN PROBLEMA,  por acá te explico como rastrear el POR QUE no levanta un recurso.

Pasamos el recurso a NO-MANEJABLE:
# crm recurso unmanage
Configuramos el ambiente del sistema:
# export OCF_ROOT=/usr/lib/ocf
# export OCF_RESKEY_=
Corre el proceso:
# /usr/lib/ocf/resource.d/heartbeat/ start ; echo $?
Si eso no te ayudo, utiliza el BASH/DASH xtrace para ver que es lo que esta ocurriendo, paramos el recurso solo por si las moscas:
# /usr/lib/ocf/resource.d/heartbeat/ stop; echo $?
Probamos de nuevo
# sh -x /usr/lib/ocf/resource.d/heartbeat/ start ; echo $?
Veamos un ejemplo de esto con una interfaz virtual de cluster que no queria levantar…
# sh -x /usr/lib/ocf/resource.d/heartbeat/IPaddr2 start ; echo $?
La salida es muy grande para publicarla pero al final de cuentas muestra esto:
+ /usr/lib64/heartbeat/send_arp -i 200 -r 5 -p /var/run/resource-agents/send_arp-172.17.18.55 eth0 172.17.18.55 auto not_used not_used
Lo que quiere decir que no se esta tomando el valor “auto” de la interfaz de red, para no darnos dolores de cabeza simplemente puedes aplicar:

  • Desmanejar el recurso
  • Detener el recurso
  • Mover el recurso
  • Activar el recurso
  • Manejar el recurso
  • Salir de modo mantenimiento

Y eso es todo. Suerte nos vemos.


Leave a Comment