Usamos Nagios para monitorear bastantes (~ 130) servidores. Monitoreamos CPU, disco, RAM y algunas otras cosas en cada servidor. Siempre he usado SSH para ejecutar los comandos remotos, simplemente porque requiere poca o ninguna configuración adicional en el servidor remoto, simplemente instale nagios-plugins, cree el usuario nagios y agregue la clave SSH, todo lo cual he automatizado Un script de shell. Nunca he considerado las implicaciones de rendimiento del uso de SSH sobre NRPE.
No estoy demasiado preocupado por el impacto de la carga en el servidor Nagios (probablemente es demasiado rápido para lo que hace, nunca ha superado el 10% de CPU), pero ejecutamos cada verificación remota cada 30 segundos y cada servidor tiene 5 verificaciones diferentes realizado. Supongo que SSH requiere más recursos para cada cheque, pero ¿hay una gran diferencia? (Es suficiente diferencia para garantizar el cambio a NRPE).
Si es de alguna ayuda, monitoreamos una combinación de servidores físicos (normalmente con 8, 12 o 16 núcleos físicos) e instancias medianas / grandes de Amazon EC2.