Check_Ganglia_metric

Ganglia Metric Check Plugin voor Nagios
Download nu

Check_Ganglia_metric Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Freely Distributable
  • Naam uitgever:
  • Michael T. Conigliaro
  • Uitgever website:
  • http://conigliaro.org

Check_Ganglia_metric Tags


Check_Ganglia_metric Beschrijving

Ganglia Metric Check Plugin voor Nagios Check_ganglia_metric is een Nagios-plug-in waarmee je meldingen op Ganglia Metrisch kunt triggeren. Cleck_ganglia_metric was zwaar geïnspireerd door Vladimir Vuksan's Check_Ganglia_metric.php, maar het wordt geleverd met een aantal verbeteringen.Installatie # PIP Installatie Check_Ganglia_metric ... Or: # Easy_Install Check_Ganglia_metricGanglia ConfigurationSunness Uw Nagios Server en Ganglia Meta Daemon draaien op dezelfde host, u hoeft waarschijnlijk uw Gmetad.conf te bewerken om afstandsbedieningen van uw Nagios Server toe te staan. Om verbindingen van Nagios-server.Example.com:Trusted_Hosts Nagios-Server toe te staan. .Comto toestaan van verbindingen van alle hosts (waarschijnlijk een beveiligingsrisico): All_Trusted Ontesting op de opdracht LineFirst, laten we kijken of check_ganglia_metric kan communiceren met de Ganglia Meta Daemon: Check_Ganglia_metric.py --Gmetad_Host = Gmetad-Server.Example.com \ - metrisch_host = host.example.com --metric_name = cpu_idlestatus ok, cpu idle = 99,3% | cpu_idle = 99,3% ;;;; het bericht "Status ok" geeft aan dat Che CK_GANGLIA_METRIC werkt. Als je problemen hebt om dit aan het werk te krijgen, probeer dan opnieuw met uitgebreide logging enabled (--verbose) om een beter inzicht te krijgen in wat er aan de hand gaat. Nu laten we proberen een alarmdrempel in te stellen: Check_Ganglia_metric.py --gmetad_host = Gmetad server.example.com \ --metric_host = host.example.com --metric_name = cpu_idle --Kritisch = 99status kritisch, CPU idle = 99,6% | CPU_IDLE = 99,6% ;; 99 ;; We hebben geconstateerd in check_ganglia_metric om een "kritiek te retourneren "Status als de inactieve CPU groter was dan 99. Het bericht" Status Critical "geeft aan dat het werkte. Merk op dat check_ganglia_metric parses varieert en drempels volgens de officiële Nagios Plugin Development-richtlijnen. Om een volledige lijst met opdrachtregelopties te bekijken met korte uitleg, voert u Check_Ganglia_metric met de optie --HELP-optie.nagios configurationfirst uit te voeren, een opdrachtregeling te definiëren {command_name check_ganglia_metric command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ hostaddress $ --metric_name = $ Arg1 $ --Warning = $ Arg2 $ --Critical = $ Arg3 $} Nu kunt u de bovenstaande opdracht in uw servicedefinities gebruiken: definieert service {service_description cpu idle - Ganglia Gebruik wat_template check_command check_ganglia_metric! Cpu_idle! 0: 20! 0: 0 host_name host.example.com} Dit zal goed werken totdat er iets misgaat Check_Ganglia_metric (bijvoorbeeld het cachebestand kan niet worden gelezen / geschreven, de Ganglia Meta Daemon kan niet worden bereikt, enz.). Op dat moment zal elke service die op Check_Ganglia_metric opnieuwt, mislukt, eventueel u met waarschuwingen. We kunnen dit voorkomen door het gebruik van service-afhankelijkheden. Het eerste dat we nodig hebben is een opdrachtinformatie voor het controleren van de leeftijd van een bestand: Definieer commando {command_name check_file_age command_line / ur / lib / nagios / plug-ins / check_file_age -f $ arg1 $ W $ ARG2 $ -C $ ARG3 $} Vervolgens definiëren we een service die de leeftijd van het cachebestand van Check_Ganglia_metric controleert. Merk op dat om echt effectief te zijn, deze service moet worden gecontroleerd op zijn minst als (bij voorkeur meer) vaak dan alle andere controles die afhankelijk zijn van check_ganglia_metric: definieer service {service_description cache voor check_ganglia_metric gebruik every_template check_command check_file_age! / Var / lib / lib Nagios / .check_ganglia_metric.cache! 60! 120 host_name localhost check_Interval 1 max_check_attevemaal 1} en ten slotte hebben we de daadwerkelijke serviceafhankelijkheid opgezet. Merk op dat ik gebruik heb gemaakt_regexp_matching in Nagios, waarmee ik regelmatige uitdrukkingen in mijn richtlijnen kan gebruiken. Door "- Ganglia" aan het einde van elke service te plakken die op check_ganglia_metric vertrouwt, kan ik mezelf veel inspanningen besparen: definiëren servicededepentie {host_name localhost service_description cache voor check_ganglia_metric afhankelijk_host_name. * Afhankelijk_service_description. * \ - Ganglia $ Execution_Failure_Criteria C, P} Nu als er iets misgaat met check_ganglia_metric, wordt slechts één waarschuwing verzonden over het cachebestand en worden alle afhankelijke servicecontroles gepauzeerd totdat u het probleem hebt opgelost dat Check_Ganglia_metric heeft veroorzaakt om te falen. Zodra het probleem is opgelost, moet u het tijdstempel op het cachebestand bijwerken om de "cache voor check_ganglia_metric" -service weer in een OK-toestand te plaatsen (die afhankelijke service kan worden voortgezet): Touch / Var / Lib /nagios/.check_ganglia_metric.cachetips en tricksit is mogelijk om een volledige lijst van beschikbare hosts en metrieken te krijgen door "meer uitgebreide" logging (-VV) in te schakelen. Aangezien de Metric_Host en Metric_Name-opties hier nodig zijn, hebt u hier een klein beetje van een "kip en ei" -probleem, maar dat is OK. Vraag gewoon enkele dummy-gegevens. De plug-in zal aan het einde fouten maken met een "host / metric niet gevonden" -fout, maar niet voordat het zijn cache dumpt: check_ganglia_metric.py --gmetad_host = gmetad-server.example.com \ --metric_host = dummy --metric_name = Dummy -VV-vereisten: · Python · Nagios Beperkingen: · Werkt niet met Python 2.4


Check_Ganglia_metric Gerelateerde software