Der Busi­ness Service Monitor von OpenNMS

Mit Version 18 des bekannten IT-Moni­to­ring-Tools OpenNMS ist die Über­wa­chung von Busi­ness Services einge­führt worden - bislang war die Sicht auf die Gerä­te­e­bene und die Services an sich beschränkt. Die Busi­ness Services stellen Dienste wie z.B. einen Webshop oder DNS dar, die aus mehreren, teils verschie­denen Services aufge­baut sind, die auf unter­schied­li­chen Devices betrieben werden können. Auch Infra­struktur-Kompo­nenten können zu einem Busi­ness Service zählen. 
Während die einzelnen Services zuvor schon über­wacht werden konnten, ermög­licht nun der Busi­ness Service Monitor eine Berück­sich­ti­gung und Darstel­lung der Abhän­gig­keiten der Services, so dass es mit diesem einfa­cher ist, die Zusam­men­hänge verschie­dener Ausfälle zu erkennen und die eigent­liche Ursache leichter zu ermit­teln. Probleme wie der Ausfall eines Page Sequence Moni­tors, der das Login in einem Webshop prüft, können durch den Ausfall eines Daten­bank-Services auf einem anderen Server verur­sacht worden sein. Solche Zusam­men­hänge sind häufig nicht offen­sicht­lich und nur bestimmten Mitar­bei­tern bekannt, was die schnelle Behe­bung von Ausfällen erschweren kann. Das Abbilden in Form eines Busi­ness Services inner­halb von OpenNMS kann hier Abhilfe schaffen, da jeder Mitar­beiter mit Zugriff auf das Moni­to­ring so die Abhän­gig­keiten visua­li­sieren kann.
1

Beispiel­kon­fi­gu­ra­tion zum Busi­ness Service Monitor

Die folgende Konfi­gu­ra­tion eines DNS-Services, der aus drei unab­hän­gigen Servern besteht, soll einen kurzen Einblick in die Möglich­keiten des Busi­ness Service Moni­tors bieten. Diese Beispiel­kon­fi­gu­ra­tion entspricht nicht den tatsäch­li­chen Gege­ben­heiten und beinhaltet einige Frei­heiten bezüg­lich der Sinn­haf­tig­keit der Konfi­gu­ra­tion, um das Beispiel plas­ti­scher zu gestalten.
Die Konfi­gu­ra­tion der Busi­ness Services befindet sich auf auf der Admi­nis­tra­ti­ons­seite von OpenNMS. In einem frisch aufge­setzten System ist diese Seite noch recht leer. Das Anlegen eines neuen Busi­ness Service erfolgt über den Button New Busi­ness Service.
2
Der Dialog Busi­ness Service Edit stellt neben der Angabe des Service­na­mens unter anderem eine Auswahl der Reduce Func­tions bereit.
3
Es gibt drei Functions:
1.    Highest Severity
Benutzt zur Alar­mie­rung den höchsten Schwe­re­grad (Seve­rity) aller ausge­fal­lenen Teildienste.
2.    Thres­hold
Benutzt den Schwe­re­grad, dessen Häufig­keit den vorge­ge­benen Schwell­wert über­schreitet und am häufigsten vorkommt. Ein Schwell­wert von 0.3 (30 Prozent) würde bedeuten, dass zwei von sechs Teil­diensten ausfallen müssen, damit der Busi­ness Service ausfällt. Dies kann zur Berück­sich­ti­gung von Redun­danzen einge­setzt werden. Zudem ist auch eine Gewich­tung der einzelnen Teil­dienste möglich, so dass beispiels­weise der Ausfall des primären Service schneller oder sofort zum Ausfall des Busi­ness Service führt, währenden hierfür der gleich­zei­tige Ausfall von mehreren Back­up­ser­vices erfor­der­lich wäre.
3.    Highest Seve­rity Above
Hier wird der höchste Schwe­re­grad über einem vorge­ge­benen Schwe­re­grad verwendet. So können Ausfälle mit dem Schwe­re­grad “Warning” und nied­riger igno­riert werden, während alle höheren Ausfälle mit dem schwersten aufge­tre­tenen Schwe­re­grad verar­beitet werden.
Um den Busi­ness Monitor zu defi­nieren, müssen diesem die Services, aus denen er besteht, zuge­wiesen werden. Diese werden mittels Add Edge aufgenommen.
5
Die Bezeich­nung Edge stammt daher, dass die Service hier nicht als solches aufge­nommen werden, sondern ihre Bezie­hungen unter­ein­ander. Es gibt drei Arten von Edges, die erstellt werden können:
4
1.    Child Service
Hier wird auf ein anderen Busi­ness Service Monitor verwiesen, der bereits erstellt wurde. So können komplexe Busi­ness Services leichter model­liert werden, da man diese aus klei­neren  Busi­ness Services zusam­men­setzen kann.
2.    IP Service
Hiermit werden einzelne Services aufge­nommen. Hierbei werden auch grund­le­gende Abhän­gig­keiten berück­sich­tigt. Wenn beispiels­weise der Service DNS auf dem Inter­face 192.168.0.15 aufge­nommen wird, wird im Busi­ness Monitor nicht nur der Ausfall des DNS-Services, sondern auch der Ausfall des Inter­faces oder des Nodes berück­sich­tigt, was sonst einzeln konfi­gu­riert werden müsste, da OpenNMS diese Ausfälle unter­schied­lich handhabt.
3.    Reduc­tion Key
Dies dient zur Angabe eigener Reduc­tion Keys, um spezi­elle Alarme, die beispiels­weise durch SNMP-Traps oder Thres­hol­ding erzeugt werden, im Busi­ness Service Monitor zu berücksichtigen.
Für jeden Edge gibt es zudem eine Mapping-Funk­tion, mit der ange­geben werden kann, wie der Schwe­re­grad eines Alarms bei der Verar­bei­tung berück­sich­tigt werden soll. Man hat die Wahl zwischen “Iden­tity”, “Increase”, “Decrease”, “SetTo” und “Ignore”. Für das oben­ste­hende Beispiel wird zuerst der Busi­ness Service Monitor DNS1 einge­richtet, da dieser Server den DNS-Service auf zwei Inter­faces anbietet und der Aufbau einer BSM – Hier­ar­chie darge­stellt werden soll. Für den Service DNS1 wird “Reduce Func­tions Thres­hold” mit einer Gewich­tung von 0.55 verwendet, sodass beide DNS-Services ausfallen müssen, bevor der Busi­ness Service ausfällt.
 
Die beiden Teil­dienste wurden als IP Service aufge­nommen und die Mapping–Funktion “Iden­tity” gewählt, da hier der Schwe­re­grad der Alarme für die Verar­bei­tung nicht geän­dert werden soll. Somit ist der erste Busi­ness Service, der in diesem Fall nur die Redun­danz des DNS-Services auf zwei unter­schied­li­chen Inter­faces eines Servers darstellt, voll­ständig definiert.
Jetzt wird der Busi­ness Service Global-DNS defi­niert, der den DNS-Service als ein Zusam­men­wirken des DNS1 – Service und der DNS-Services zweier weiterer Server darstellt. Hierzu wird der entspre­chende Service mit “Reduce Func­tion Thres­hold” und einem Schwel­len­wert von 0.4 defi­niert, sodass der Monitor erst anschlägt, wenn zwei DNS-Server ausfallen.
6
Nach der Defi­ni­tion der Service Moni­tore ist nun auf der Admi­nis­tra­tions-Seite zu sehen, dass der Service DNS1 unter dem Service “Global DNS” einge­ordnet wurde. Eine genauere Abhän­gig­keits­struktur ist hier nicht zu erkennen - diese steht später unter in der “Busi­ness Service”-Ansicht bereit, die inter­es­san­ter­weise als Unter­ka­te­gorie der Topo­logy Map imple­men­tiert wurde. Um die erstellten Busi­ness Moni­tore zu akti­vieren, ist ein Reload des Deamons über den Button auf der Konfi­gu­ra­ti­ons­seite erforderlich.
7

Die “Busi­ness Service”-Ansicht der Topo­logy Map

Nach dem Reload des Deamons kann man auf die Topo­logy Map wech­seln und dort unter “View” die “Busi­ness Service”–Ansicht wählen.
8
Analog zur Topo­logy Map befindet sich immer mindes­tens ein Busi­ness Service im Fokus, von dem aus die Ansicht - je nach einge­stelltem Detail­grad - erzeugt wird. In der folgenden Abbil­dung ist der “Global DNS”-Monitor mit sämt­li­chen Details ausge­wählt. Dort erkennt man deut­lich die hier­ar­chi­sche Struktur sowie die Abhän­gig­keiten der Services voneinander.
9
Ein inter­es­santes Merkmal ist der “nodeDown”-Service des DNS1, der auto­ma­tisch beiden Inter­faces zuge­ordnet wird - ein Kenn­zei­chen für seinen Einfluss auf den Busi­ness Service. Wird ein Service auf der Map markiert, so werden am linken Rand Status­in­for­ma­tionen über den aktu­ellen Zustand angezeigt.
10
Der BSM-Monitor verfügt zudem über einen Simu­la­ti­ons­modus, der über den Menü­punkt Simu­late akti­viert werden kann. Im Simu­la­ti­ons­modus können Services markiert und ein Ausfall durch Setzen eines entspre­chenden Schwe­re­grades simu­liert werden, was die Auswir­kungen eines solchen Ausfalls auf den Busi­ness Service aufzeigt.
11
Markiert man einen ausge­fal­lenen Service und wählt aus dem Kontext­menü Impact Analysis aus, so wird ein neuer Graph erstellt, der den Einfluss des ausge­fal­lenen Services auf die aktu­elle Situa­tion darstellt.
12
Diese Funk­tion kann beim Auslegen der Infra­struktur helfen, da hiermit der Einfluss eines Ausfalls auf den gesamten Busi­ness Service veran­schau­licht werden kann, was bei Entschei­dungen über redun­dante Ausle­gungen einzelner Dienste hilf­reich ist.
13
Um die Auswir­kungen eines „reellen“ Ausfalls zu zeigen, wurde dieser durch das Setzen von Routen herbei­ge­führt. Wie in der folgenden Abbil­dung zu sehen ist, exis­tiert nun auf der Start­seite von OpenNMS eine neue Box, die alle aktu­ellen Busi­ness Services mit Problemen anzeigt.
14
Folgt man dem Link eines ausge­fal­lenen Services, so wird man auf die Darstel­lung desselben geleitet, sodass man die Ursache für dessen Ausfall recht zügig ermit­teln kann.
15
Wie alle anderen Funk­tionen von OpenNMS nutzt auch der Busi­ness Service Monitor Events für die Kommunikation, sodass hierfür auch Benach­rich­ti­gungen einge­richtet werden können.
 
Bei Fragen zur Konfi­gu­ra­tion und Einrich­tung sowie allge­meinem Bera­tungs­be­darf zu OpenNMS stehen wir Ihnen gerne zur Verfü­gung - spre­chen Sie uns einfach an!
 
Autor: Andreas Fuchs

Schreibe einen Kommentar

Cookie Einstellungen
Diese Website verwendet Cookies, um die bestmögliche Funktionalität zu gewährleisten. Mehr lesen

Akzeptiere alle Cookies Speichern