Überwachung von Servern und Exchange

Zur einen stabilen Betrieb gehört auch eine Überwachung der Server und Systeme. Die zu prüfenden Dinge, um Fehler oder Einbrüche zu erkennen sind vielfältig:

Viele Firmen nutzen schon Programme wie MOM2005, WhatsUp, HostMon, Nagios oder Systeme der Hersteller zur Überwachung der Hardware wie Dell OpenManage, Fujitsu-Siemens ServerView, HP Insight Management etc. Dies ist besonders beim Einsatz von RAID-Systemen notwendig, da hier ein Ausfall einer Festplatte sonst kaum bemerkt wird.

Was soll ich den überwachen ?

Aber das ist nach meiner Meinung nach nicht genug. Zusätzliche Überwachungen sind sinnvoll, um Probleme von Servern rechtzeitig zu erkennen, die nicht von der Hardware abhängen. Dazu zählen:

Auch Microsoft Exchange ist daraus aufgelegt, lange problemlos zu funktionieren, solange die Randbedingungen eingehalten werden und die Basis funktioniert. Aber dies behaupten Autohäuser von ihren Fahrzeugen genauso, wie wir von unseren Zähnen. Und trotzdem bringen wir unseren fahrbaren Untersatz regelmäßig in die Inspektion und wir selbst mindestens einmal im Jahr beim Zahnarzt auf den Liegestuhl zur Kontrolle.

Wie kann ich denn überwachen ?

Genauso sollten Sie es sich zur Regel machen, ihren Exchange Server regelmäßig zu überprüfen und zu überwachen. Wenn Sie sich dazu entschieden haben, ihren Exchange Server zu überwachen, dann sollten Sie sich überlegen, Wie sie dies am besten machen. Mit Windows haben Sie hier vier verschiedene Wege, die sich umsetzen können:

Genau genommen sollte diese Arbeit eine Software für Sie übernehmen. Weiter unten bei den Link sind einige Produkte aufgeführt.

Exchange 2000/2003 Selfmonitoring

Microsoft Exchange hat selbst die Funktion, sich und die Connectoren zu überwachen. Im Exchange System Manager finden Sie unter dem Punkt "Extras" einen Bereich Überwachung und Monitoring. Hier sehen Sie auf einen Blick den Status der gesamten Server und Connectoren in ihrer Organisation. Hier können Sie auch Alarmfunktionen einrichten, wenn bestimmte Server kritisch sind.

Wenn Sie auf den Eigenschaften des Server unten die Checkbox "Gesamte Überwachung für diesen Server deaktivieren" anschalten, dann wird der Server in den "Wartungsmodus" versetzt. Damit wird die Überwachung temporär deaktiviert und Sie können den Server umkonfigurieren. ohne dass Exchange entsprechende Alarme generiert.

Erweiterte Funktionen

Neben den Basisfunktionen, die teilweise mit dem Betriebssystem selbst oder Programmen von Exchange ausgeführt werden können, sind viele weitere Funktionen denkbar, z.B.:

Soweit sollen meine Anregungen zur Überwachung und Kontrolle eines Exchange Servers auf dieser Webseite reichen. Die Umsetzung der einzelnen Prüfpunkte kann manuell oder besser noch automatisch erfolgen. Allerdings gibt es dazu nicht nur einen gangbaren Weg, sondern viele Möglichkeiten, um die gewünschten Kontrollen durchzuführen. Zudem sind individuell für jeden Server und jede Umgebung die Grenzwerte und Alarmschwellen zu ermitteln. Getreu dem Motto alle Elektriker "wer misst, misst meistens Mist" ist hier ein gesundes Verhältnis zwischen Interfallen, Datenmenge und Alarmierung zu finden. Hunderte von Alarmen täglich werden genauso schnell ignoriert, wie mangelhafte Datenmengen, die im Falle eines Falles keine Auswertung mehr zulassen.

Ich kann Ihnen aber hier anbieten, im Rahmen eines Projektauftrags mit ihnen Zusammen eine Lösung zu erarbeiten.

Welche Produkt ist das Beste ?

Es gibt wahrlich sehr viele Tools zur Überwachung von Servern und Netzwerken auf dem Markt und die Bandbreite reicht von kostenfreien FreeWare Tools wie (MRTG Monitoring und Nagios (http://www.nagios.org bzw. http://www.icinga.org/ ) über Produkte für den kleinen Geldbeutel wie HostMon und ähnlich bis zu kommerziellen Produkten wie MOM2005 und ähnlichen.

Für welches Produkt Sie sich entscheiden hängt von ihren Anforderungen ab. Meist werden Sie zwei oder drei Produkte oder Tools kombinieren, denn jedes der Produkte hat Stärken und Schwächen. So kann MOM2005 sehr gut Windows Server überwachen, aber für die Überwachung von WAN-Verbindungen, Switches und UNIX-Systeme eignet es sich ohne zusätzliche  Produkte weniger gut. Sehr viele Hersteller entwickeln aber entsprechende Management Packs um eben dies zu reduzieren. Das gleiche Bild zeigt sich aber auch bei anderen Produkten, die oft erst durch Zusatzmodule zur Hochform auflaufen. Daher sind fast alle Produkte auch so gebaut, dass Sie ihre Meldungen an ein anderes System weitergeben können oder ihrerseits Meldungen von anderen Systemen mit einbeziehen können.

Eine etwas leichtere Entscheidung können Sie aber beim Produkt hinsichtlich des Betriebssystems treffen: Die Installation, Einbindung und Konfiguration das A. und O. einer Überwachungslösung. Alles Überwachen können Sie nicht, weil sich dann das System selbst beschäftigt und der überwachende Server zu viele Daten sammelt. Aber ein Problem nicht zu erkennen, weil zu wenig überwacht wird, ist ebenso fatal. Das Know-how, was nun wie zu überwachen ist, steckt aber nicht in dem eigentlichen Überwachungsprodukt, sondern ist Ergebnis ihrer Konfiguration oder Voreinstellungen durch produktspezifische Knowledge Packs. Diese gibt es z.B. für die verschiedensten Produkte (BMC, HPOpenView, MOM etc.) von dem Hersteller der Management Software oder dem Produkthersteller. Sofern die Management Lösung den Export eigener erlaubt, gibt es auf auch eine Community von Personen die gegenseitig ihre meist kostenfrei Pakete zur Verfügung stellen.

Aber zuletzt benötigen Sie natürlich das Know-how den Überwachungsserver selbst zu betreiben. Wer hier eher in der Windows Welt zuhause ist, wird eine Überwachungslösung basierend auf Windows vorziehen. Eine generell bessere oder schlechtere Eignung eines speziellen Betriebssystems kann ich nicht ausmachen. Es gibt aber sicher einige Produkte, die nicht für beide Plattformen zur Verfügung stehen. So z.B. Nagios (Unix) und MOM (Windows)

Bewertungskriterien

Es gibt sehr viele unterschiedliche Programme zur Überwachung von Systemen und Servern. Viele Hersteller liefern teilweise schon Produkte für ihre eigene Hardwareüberwachung mit. Für die Überwachung von Windows und besonders Exchange ist aber mehr gefragt als nur ab und an ein PING abzusetzen oder einen numerischen Wert auszulesen. Hier ein paar Kriterien zur Bewertung von Produkten.

Eventlog

Das Windows Eventlog enthält normalerweise alle kritischen Meldungen eines Server. Wird das Diagnoseprotokoll aktiviert, dann stehen sogar noch sehr viel mehr Meldungen im Eventlog, die verarbeitet werden sollten. Siehe auch Überwachung von Exchange - Eventlog

Funktion MOM2005 Produkt2
Eventlog Überwachen
Kann das Programm einfach Eventlogs mehrerer Server überwachen und zentral konsolidieren (Datenbank)
Ja  
Meldung von ausbleibenden Eventlogs ? Ja  
Konsolidierung mehrerer gleicher Meldungen ? Ja  
Gibt es ein Exchange Template zur Überwachung der sinnvollen Events ?
z.B. Alarm wenn 9551 Fehler (Siehe auch 9551-Melder, -1018 Fehler etc
Exchange Management Pack  
     

Performance Counter

Viele wichtige Aussagen zur Leistung und Verfügbarkeit lassen sich bei Windows und Exchange aus den Performance Countern (Siehe Exchange Überwachungspraxis - Perfmon) auslesen.

Funktion MOM2005 Produkt2
Performance Counter
Kann das Produkt überhaupt einfach Performance Counter auslesen und bei Überschreitung von Grenzwerten alarmieren ?
Ja  
Historische Aufzeichnung
Können die Werte auch längere Zeit vorgehalten werden, so dass auch nach einigen Stunden die Werte von damals ausgewertet werden können
Ja  
Konsolidierung
d.h. Ältere Werte zur Reduzierung der Datenbankgröße zusammenfassen
Ja Vollversion  
Vorgefertigte Überwachungen
Gibt es ein Exchange Template zur Überwachung der sinnvollen Counter ?
Exchange Management Pack  

Funktionskontrolle

Was Eventlog und Perfmon nicht leisten sind aktive Prüfungen von Funktionen. Bei Exchange könnte das  z.B.: eine Anmeldung per POP3 sein, eine Testmail etc.

Funktion MOM2005 Produkt2
Funktionsskripte Ja
Management Packs
 
vorgefertigte Funktionsskripte Ja
Management Packs
 
Exchange: TestMails, MAPI-Logon, POP3-Logon, Antwortzeiten etc. (Siehe MOM2005) Ja
Exchange Management Pack
 

Nett ist auch immer die Funktion, wenn die Ergebnisse anderer Programme (MBSA, ExPBA etc.) ebenfalls einen Status im Monitoring System einstellen können.

Integration

Funktion MOM2005 Produkt2
Einbinden anderer Überwachungstools
Meist ist nicht nur ein sondern es sind mehrere spezialisierte Programme im Einsatz. Können deren Meldungen alle in eine Konsole zusammengefasst werden ?
Ja, über Management Packs, z.B. DELL, FSC  
SNMP
Kann das System Statusinformationen und Werte  über SNMP auslesen und übernehmen ? Im Detail ist dann noch zu klären, ob Werte auch gespeichert und als Grafik aufbereitet werden können.
über WMI oder VBS  
SNMP Trap
Kann das System Meldungen in Form von SNMPTraps entgegen nehmen
   
Syslog
Kann das System SYSLOG-Meldungen entgegen nehmen ?
   
Agentless und Agentgesteuert ? Ja  
Betriebssysteme Windows, Unix, andere
Sehr viele Netzwerk sind zwar mit Windows Servern bestückt, aber eine Infrastruktur besteht aus weit mehr Systemen, z.B.: Bandlaufwerke, Switches, Router, Hostsysteme, Drucker etc. Können diese ebenfalls überwacht werden und wenn ja, wie gut ?
Bedingt, Drittprodukte  
Redundanz, Cluster
Könne zwei Systeme parallel die Server überwachen ?
Vollversion  
Kaskadierung
Kann eine Managementstation ihre Fehler z.B. an einen Dienstleister melden ?
Vollversion  
Berechtigung
Erlaubt das System die Vergabe von Berechtigungen und administrativen Gruppen, d.h. wer das System konfigurieren darf (Administrator) und wer dann das System bedienen darf (Operatoren)
Ja
Administrator
Operatorengruppen
 

Reporting

Wenn das Management System schon Counter aufzeichnet, dann könnte es auch für die Erstellung Berichten heran gezogen werden. Was auf der einen Seite z.B. als Überwachung der Postfachgröße dient kann auf der anderen Seite natürlich ebenso gut als Report der Postfachgrößen genutzt werden. Auch Langzeittrends (Wie schnell wachsen die Postfächer und bestimmte öffentliche Ordner etc.) sind sehr hilfreich.

Funktion MOM2005 Produkt2
Server: Freie Plattenkapazität Ja  
Exchange Mailboxgröße und Datenbankgröße Ja  
Verfügbarkeit und Antwortzeiten Ja  

Status und Tracking

Funktion MOM2005 Produkt2
Alarm selbstlöschend
d.h. kann das System einen Status wieder auf grün setzen, wenn der Fehler alleine behoben wurde (z.B.: angezeigt durch einen anderen Event
Ja  
"Management View"
Ansicht für die IT-Leiter und höher, um schnell einen Überblick zu erhalten
Ja
z.B. als WebSeite im Intranet einzubinden
 

Zur Bewertung sollten Sie nicht nur die Funktionalität als solches gewichten, sondern auch der Zeitbedarf für die Einrichtung. Gerade beim Thema Eventlog haben Sie beim Einsatz von MOM in einer Microsoft Umgebung natürlich durch die Management Packs einen riesigen Vorsprung, den Sie mit anderen Produkten erst mühsam selbst erarbeiten müssten. Allerdings gibt es auch für andere Produkte (z.B. HP OpenView etc.) regelrechte Communities, in denen entsprechende Einstellungen ausgetauscht werden können. Daher ist es wichtig, dass die individuellen Einstellungen einfach exportiert und importiert werden können.

Weitere Links

Es gibt sicher noch mehr Produkte und Lösungen. Sie sollten sich auf jeden Fall mehrere Produkte ansehen um die Unterschiede zu erkennen und ihre Anforderungen zu definieren. Meist werden Sie sogar eine Sammlung verschiedener kleiner Programme einsetzen als vielleicht ein großes Paket, welches Sie dann nicht mehr handhaben können.

Keywords:Überwachung Monitoring SNMP Eventlog WMI Perfmon