This document was written for Troja. URL: http://www.feyrer.de/Texts/Troja/tabaluga-2y.html



Zwei Jahre Uptime und er läuft und läuft
Hubert Feyrer <hubert.feyrer@informatik.fh-regensburg.de>, April 2002

Der Fachbereich Informatik/Mathematik betreibt für Studenten einen Rechner, der im 24x7-Betrieb unter Unix läuft. Der Rechner mit dem Namen 'tabaluga' steht den Studenten für Logins via telnet, rsh und (bevorzugt) ssh sowie FTP und sftp zur Verfügung, und wird auch häufig für das Lesen von EMail und die Bearbeitung von Übungen in diversen Vorlesungen wie Betriebssysteme, Systemprogrammierung, Datenbanken etc. benutzt.

Am Osterwochenende 2002 erreichte der Rechner eine Laufzeit von zwei Jahren! Zwei Jahre ohne Neustart, ohne Systemabsturz, Bluescreen, Kernel Panic, etc. Dies soll hier als Anlass genommen werden, etwas über die letzten zwölf Monate zu schreiben.


Bild: Happy 2nd Birthday, Tabaluga!

Neben den bereits letztes Jahr beschriebenen extremen Temperatur- und Systembedingungen (Troja berichtete) war der erste bedeutende Event im vergangnenen Jahr der Umzug des Servers, von dem tabaluga alle Platten, Applikationen und Benutzerdaten bezieht. Dieser Server - die rfhs8012 - erfuhr ein Hardware-Upgrade von einer Sun Ultra 10 auf eine SunFire 280R. Der Umzug ging an Tabaluga fast problemlos vorüber, lediglich ein paar hängende NFS-Mounts führten dazu dass der Rechner kein Automounting der Benutzer-Verzeichnisse (/home2, ...) machen kann. Diese wurden durch statische Mounts ersetzt, der Betrieb lief nach dem Systemupdate weiter.


Bild: tabaluga's neuer Server

Anfang 2002 wurde noch die Platte mit den Anwendungen (/home1) ersetzt. Anstatt der bisherigen 18GB Festplatte tut nun ein RAID-System seinen Dienst, was etwas mehr Ausfallsicherheit und v.a. mehr Platz gewährleistet. Die bei der Umstellung befürchteten Probleme durch die neuen INode-Nummern blieben aus, und tabaluga konnte die /home1-Platte nach dem Upgrade problemlos mounten. (Ein Ändern der INodes/Platten im laufenden Betrieb verkraftet Solaris anscheinend nicht problemlos, wie frühere Erfahrungen zeigen).

Eine größere Herausforderung stellte Anfang des Jahres eine angekündigte Stromabschaltung zwecks Wartungsarbeiten am zentralen Stromverteiler dar. Ein Abschalten des Stroms hätte zum Zurücksetzen der Systemlaufzeit geführt, was nicht gewünscht war. Der Rechner läuft auch nicht an einer Unterbrechungsfreien Stromversorgung (USV). Was tun, um die Uptime des Systems zu erhalten? Die Uptime im frisch gebooteten System zu patchen um den Neustart zu verheimlichen wäre unsportlich, so dass eine Alternative nötig war. Letztendlich wurde dem Rechner - im laufenden Betrieb! - eine USV vorgeschaltet. Die bestehenden Stromversorgung wurde dazu überbrückt, und dann mittels eines Spezialschalters eine geliehene USV zwischengeschaltet. Das gesamte Unterfangen ist in einem früheren Troja-Artikel beschrieben, und soll hier nur am Rande erwähnt werden. Durch das Engagement mehrere Studenten wurde hier die Laufzeit des Systems auch während der Stromabschaltung sichergestellt!


Bild: Stromumschalter für USV

Der Rechner nach wie vor läuft und steht weiter interessierten Studenten und Dozenten zur Verfügung. Fragen, Wünsche und Anregungen können jederzeit via EMail oder persönlich an den Systembetreuer Hubert Feyrer <hubert.feyrer@informatik.fh-regensburg.de> herangetragen werden.

Verweise:


(c) Copyright 20020411 Hubert Feyrer <hubert.feyrer@informatik.fh-regensburg.de>