[Global-announce] Ausfälle von Freitag und heute / Backups /
Wartungsankündigung
Michael Hoennig (Hostmaster Hostsharing eG)
global@hostsharing.net
Mon, 8 Dec 2003 20:05:51 +0100
Liebe Hostsharing-Mitglieder und -Nutzer,
am 2. Dezember haben wir nach monatelangem Betrieb mit dem ext2 Filesystem
wieder das Journalling-Filesystem ext3 aktiviert. Dies war möglich, weil
der Fehler, der bei hohem Load in Zusammenhang mit Quota
(Speicherplatzbeschränkung pro Paket) zum Stillstand des Systems führte,
im neuen Linux Kernel 2.4.23 angeblich gefixt war. Leider ist dies
offenbar nicht der Fall, so dass wir am 5. Dezember und heute wieder
ähliche Server-Ausfälle hatten, wie damals.
Hintergrund: ext3, ein Journalling-Filesystem, benötigt nach einem Absturz
keine Filesystem-Reparatur, sondern spielt einfach die unbeendeten
Journale ab. Das Booten nach einem harten Reset (z.B. wenn der Server
durch Software-Fehler unbedienbar wurde) läuft daher schneller ab. Leider
trat aber vermutlich der angeblich gefixte Fehler wieder auf, so dass
dieser Vorteil durch häufigere harte Neustartes mehr als ausgeglichen
wird.
Wir haben also beim Neustart nach dem heutigen ungeplanten Ausfall ext3
bis auf weiteres wieder deaktiviert. Die Quota muss leider morgen früh
nochmals repariert werden, dies ist leider nur möglich, wen das Filesystem
nicht benutzt wird. Wir werden dieses wieder im Wartungsfenster von 3:00h
bis 6:00h durchführen. In diesem Zeitraum morgen früh ist also mit einem
Ausfall von ca. 30 bis 45 Minuten zu rechnen.
Bei kontrollierten Neustart heute morgen waren die Backups leider noch
nicht durch. Diese laufen daher heute tagsüber, was leider sehr langsam
ist. Wir hoffen, die Backup-Runde für heute noch zu beenden, bevor die
morgige geginnt. Die Backups vom 8.12. sollten dennoch mit Vorsicht
betrachtet werden, falls jemand in den nächsten 14 Tagen gerade dieses
Backup benötigen sollte.
Wie wir mit dem Filesystem weiter verfahren, werden wir auf unserer
Mailingliste technik@ diskutieren. Zumal die Ursache für den hohen Load
vom 26.11. noch ungeklärt ist, der den Server ebenfalls unbedienbar machte
und einen harten Reboot erforderte. Zu diesem Zeitpunkt war ext2 und nicht
ext3 aktiv. Der Server zeigte jedoch auch ein anderes Vehalten als bei den
beiden letzten Hängern.
Für die Ausfälle und Unannehmlichkeiten wegen der Quota bitten wir um
Verständnis.
die Hostsharing Hostmaster
--
Hostsharing eG / Boytinstr. 10 / D-22143 Hamburg
phone+fax: +49 700 HOSTSHARING (= +49 700 46787427)
http://www.hostsharing.net: where YOU make the difference