[Support] Routing

Purodha B Blissenbach publi at web.de
Tue Nov 28 10:57:30 CET 2006


Hallo supporter,

Am Wochenende bekam ich Beschwerden von Kunden, die sich über z.T.
kräftige Verzögerungen bei der e-mail Auslieferung beklagten,
einer sagte, es kommen 5-8 e-mails rueber, dann bwewegt sich
einige Minuten nichts, dann kommen wieder 5-10, einige Minuten
Pause, oder aber Abbruch, usw. Nach jedem Abbruch fängts mit den
gleichen e-mails wieder von vorne an. Die Zahl der wartenden
e-mails wächst erheblich schneller, als ich sie abrufen kann,
und es ist fast alles SPAM.

Mein Hinweis, bei den "Pausen" bitte selber die Verbindung
'gracefully' zu unterbrechen - die in Übertragung befindliche
e-mail wird zuende übertragen und die "Abgerufen/Nicht Abgerufen"
Kennzeichnungen zwischen Server und Clent bleiben 'in sync' und
werden genau durch den Abbruch aktualisiert. Das verhindert
Doppel-Übertragungen recht gut, oder beschränkt sie auf einige
wenige e-mails.

Warum aber die Pausen?

Meine Ursachenfoschung führt auf den Rechner 212.21.76.85 -
vermutlich ein Router, der für verschiedene unserer Server der
letzte hop im traceroute vor ihm ist. Dabei beobachte ich mit mtr
folgendes Bild - die Statistik ist von Sonntagabend bis Dienstag
vormittag:

Nr.  Hostname                           Loss   Best Avg Wrst
 5.  so-3-0-edge1-fra3.de.inetbone.net  <1%      16  21  540
 6.  83.220.157.86                       1%      27  44  723
 7.  212.21.76.85                       45%      28  37  579
 8.  hostsharing.net                     1%      28  37  581

Bei andern unserer Hosts ist das Bild praktisch dasselbe. Es kommt
hinzu, dass der ICMP Packet Loss bei 212.21.76.85 sich zeitlich
ziemlich ungleich gestaltet - es werden gelegentlich einzelne
Pakete gedroppt, aber die groß Masse von 45% kommt dadurch
zustande, daß regelmäßig für eine gewisse Zeit praktisch alle
Pakete unter den Tisch fallen, die Dauer schwankt um eine knappe
halbe Minute herum.

Nun kann man natuerlich nicht unbedingt von der Bearbeitung von
Pings auf das Routing von andern tcp-Paketen beim gleichen Rechner
schließen.

Ich vermute dennoch, damit einen wahrscheinlichen Grund für die
"Pausen" bei der Übertragung der e-mail gefunden zu haben, auch
wenn diese - ich vermute mal durch das Protokoll und dessen
timeouts bedingt, wesentlich länger ausfallen, als die
durchschnittlichen "Schweigephasen" des Routers gegenüber Pings.

Jedenfalls meine ich, sollten wir die ISP eG darauf aufmerksam
machen, falls dieser Rechner nicht in unserm eigenen
Zuständigkeitbereich ist.

Weitere Beobachtungen:
- Mir ist es kein einzges Mal gelungen, wenn ich in einer
  "Schweigephase" des 212.21.76.85 einen unserer Server erreichen
  wollte, eine alternative Route zu "erwischen", die ihn umgeht.
- Ohne NS-caching war während der "Schweigephasen" von
  212.21.76.85 keine Namensauflösung für unsere Domains
  (*.hostsharing.net) möglich.
- Seit etwa Donnerstag oder Freitag beobachte ich, daß eine
  normalerweise über den gesamten Tag stabile ssh-Verbindung,
  mit einem unserer Server einige Male am Tag abbricht.

Gruesse von Purodha




More information about the Support mailing list