Martin-Luther-Universität Halle-Wittenberg

Kaltgang im Maschinensaal des ITZ

Weiteres

Login für Redakteure

SUN FIRE 6800/3800 / SSP2000

SUN FIRE 6800

13.09.2007
08:00 Uhr bis ca. 15:00 Uhr Downtime wegen Unterbrechung der Stromversorgung des gesamten Rechenzentrums!

24.07.2007
13:44 Uhr REBOOT nach div. Reparaturen !!!

17.07.2007
22.30 Uhr Totalausfall wegen Überhitzung !!!  Grund: ausfall der Klimaanlage gegen 20:00 Uhr !!!

16.02.2007
15:00 Uhr diverse REBOOTS wegen SYSTEMCRASH !!!

04.02.2007
22:30 Uhr REBOOT wegen SYSTEMCRASH!!!

25.04.2006
10:00 ab 10:00 Uhr downtime wegen install wichtiger patches (ca. 1-5 Std.)

25.01.2006
Compiler studio8 + IMSL sind auf S8-1TP nutzbar!

13.12.2005
ab 10:00 Uhr downtime wegen install wichtiger patches (ca. 1-2 Std.)

27.06.2005
Disk auf /scratch24 zeigt nicht reparable Fehler:
wichtige Daten bitte selbst. sichern und auf andere Scratchbereiche ausweichen !
=> Austausch defekter Disk ohne Vorankündigung im lfd. Betrieb => frühstens Mittwoch diese Woche,   29.06.05

SUN FIRE 3800

Bei evtl. Ausfall der S24-1TP ist die S8-1TP wie folgt tangiert:

  • die "HOME-DIR`s" stehen temporär nicht zur Verfügung
  • lfd. Jobs werden fortgesetzt
  • die /scratch Filesysteme sind dann nicht betroffen (=> Umgehungslösung)

Installierte Java Versionen: 1.2, 1.3, 1.4 --> Auswaht siehe www.urz    . ...

13.09.2007
08-.00 Uhr bis ca. 20:00 Uhr DOWNTIME wegen Unterbrechung der Stromversorgung des gesamten Rechenzenrums!!!

30.07.2007
14:15 Uhr REBOOT nach div. Reparaturen!!

17.07.2007
22:30 Uhr Totalausfall wegen Überhitzung! Grund: Ausfall der Klimaanlage gegen 20:00 Uhr !!!

20.02.2007- 21.02.2007
13:00 Uhr  DOWNTIME wegen Reparaturarbeiten!

27.10.2006
12:00 Uhr bis ca. 17:00 Uhr DOWNTIME wegen Arbeiten an der Stromversorgung im Rechenzentrum!

18.08.2006
10:50 Uhr REBOOT wegen Systemhänger (Netzprobleme)

25.04.2006
10:00 bis ca. 15:00 Uhr DOWNTIME wegen install wichtiger patches

25.01.2006
Compiler Studio8 + IMSL nutzbar: Eingabe: $ IMSL (temp. Nutzung) oder + im .prifile: . /etc/skel/cttsetup.sh // Ausgabe Versionen: $ version

13.12.2005
ab 10:00 Uhr DOWNTIME wegen install wichtiger patches!

29.08.2005
07:00 Uhr - 15:30 Uhr + 01.11.2005 07:00 Uhr - 17:30 Uhr shutdownwegen Umzug Rechnerraum (Renovierung)! Dauer Umzug inkl. kompl. Infrastruktur (Netz+Strom,...) geplant

SSP2000

Am 15.08.2005 wurde die SPP2000 für IMMER AUSSER BETRIEB genommen!!!
Nach über 8 Jahren treue Dienste für viele Forschungsprojekte der Universität und div. Plazierungen in den Top500!!!

28.05.05      20:30 Systemcrash wegen Ausfall Klima -> nach reboot mit nur node0 und div. Aktionen
Nutzung wieder möglich ab 03.06.05 09:30 Uhr !!!
node1 fuer immer kaputt - inkl. der Filesysteme dort (restore max. 1 Jahr mgl.).}}

15.06.2004   Am Dienstag, den 15.06.2004, wird ab 09:00 Uhr fuer ca. 4 Stunden die Stromversorgung zum Rechnerraum abgeschaltet.
Betroffen sind u.a. f. Serversysteme:
* File-/Backup-/Archiv-/Datenbankserversystem (IBM Cluster),
* SunFire 6800/3800
* SPP2000
Notwendig is dies wegen Arbeiten an der Stromversorgung, die erforderlich sind, um die Energieversorgung der anstehenden
Neuinstallation File-/Backup-/Archiv-/Datenbankserversystem mit Automatic Tape Library  terrmingerecht vorzubereiten.
Die SunFire 6800/3800 laufen in dieser Zeit mit alt. Stromversorgung !!!
Der Zugang kann zeitweise unterbrochen sein !!!!!!!!!!
Betroffen ist auch die SPP2000 !--> shutdown 08:30 Uhr !!!!!!!!!!!} }}
27.11.03       14:00 Uhr bis 5.12.03 09 15 Uhr erfolgte eine Sicherheitsabschaltung der SPP2000 wegen der Installation neuen
zentralen USV !!!!!
12.08.2003   Wegen Ausfall der Klimaanlage Systemcrash am 11.08.03 06:56 Uhr !!!! Reboot 12.08.03 07:00 Uhr !!!!
11.08.2003   Wegen Ausfall der Klimaanlage Systemcrash! Reboot erst nach Temp.-Stabilisierung !!!!
07.12.2002   09:20 Uhr REBOOT wegen Stromausfall 08:00 --> 09:15 Uhr !!!!!!!!!!
04.11.2002   15:30 Uhr reboot nach Systemcrash -> Fehleranalyse lfd.
25.10.2002   14:30 Uhr reboot nach Systemcrash -> Fehleranalyse lfd.
06.10.2002   23:45 Uhr Systemcrash --> reboot 7.10. 07:30 Uhr; 14.10.2002 ca. 13:00 Uhr Reparatur !!!!!!!
23.09.2002   08:00 Uhr shutdown wegen Fehlersuche; 23.09. 09:45 Uhr Fehler behoben alles i.O. !!!!!!!!!!!!
23.09.2002   08:00 Uhr mehrfach BOOT wegen Fehlersuche und Reparatur (Probleme mit interner Kommunikation)!!!!!!!
Ende der Reparatur eventuell im Laufe des 25.09. !!!!!!!!!
21.08.2002   Nach nicht angekündigten Stromausfall am 19. und 20.08.02:
Ausfall PowerSupply und Probleme mit interner Kommunikation - Nutzung nun wieder möglich!
19.08.2002   ca. 13:30-16:30 Stromausfall am Campus Weinberg - nicht angekündigt !
HP/Convex Spp2000 ist nach Stromausfall kaputt - nicht mehr bootbar
25.06.2002   kurzfristige Reparatur ab ca. 11:00 Uhr ---> ca. 12:30 Uhr !!!!!!!!!
27.05.2002   09:30 Uhr Reparatur ! Dauer ca. 2 Std.!
18.05.2002   05:00 Uhr Systemcrash -->reboot 21.05.02  07:45 Uhr !
04.04.2002   10:00  Reparatur --> reboot  11:30 Uhr  !!!!!!!!!!!
04.04.2002   10:00 Uhr noch eine weitere Reparatur notwendig!
03.04.2002   11:30 Uhr konnte die SPP2000 erfolgreich gebootet werden.
01.04.2002   15:15:46 MET 2002  steht die SPP2000 wegen eines Hardwarefehlers und lässt sich nicht  "booten"!!!!!
14.01.2002:  05:00 Uhr Systemcrash -->reboot 14.01.02 07:45 Uhr !
18.12.2001:  10:00 bis etwa 14:00 Uhr, ist die SPP2000 nicht erreichbar (Netzzugang unterbrochen!!!)
03.12.2001:  08:00 bis etwa 12:00, wird die SPP2000 wegen Arbeiten an der Stromversorgung ausgeschaltet !!!!!!!!
25.11.2001:  23:00 Uhr Systemcrash -->reboot 26.11.01 08:00 Uhr !
20.11.2001:  09:30 Uhr mehrfaches boot wegen Software-Problemanalyse !!!!!
25.09.2001:  10:00-11:00 Uhr shutdown wegen Tausch 1 CPU !!!
21.09.2001:  10:00-11:00 Uhr shutdown wegen Tausch 1 CPU !!!
17.09.2001:  10:47 Uhr reboot wegen Systemhänger (nach Fehleranalyse)
13.09.2001:  10:00 Uhr Shutdown wegen Softwareproblemen!!!!!
21.08.2001:  10:00 Uhr Reparatur -->reboot 10:55 Uhr  !!!!
14.08.2001:  10:00 Uhr Reparatur -->reboot 11:55 Uhr  !!!!

Wichtige Informationen

Am 15.08.2005 wurde die SPP2000 für IMMER AUSSER BETRIEB genommen!!!
Nach über 8 Jahren treue Dienste für viele Forschungsprojekte der Universität und div. Plazierungen in den Top500!!!

Liebe Nutzer der HP/Convex SPP2000,
am 30.11.02 endet unser Wartungsvertrag mit HP !!!
Unser 1997+ 98 in den Top 500 gelistetes System ist nun seit 5 fast 6 Jahren in Betrieb. Die Auslastung betrug fast immer nahezu 100%. Seit dem wir die SunFire haben, hat das selbstverständlich etwas nachgelassen. Wir wollen die SPP auch nach dem 30.11.02 noch so lange weiter betreiben bis entweder diese nicht mehr reparabel ist (in Eigenregie mit vertretbaren Aufwand) oder ein Weiterbetrieb aus wirtschaftlichen Gründen nicht mehr vertretbar wäre (z.B. geringe Nutzung).
Im Falle eines "bösen" Crashs, bedeutet das ein unangekündigtes AUS für immer !
Wir bitten deshalb unbedingt um Folgendes:

1.) räumen Sie bis 30.11.02 Ihre Filesysteme auf der SPP gründlich auf!

2.) nutzen Sie für wertvolle ("verlustsensible") Daten $ /u/gn/perskz
dieses Filesystem ist via NFS gemountet und steht transparent bzw. identisch auf der SunFire und als home im cluster zur Verfügung.

3.)Sollte es im Falle eines "bösen" Crashes trotzdem zum Verlust wichtiger Daten kommen, melden Sie sich bitte bei uns.

Wir haben für die SPP ADSM/TSM Stellvertreter eingetragen. Mit deren Hilfe ist es möglich, die zuvor gesicherten Daten aus der Tapelibrary anderen Ortes zur Verfügung zu stellen. Backups erfolgen täglich, scratch-file-systeme sind davon ausgeschlossen !

4.) optional: das unter 3.) gen. Verfahren können Sie auch als Nutzer für Ihre eigenen Filesysteme selbständig anwenden.
Vorraussetzungen:

  • auf der spp hat der Nutzer im dsm einen Stellvertreter eingetragen:
    (dsm->utilities->set authorisation)
  • auf dem Stellvertreter muss dsm installiert sein (dsm ggf. dort starten ->  utilities -> access another user: SPP2000.URZ.... -> Rest wie sonst auch)
    /regien zu dsm siehe auch unter backup

Zum Seitenanfang