Was ist Grid-Computing?

Numerische Simulationen können sehr schnell sehr rechenintensiv werden. Damit man dafür nicht den eigenen Laptop eine Woche lang auf voller Last rechnen lassen muss, kann man das Programm auf einem Netz von Rechnern (grid) laufen lassen. Dafür benötigt es ein Job-Verwaltungssystem, um die Aufgaben zu verteilen.

Dafür stellt PhyMa 41 CPUs mit je 4 Kernen zur Verfügung. Diese können mittels der Sun Grid Engine (SGE) angesteuert werden

Wie interagiere ich mit der queue?

Um einen job zu einer queue hinzuzufügen, muss man ein job script erzeugen, welches dann mit qsub zur queue hinzugefügt werden kann:

qsub jobscript.sh

Der job sollte dann in der Warteschlange hängen und irgendwann einem Rechner zugewiesen werden. Den aktuellen status kann man mit qstat überprüfen.

qstat -q cip -f -u \*

Um einen Job vorzeitig zu beenden muss man den qdel Befehl benutzen. Die JobId wird von qstat angezeigt.

qdel jobid

Wie erzeuge ich ein jobscript?

Ein jobscript ist auch nur ein normales shell script, aber Optionen für qsub können durch Zeilen, die mit #$ beginnen festgelegt werden

Die simpelste Variante eines jobscripts wäre:

#!/bin/bash
#$ -N test        # festlegen des Namens

# Wechsel ins Heimverzeichnis
cd

# starten des Simulationsprogramms
./simulation