2011 Benchmark

Benchmarks

Der exciting Code

Der exciting Code, mit dem die Benchmarks durchzuführen sind, ist als Download (exciting.tar.gz) zu beziehen. Unter "how to compile" befinden sich auch die Anweisungen zum Compilieren. Änderungen im Quellcode, soweit sie das Ergebnis nicht ändern und mit abgegeben werden, sind zulässig. Fragen zur Compilierung können an ed.nilreb-uh.kisyhp|gniticxe#ed.nilreb-uh.kisyhp|gniticxe gestellt werden. Die Benchmarks müssen auf baugleichen Computern, wie im angebotenen System enthalten, ausgeführt werden.

Benchmark 1: exciting Groundstate Benchmark

Dieser Benchmark soll die multithreaded Performance dokumentieren. Für das Molekül Naphthalene sollen zwei Selbst-Konsistenz-Zyklen berechnet werden. Der benötigte Input input2A.xml sowie der als Referenz dienende Output INFO.OUT werden zur Verfügung gestellt. Die Gesamtlaufzeit ist mittels des UNIX- Programms time zu ermitteln. Das Programm soll mit multithreaded BLAS/LAPACK libraries verlinkt werden (z.B.GotoBLAS, MKL ist erfahrungsgemäß nicht geeignet). Das Beispiel soll mit mehreren Threads ausgeführt werden. Die Zahl der Threads legt der Anbieter fest, um die bestmögliche Performance erreichen. Als Nachweis des Benchmarks sind die INFO.OUT Files und die Laufzeiten anzugeben. Diese Rechnung benötigt mindestens 42GB Arbeitsspeicher.

Benchmark 2: exciting Excited States Benchmark

In diesem Testbeispiel werden die optischen Eigenschaften eines Argonkristalls mittels der Bethe-Salpeter-Gleichung berechnet. Die Input Files inputAr.xml und Ar.xml sind hinterlegt. Nachzuweisen sind das File INFOXS.OUT, das die Laufzeiten der einzelnen Schritte beinhaltet, und das EXCITON_SORTED_NAR_BSEsinglet_SCRfull_OC11.OUT File mit dem Endergebnis. Die Rechnung soll mit 128 MPI-Prozessen durchgeführt werden. Die Benchmarkzeit wird aus dem INFOXS.OUT file entnommen, im Absatz von Task 441 wie folgt:

Date (YYYY-MM-DD) : 2011-10-07
Time (hh:mm:ss)   : 09:27:00
Info(xsinit): task Nr.   441 started

Info(xsinit): mapping BSE-specific parameters

Info(exccoulint): Gaunt coefficients generated within lmax values:      10       3      10
Info(exccoulint): number of q-points:   1728
Info(findocclims): system has Kohn-Sham gap
Info(exccoulint): Exchange Coulomb interaction finished
Info(xsfinit): task Nr.     441 stopped gracefully
Timings: 
  Date (YYYY-MM-DD) : 2011-10-07
  Time (hh:mm:ss)   : 11:05:17
  CPU time          : 5822.08 sec; 1.62 hrs; ( 0 d, 01 h, 37 m, 02 s )
  CPU time  (cumulative) : 10501.15 sec; 2.92 hrs; ( 0 d, 02 h, 55 m, 01 s )

In diesem Fall :02 h, 55 m, 01 s

Benchmark 3: LINPACK Benchmark

Durchführung eines high-performance LINPACK Benchmarks mit 128 MPI Prozessen. Die Matrixgröße kann frei gewählt werden, darf aber 4GB pro Core nicht überschreiten. Anzugeben ist die erreichte Anzahl von FLOPS.

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License