Personal tools

SC²S Colloquium - August 02, 2012

From Sccswiki

Jump to: navigation, search
Date: August 02, 2012
Room: 02.07.023
Time: 3 pm, s.t.


Johannes Heckl: Effiziente Vektorisierung von Simulationen für starre mehrzentrige Molekülmodelle

Molekulardynamiksimulationen sind ein wichtiges Hilfsmittel der Forschung. Simulationen mit vielen komplexen, mehrzentrigen Molekülen erfordern sehr lange Laufzeiten, sodass stets schnellere Implementierungen gesucht werden. Moderne Supercomputer bestehen oft aus vielen Standardprozessoren, die Vektor-Befehlssätze wie SSE und AVX anbieten. Für Molekulardynamiksimulationen, die den Linked-Cell Algorithmus verwenden, ist die Optimierung mittels dieser Instruktionen jedoch schwierig.

Ein kürzlich entwickelter Algorithmus erlaubt die effiziente Vektorisierung der Kraftberechnung in Simulationen mit einzentrigen Molekülmodellen mit Hilfe von Vektorinstruktionen. Die Moleküldaten werden zuerst in eine vektorisierbare Form gebracht. Die so verbesserte Lokalität der Daten und die Verwendung von Vektorinstruktionen ermöglicht nun einen hohen Laufzeitvorteil. Die Erweiterung dieses Algorithmus auf mehrzentrige Moleküle und die Integration in das Simulationsprogramm MarDyn sind Thema dieser Arbeit.

Laufzeitanalysen für einzentrige Molekülmodelle zeigen einen Leistungsvorteil von bis zu 125% gegenüber der ursprünglichen Version von MarDyn auf. Für mehrzentrige Molekülmodelle hingegen kann nur eine geringe Leistungssteigerung erzielt werden. Da die Zentren wie einzentrige Moleküle behandelt werden, werden redundante Abstandsberechnungen durchgeführt, die zu einem Leistungsverlust führen.


Christian Kirst: Optimierung und Erweiterung eines Softwarepakets zur Berechnung von Reduced Basis Lösungen

Oft werden Reduces Basis Methoden zur Lösung von Parametrisierten Partiellen Differentialgleichungen eingesetzt. Das typische Anwendungsszenario sind Echtzeitanwendungen, bei denen oft dieselbe PDE für verschiedene Parameter gelöst werden muss. Reduced Basis Methoden versuchen nicht, die PDE im hochdimensionalen Finite-Elemente-Raum zu lösen, sondern in einem problemabhängigen, niedrig-dimensionalen Unterraum. Dieser Unterraum wird selbst von Finite-Elemente-Lösungen für verschiedene Parameter aufgespannt. Der Fokus dieser Arbeit liegt vor allem auf zeitabhängigen Differentialgleichungen und der Implementierung eines Softwarepakets zur Anwendung von Reduced Basis Methoden.


Bogdan Daqui: Performance Tuning of Regular Cartesian Grids Applied to Incompressible Flow Problems

Peano, developed at the department of Computer Science as a multi-purpose PDE framework, with an emphasis on Computational Fluid Dynamics (CFD) applications, has been outfitted during development, with two main kinds of Cartesian grid representations. The more complex adaptive grid, and the simpler naive fixed non-adaptive representation.

It is my intention in the present work, to enhance the performance of the existent regular grid implementation by using it as a starting point on which to apply several approaches, which the author expects will aid in a performance improvement. This must be accomplished while respecting one of the main requirements of keeping complete compatibility with the existent Peano code base, so that changes need not be applied anywhere outside of the new grid component, to make it work within the framework. There are several reasons why the non-adaptive representation might still be quite useful, and for which a faster code might be desirable: Playground for new component development: When new components are built for the framework, it is simpler to test them on less complex data structures, facilitating the identification isolation and correction of eventual coding errors, as well as estimating their performance from a simpler starting point.

Comparison Base Ground: Improvements on the more complex adaptive grid itself can be benchmarked against a known constant performance base, as that coming from a regular non-adaptive grid.

Experimental Scenarios: There are some scenarios for which the simplicity of non-adaptive grids may be better suited, such as those where the complexity of the adaptive grid might become an overhead due to the structures needed to keep track of refinement and to store and access the data across different resolution levels.

The results will help shed light on how much of the performance improvement on the grid itself is translated into CFD application scenarios, where most heavy computations lie outside the reach of the new component code.