Personal tools

SC²S Colloquium - January 27, 2016

From Sccswiki

Jump to: navigation, search
Date: January 27, 2016
Room: 02.07.023
Time: 3:00 pm, s.t.

Ludwig Peucker: Entwicklung einer Dual Tree Traversal-basierten Baumstruktur für die Fast Multipole Methode

Die Fast Multipole Method bietet die Möglichkeit, Molekulardynamiksimulationen zu optimieren. Dabei werden mehrere Moleküle zusammengefasst und gemeinsam verrechnet. So kann ein enormer Laufzeitgewinn erzielt werden. Bei inhomogenen Verteilungen der Moleküle hat diese Methode jedoch eine Schwachstelle. Der Dual Tree Traversal greift dies auf und kombiniert die Fast Multipole Method mit einem Verfahren nach Barnes und Hutt. Auf diese Weise kann das Problem behoben werden und die Laufzeit für inhomogene Verteilungen optimiert werden. Die Integration des Dual Tree Traversals in eine Implementierung der Fast Multipole Method bringt einige Umstrukturierungen mit sich. Durch diese Änderungen wird das Verhalten von bestimmten Algorithmen verändert. Hier soll zunächst die Funktionsweise der Fast Multipole Methode erklärt werden und im Anschluss der Dual Tree Traversal eingeführt werden. Dabei wird auf die konkrete Laufzeitverbesserung eingegangen. Am Ende wird der Dual Tree Traversal in deine bestehende Molekulardynamiksimulation integriert.

Aleksandra Pachalieva: Parallel, Dynamically Adaptive 2.5D Porous Media Flow Simulation on Xeon Phi Architectures

sam(oa)2 is a fast and memory efficient framework for the solution of PDEs based on Sierpinski curve traversals. The hybrid MPI+OpenMP parallelization of the code utilizes data parallelism in distributed and shared memory, which is a premise to achieve good performance on HPC systems. sam(oa)2 has a 2.5D porous media flow scenario suitable for vectorization with its regular grid in the vertical layers that makes it a good candidate for running on the Intel Xeon Phi architecture. Further optimization techniques are proposed like vectorization, taking advantage of the 512-bit SIMD vector support, and load balancing, essential for the scalability due to the problem specific remeshing and varying computational load in symmetric mode. The performance of the framework is tested on the SuperMIC supercomputer using time-based load balancing.