2000 guest student programme

This was the first guest student programme at Jülich Supercomputing Centre (formerly: Central Institute for Applied Mathematics ZAM). The programme ran from 7 August to 13 October 2000.

Group Photo

Guest students 2000
Guest students 2000
Forschungszentrum Jülich / W. Schneider


Persons on the photo, left to right:
Jun-Mei Shi (Erlangen), Boris Bierwald (Duisburg), Rouslan Zinetoulline (Duisburg), Oliver Vormoor (Göttingen), Carsten Urbach (Berlin), Zoe Cournia (Athen), Timo Betcke (Hamburg), Timm Höhr (Konstanz), Jochen Werth (Duisburg)

Proceedings

Esser, Rüdiger (Hrsg.) (2000):
Beiträge zum Wissenschaftlichen Rechnen - Ergebnisse des Gaststudentenprogramms 2000 des John von Neumann-Instituts für Computing,
Technical Report FZJ-ZAM-IB-2000-15

Abstracts

Performance analysis of various parallelization methods for BLAS3 routines on cluster architectures

Timo Betcke, TU Hamburg-Harburg
Adviser: Inge Gutheil, ZAM
Traditional parallel computers are either based on the shared memory or the distributed memory model. The new ZAMpano-Cluster of the Central Institute for Applied Mathematics at the Research Center Jülich provides both techniques of memory management. On every node of the cluster either OpenMP, a thread based parallelization technique for shared memory systems, or MPI, which is based on message passing between different processes, is possible. The nodes exchange data by using the MPI protocol. For performing operations in linear algebra it is either possible to only use MPI communication even when processors of the same node have to share data or to use a hybrid data distribution model based on OpenMP on one node and MPI for the communication between nodes. In this article the performance of both parallelization models is analyzed for the ZAMpano-Cluster and for a HP 9000-N Class Enterprise Cluster situated at the Technical University of Hamburg-Harburg by measuring the performance of ScaLAPACK matrix-multiplication routines and my own OpenMP routines based on BLAS3. The target will be to create an efficient BLAS3 matrix-multiplication which takes advantage of both worlds OpenMP and MPI.

Online Visualisierung von Molekulardynamik-Simulationen

Boris Bierwald, HU Berlin
Adviser: Stefan Birmanns, ZAM
In diesem Paper, das als Abschlußbericht des Gaststudentenprogramms 2000 des ZAM entstand, wird zunächst das Konzept der Interaktiven Molekulardynamik-Simulation vorgestellt: die Möglichkeit, den Simulationsprozeß kontrollieren und in ihn eingreifen zu können. Es wird dann auf konkrete Aspekte bei der Implementierung einer Online-Visualisierung eingegangen, die die Visualisierung von MD-Simulationen zur Laufzeit gestattet. Zum Abschluss wird das Grundgerüst für eine einfache Beispielrealisierung einer Online-Visualisierung vorgestellt.

The Ewald Summation method: Calculating long-range interactions

Zoi Cournia, Athen
Adviser: Godehard Sutmann, ZAM
An implementation of the Ewald summation method, which handles long-range interactions and which is based on the Ewald summation method is presented. The accurate description of long-range electrostatic forces is necessary for a realistic simulation of the structure and dynamics of polar or charged chemical systems. The Ewald summation method is proven to provide controlable results for the electrostatic interactions in such systems, when treated under periodic boundary conditions. The algorithm has been implemented in a Fortran 90 module. It is a stand-alonemodule, getting all relevant information via parameter lists from the calling program and thus can be easily included into existing Molecular Dynamics or Monte Carlo programs. As an example it is added to the parallel program DMMD, developed at the Central Institute for Applied Mathematics (ZAM) at Forschungszentrum Juelich. The module has been tested for a system of a molten salt.

Simulationen ungeordneter dipolarer Systeme mit der Methode des ''Parallel Tempering''

Timm Höhr, Konstanz
Adviser: Peter Grassberger, NIC
Die Methode des ''Parallel Tempering'' wird angewendet auf ein System ungeordneter, langreichweitig wechselwirkender dipolarer Zentren. Dieses dient als Modell für ungeordnete Systeme mit lokal beweglichen, geladenen Defekten, bei denen experimentell oft ein frequenzunabhängiger dielektrischer Verlust auftritt. Hier wird jedoch die Frage untersucht, ob der Austausch von Systemzuständen zwischen mehreren, bei verschiedenen Temperaturen stattfindenden, parallelen Simulationen eine effiziente Equilibrierung ermöglicht.

Parallelization of the Multigrid Solver for Flows in Complex Geometries: FASTEST2D-LBR

Jun-Mei Shi, Erlangen
Advisers: Bernhard Steffen, Astrid Goeke, ZAM
The present paper is a documentation for the parallelization of the general flow and transport problem solver FASTEST2D-LBR. Firstly, the numerical methods used in the code is explained, then the essential parts of the parallelization procedures including block structured grid partitioning, block connecting, data dependence handling at block interfaces, data structures in the communication and the implementation of the communication in the code are discussed in detail.

Installation and Test of the DRAMA library on the ZAMpano cluster

Carsten Urbach, FU Berlin
Adviser: Bernd Körfgen, ZAM
For solving large scale problems on parallel computers one has to distribute the work uniformly to the processors, because it is very inefficient to have one processor working while others are waiting, i.e. the work load has to be balanced. Additionally for parallel problems one has inevitably communication between the processors. Therefore the communication has to be distributed uniformly on the processors as well to get a good performance.
Thus there is always the task to distribute or partition the problem between the processors such that the calculation and communication costs are minimized. In order to specify the costs for calculation and communication a so-called cost model is needed.
If the distribution has to be done only once, e.g. before the computation, it is not so important to have a good performance for the partitioning algorithms. But if the distribution has to be done several times during the calculation, as for instance in the case of adaptive mesh refinement or dynamic processes like crash test calculations, the performance of the partitioning algorithm plays a big role.
The DRAMA library is an interface for different existing libraries providing partitioning algorithms linked with a cost model for mesh based parallel applications. Mesh based means, that a complex area is discretized in (finite) elements represented by nodes.
This report is structured in the following way: After describing the theoretical basis of the finite element method and the DRAMA library the performance of the different available algorithms and the functionality of the DRAMA cost model are discussed. A finite element code was implemented to test DRAMA within an application code and first results are presented for this test.

Simulation of colloidal systems in aqueous solution

Oliver Vormoor, Göttingen
Advisers: Rudolf Berrendorf, Godehard Sutmann, ZAM
A software for simulating the dynamical behavior of a colloidal system in aqueous solution is presented. Target application of this software is the es precipitation process of iron in water when adding an electrolyte to the suspension. While the transport process of the electrolyte is described by a continuous density function solving the diffusion equation, molecular dynamics techniques are used for modeling the colloidal particles. Both processes are coupled by electrostatic interaction, which results in a large computational effort. We discuss the simulation model in detail with the numerical approximations and introduce some parallelization strategies for the software. Finally some benchmark results are presented, where it is also shown that for small densities of colloidal particles load balancing between the processing elements is necessary.

Einfluss elektrischer Ladungen auf Stabilität und Agglomerationsvorgänge in Suspensionen

Jochen Werth, Duisburg
Adviser: Peter Grassberger, NIC
Granulare Materialien haben in der heutigen Verfahrenstechnik eine große Bedeutung. In vielen industriellen Prozessen, die Feststoffe verarbeiten, werden diese in Form von Granulaten oder Pulvern eingesetzt. Ein großer Teil der damit verbundenen Probleme ist heute noch nicht gelöst. Insbesondere der Einfluß der elektrischen Aufladung von Granulaten ebenso wie der eigentliche Aufladungsprozess isolierender Materialien ist noch weitgehend unverstanden.
Ein spezielles Problem in diesem Zusammenhang ist das Verklumpen feiner Pulver: Durch van der Waals-Kräfte zwischen den Partikeln kommt es zur Bildung größerer Klumpen. Dies kann z.B. zum Verstopfen von Rohren und Trichtern führen oder aber für die weitere Verwendung des Pulvers hinderlich sein. Eine Methode, die van der Waals-Anziehung der Teilchen in einem Pulver A zu verringern, ist die Bedeckung der Partikel mit einem feineren Pulver B. Die B-Teilchen dienen dabei als Abstandshalter zwischen den A-Teilchen und reduzieren somit deren van der Waals-Wechselwirkung. Technisch ergibt sich hier jedoch das Problem, einen geeigneten Beschichtungsprozess zu finden, da die anziehende Wechselwirkung in Pulvern mit sinkendem Teilchendurchmesser stark ansteigt und deshalb das B-Pulver vor der Deposition im allgemeinen noch stärker zum Verklumpen neigt.
Um diese Verklumpung zu vermeiden, bietet sich als mögliches Verfahren an, beide Pulver entgegennamig elektrostatisch zu laden und in einer geeigneten Flüssigkeit in Suspension zu halten. Die abstoßende Wechselwirkung gleichnamig geladener Teilchen unterdrückt dabei Kontakte A-A bzw. B-B und fördert Kontakte A-B. Durch die umgebende Flüssigkeit wird ein vorzeitiges Verklumpen der Pulver verhindert. Dabei hat sich flüssiger Stickstoff als geeignetes Medium herausgestellt, da diese Flüssigkeit stark unpolar ist und damit die Ladungen der Partikel nicht abschirmt. Zudem kann das Pulver nach dem Beschichtungsvorgang leicht zurückgewonnen werden.
Ziel des im folgenden beschriebenen Projektes ist es, ein Verständnis für die Vorgänge in Suspensionen geladener Partikel zu gewinnen. Dabei soll insbesondere die Stabilität der Suspension in Hinsicht auf das Clustern der Partikel untersucht werden. Zu untersuchende Parameter sind hier das Verhältnis der Ladungen, Radien und Konzentrationen der Partikel. Ziel ist es, diejenigen Werte der Parameter zu finden, bei denen die Beschichtung des Pulvers A optimal ist. Dadurch soll der Aufwand verfahrenstechnischer Versuchsreihen reduziert werden, da bisher eine Bestimmung ''optimaler'' Parameter nur durch empirische Untersuchungen möglich ist.
Die Untersuchung soll mit Methoden der Molekulardynamiksimulation durchgeführt werden. Um die in der Simulation notwendigen großen Teilchenzahlen erreichen zu können, soll auf eine explizite Simulation der umgebenden Flüssigkeit verzichtet werden. Statt dessen wird die langreichweitige hydrodynamische Wechselwirkung der Partikel durch Kräfte in der Stokeslet-Approximation angegeben. Die jeweiligen Kräfte werden im folgenden Abschnitt beschrieben.
Im zweiten Teil dieses Berichts wird dann genauer auf das verwendete Simulationsverfahren eingegangen. Insbesondere wird dabei die im Rahmen des Gaststudentenprogramms geschriebene parallele Version des Simulationsprogramms vorgestellt. Schließlich folgt eine kurze Zusammenstellung erster Ergebnisse.

Synchronisation der Uhren auf dem ZAMpano-Cluster

Rouslan Zinetoulline, Duisburg
Advisers: Ulrich Detert, Felix Wolf, ZAM
In vielen Fällen ist es wichtig eine globale Uhr im System zu haben. Beispiele hierfür sind die sogenannten Event Tracing Tools wie zum Beispiel VAMPIR. Dabei müssen verschiedene Ereignisse aufgezeichnet werden. Um die Ereignisse aufzeichnen zu können braucht man eine gemeinsame Zeit auf allen Prozessoren. In meiner Arbeit habe ich das Programm geschrieben, das die Uhren auf ZAMpano SMP-Cluster synchronisiert. Es gibt schon Programme, die die Uhren synchronisieren, die Genauigkeit der Synchronisation ist aber zu klein. Ein Beispiel dafür ist das Network Time Protokoll.

Last Modified: 08.02.2022