42
ний день является признанным тестом производительности параллель-
ных систем, по результатам этого теста составляется список Top500
(http://www.top500.org/ ) – список пятисот наиболее производительных
систем в мире.
В данном разделе описываются результаты, полученные для тес-
та LINPACK при его реализации с широким использованием двух
библиотек параллельных вычислений PLAPACK (для ОС Windows) и
ScaLAPACK (для ОС Linux).
Библиотека PLAPACK (Parallel Linear Algebra Package) представ-
ляет собой набор параллельных процедур линейной алгебры, необхо-
димых при выполнении большого класса научно-технических расче-
тов. PLAPACK реализован с использованием
библиотеки передачи
сообщений MPI для операционных систем семейства Windows и вклю-
чает интерфейсы для языков Fortran и С. Для работы PLAPACK требу-
ет наличия библиотеки, реализующей
функции набора BLAS (Basic
Linear Algebra Subprograms). Более подробная информация о библио-
теке PLAPACK приведена,
например,
в
документе
http://www.cs.utexas.edu/users/plapack.
ScaLAPACK (Scalable
Linear Algebra Package
–
http://www.netlib.org/scalapack) представляет собой набор параллель-
ных процедур, по
функциям аналогичный процедурам PLAPACK. Так
же как и PLAPACK, ScaLAPACK реализован с использованием
биб-
лиотеки передачи сообщений MPI, но разработка выполнена для плат-
формы Unix.
В экспериментах, проводимых в рамках настоящего проекта под
управлением ОС Windows с использованием библиотеки PLAPACK, в
качестве реализации BLAS использовалась библиотека MKL (описа-
ние библиотеки приведено, например, в http://developer.intel.com/
software/products/mkl/index.htm). В качестве реализации MPI использо-
вались две разные реализации (см. раздел 1):
• Argonne MPICH (http://www-unix.mcs.anl.gov/mpi/MPICH/);
• MP-MPICH (http://www.lfbs.rwth-aachen.de/~joachim/MP-MPICH.html).
В экспериментах под управлением ОС Unix (Linux) с применением
библиотеки ScaLAPACK в качестве реализации MPI использовалась
реализация Argonne MPICH (http://www-unix.mcs.anl.gov/mpi/MPICH/).
Для примера результатов выполненных экспериментов на рис. 3
представлены достигнутые максимальные показатели производитель-
43
ности с использованием разного числа вычислительных узлов (компь-
ютеров на базе процессоров Pentium 4 с тактовой частотой 1.3 GHz) и
для разных реализаций MPI с разными операционными системами.
Достарыңызбен бөлісу: