Основные выводы При реализации алгоритмов необходимо обращать внимание на
эффективное использование встроенной кэш-памяти Intel
Pentium
4, а также программировать таким образом, чтобы позволить оптими-
зирующему компилятору применить векторизацию. При таком подхо-
де становится возможным получение существенного прироста произ-
водительности при использовании Intel
Pentium 4.
Intel
C++ Compiler 5.0 проявил себя наилучшим образом при ре-
шении задачи умножения квадратных матриц в плане использования
возможностей аппаратуры и системы команд.
Применение оптимизационных решений позволяет получить луч-
шие результаты по сравнению с PLAPACK 3.0.
Литература 1. Михальчук В.М., Ровдо А.А., Рыжиков С.В. Микропроцессоры
80x86, Pentium
. Архитектура, функционирование, программиро-
вание, оптимизация кода. Минск: «Битракс», 1994.
2. Introducing the Streaming SIMD Extensions 2 for the Pentium
4
Processor http://developer.intel.com/software/products/itc/sse2/
sse2down.htm.