Практические результаты

results

Вид данного графика объясняется особенностями архитектуры процессора Intel Core Duo T2130. Рост ускорения при размере матрицы n < = 350 связан с относительным уменьшением накладных расходов на переключение контекста выполнения между потоками по сравнению с общим увеличением времени на проведение вычислений. Наличие максимума на графике объясняется тем, что при n = 350 обрабатываемая матрица еще целиком убирается в в L2 кэш процессора, размер которого равен 1 Mb. Приn > 350 мы видим уменьшение ускорения, т.к. матрица цже целиком не убирается в L2 кэш и при данной схеме реализации параллельного алгоритма при обращении каждого потока к своей части матрицы происходит сброс содержимого кэша (напомним, что каждый поток обрабатывает свою полосу матрицы). Т.о. накладные расходы по обращению к L2 кэш памяти процессора сводят на нет эффект от параллельной схемы вычислений, но тем не менее ускорение все же наблюдается.

Практические результаты

Новости