Анализ эффективности
Общая трудоемкость последовательного алгоритма
является пропорциональной n^3. Для параллельного алгоритма на
каждой итерации каждый процессор выполняет умножение имеющихся на процессоре
полос матрицы А и матрицы В (размер полос равен n/p, и, как результат, общее
количество выполняемых при этом умножении операций равно n^3/p^2). Поскольку
число итераций алгоритма совпадает с количеством процессоров, сложность
параллельного алгоритма без учета затрат на передачу данных может быть
определена при помощи выражения T=(n^3)/p. C учетом этой
оценки, показатель ускорения примет вид:
A=(n^3)/((n^3)/p=p
|