Для анализа будем использовать следующие показатели:
- T1 - оценка трудоемкости решения задачи на одном процессоре.
- Tp(calc) - оценка трудоемкости решения задачи на p процессорах.
- Tp(comm) - оценка трудоемкости выполняемых операций передачи данных.
- S - ускорение. Ускорение определяется из отношения: S=T1/(Tp(calc)+Tp(comm))
Оценка трудоемкости последовательного алгоритма: T1=n^3
Оценка трудоемкости параллельного алгоритма: Tp(calc)=(n^3)/p
Оценка трудоемкости выполняемых операций передачи данных: Tp(comm)=(p−1)*(a+w*n*(n/p)/b), где a – латентность, b – пропускная способность сети передачи данных, а w есть размер элемента матрицы в байтах.
Ускорение: s=(n^3)/((n^3)/p+(p-1)*(a+w*n*(n/p)/b))