Общая трудоёмкость последовательного алгоритма равна n3. Для параллельного алгоритма на отдельной итерации каждый процессор выполняет обновление элементов матрицы D. Всего в подзадачах n2/p таких элементов, число итераций алгоритма равно n, таким образом, показатели ускорения и эффективности параллельного алгоритма Флойда имеют вид (p – число процессоров):
Sp = n3/(n3/p) = p,
Ep = n3/(p(n3⁄p)) = 1.
Общий анализ сложности дает идеальные показатели эффективности параллельных вычислений.
Коммуникационная операция, выполняемая на каждой итерации алгоритма Флойда, состоит в передаче одной из строк матрицы D всем процессорам вычислительной системы. Выполнение такой операции может быть выполнено за log2 p шагов.
Общая длительность выполнения коммуникационных операций:
Tp(comm) = n log2 p (α + wn/β),
где
α – латентность сети передачи данных,
β – пропускная способность сети,
w – размер элемента матрицы в байтах.
Общее время выполнения параллельного алгоритма Флойда:
Tp = n2(n/p) τ + n log2 p (α + wn/β),
где
τ есть время выполнения операции выбора минимального значения.