Эксперименты проводились с 4 и 9 процессами.
4 процесса, ось Х - размер матрицы, ось Y - время (сек)
9
процессов, ось Х - размер матрицы, ось Y - время (сек)
Сравнение.
Результаты экспериментов показали очень высокое
ускорение блочного алгоритма Фокса (увеличение количества процессоров
от 4 до 9 приводит почти к двукратному уменьшению времени решения задачи). Особенно хорошо ускорение
замечается на большем размере матриц.
Латентность: а = 0,000027
Пропускная способность: b = 897057861
байт/сек
Время выполненения базовой операции (t) = 0,000000029
Характеристики машины:
Processor AMD x2_64 5600+ 2 Гб
Численные результаты экспериментов:
Размер матрицы |
Время выполнения (послед) |
Число процессов |
Время выполнения (паралл) |
Ускорение |
Время выполнения(теор) |
200 |
0.1059 |
4 |
0.0675 |
1.56 |
0.0578 |
270 |
0.2406 |
9 |
0.186 |
1.20 |
0.043 |
400 |
0.9730 |
4 |
0.7040 |
1.38 |
0.571 |
450 |
1.261 |
9 |
0.6219 |
2.03 |
0.571 |
900 |
16.74 |
4 |
11.08 |
1.51 |
6.708 |
14.30 |
9 |
8.06 |
1.77 |
4.302 |
1800 |
91.84 |
4 |
54.584 |
1.68 |
37.814 |
75.54 |
9 |
38.45 |
1.96 |
29.289 |
Характеристики машины:
Processor Intel Celeron 2.4 512 МБ