Для тестирования последовательной и параллельной реализаций использовалась
машина со следующей конфигурацией:
Intel(R) Core(TM)2 QUAD CPU Q9300 @ 2.50GHz, 4.00 GB RAM
Для экспериментов использовалась параллельная версия с 4мя процессами. Обе
версии использовали одинаковые исходные данные. Результаты вычислений всегда
совпадали. Время работы и ускорение приведены в следующей таблице:
N |
последовательная версия |
параллельная версия |
ускорение |
500 |
0.078 |
0.327 |
0.23 |
1000 |
0.936 |
1.232 |
0.75 |
2000 |
7.58 |
7.51 |
1.009 |
3000 |
25.14 |
23.04 |
1.09 |
5000 |
114.177 |
99.2 |
1.15 |
Полученное значение эффективности параллельного алгоритма мало. Получим
теоретические оценки ускорения для проверки корректности работы алгоритма. Для
этого были вычислены показатели латентности и пропускной способности сети -
2.3e-4 сек и 1215 МБайт/сек соответственно. Тогда используя формулу для
теоретической оценки из раздела "анализ эффективности" получим:
Теоретическое и Практическое ускорение
N |
Теоретическое ускорение |
Практическое ускорение |
500 |
0.28 |
0.23 |
1000 |
0.92 |
0.75 |
2000 |
2.16 |
1.009 |
3000 |
2.9 |
1.09 |
5000 |
3.5 |
1.15 |