Производились умножения квадратных матриц размером 100x100 с шагом 100 до 4000x4000. Эксперименты проводились на конфигурации:
CPU: Intel(R) Core(TM) 2 Quad CPU Q6850 @ 2.33GHz
RAM : 4096 MB DDR2
Cores: 4
L1 D-Cache: 32 KBytes x4
L1 I-Cache: 32 KBytes x4
L2 Cache: 4096 KBytes x2
Вычисления проводились в 4 процесса:
Что показало следующую зависимость ускорения от размера матриц:
И в 9 процессов:
С соответствующим графиком ускорения:
Эксперименты показали что на 4 и 9 процессах на размере матриц 1000*1000 был достигнут пик ускорения. Сверхлинейное ускорения обьясняется специфическим соотношением размера данных к количеству доступов к памяти именно при этом размере матриц.