Производились умножения квадратных матриц размером 100x100 с шагом 100 до 4000x4000. Эксперименты проводились на машине со следующей конфигурацией:
Processor: Mobile QuadCore Intel Core i7 2630QM @ 2GHz (2.9 GHz Turbo Boost)
Cache: L1 ‒ 32 Kb, L2 ‒ 256 Kb, L3 ‒ 6Mb
RAM: 8Gb, DDR3 1333 MHz
Compiler: Intel(R) C++ Compiler Professional
Результаты измерений при запуске в 4 процесса:
Зависимость ускорения от размера матриц (4 процесса):
Эксперименты показали на размере матриц 1000*1000 был достигнуто сверхлинейное ускорение. Это явление можно объяснить удачным расположением данных в кэше, уменьшению кэш-промахов при данном размере матриц и близких к нему