По горизонтальной оси отложен размер массива, по вертикальной - время работы программы в секундах.
Производилось 20 запусков на каждой размерности массива, затем выбирался минимальный результат из полученных.

Разница между практическим и теоретическим ускорениями объясняется не учетом затрат на сборку данных на главном процессе, так же не учетом некоторых деталей реализации
Конфигурация: Intel Core 2 Duo, 2 Gb RAM