Новости
О Центре
Кластер
Обучение
Основной курс по параллельному программированию
Учебные курсы
Магистратура
Дополнительное образование
Работы студентов
Библиотека
Исследования
Конференции
Полезные ссылки
NVIDIA
Контакты
О сайте
Имя:
Пароль:
запомнить:
Забыли пароль? Регистрация

Анализ эффективности

Для анализа будем использовать следующие показатели:

  • T1 - оценка трудоемкости решения задачи на одном процессоре.
  • Tp(calc) - оценка трудоемкости решения задачи на p процессорах.
  • Tp(comm) - оценка трудоемкости выполняемых операций передачи данных.
  • S - ускорение. Ускорение определяется из отношения: S=T1/(Tp(calc)+Tp(comm))

Оценка трудоемкости последовательного алгоритма: T1=n^3

Оценка трудоемкости параллельного алгоритма: Tp(calc)=(n^3)/p

Оценка трудоемкости выполняемых операций передачи данных: Tp(comm)=(p−1)*(a+w*n*(n/p)/b), где a – латентность, b – пропускная способность сети передачи данных, а w есть размер элемента матрицы в байтах.

Ускорение: s=(n^3)/((n^3)/p+(p-1)*(a+w*n*(n/p)/b))

Новости

22.10.2012
04.09.2012
05.04.2012
06.03.2012
02.03.2012