Библиотека OpenMP

RomanAnisimov · 14.Май.2015 18:08:55

Здравствуйте.

На днях хотел разобраться с директивой $omp для распараллеливания расчётов.

Скажите, пожалуйста, почему в случае перемножения элементов пары векторов параллельный расчёт оказывается в несколько раз медленнее последовательного (см. скриншот) ?

Ulysses · 14.Май.2015 18:11:58

Я плохо понимаю Milliseconds, а описания языка нет, но, насколько я понял, вы считаете время вместе с созданием массивов, которое занимает лишнее время.

RomanAnisimov · 14.Май.2015 18:26:56

Это укороченный пример из папки Samples на перемножение матриц. Только там квадратные матрицы NxN, а у меня вектора, ничего больше я не менял. Матрицы перемножаются в параллельных потоках быстрее, а вот вектора почему-то наоборот

MB · 15.Май.2015 19:33:43

@Ulysses абсолютно прав, в приведенном примере первый вызов Milliseconds происходит после создания массивов и выполнения параллельной версии алгоритма – вот оно это всё и считает, а второй вызов корректен, считает только время работы последовательной версии. Подправьте программу так:

  var a := Arrays.CreateRandomRealMatrix(1,n);
  var b := Arrays.CreateRandomRealMatrix(1,n);
  var c := new real[1,n];
  var d := Milliseconds;
  ParallelMult(a,b,c,n);
  writeln('Параллельное перемножение матриц: ',Milliseconds-d,' миллисекунд');
  d := Milliseconds;
  Mult(a,b,c,n);
  writeln('Последовательное перемножение матриц: ',Milliseconds-d,' миллисекунд');

Если всё очень сильно утрировать, то получается такое пояснение: В Samples пример неправильный, но для матриц это несущественно. Дело в том, что затраты на создание случайной матрицы составят O(n²) – пропорционально количеству элементов, то есть для n=400 это 400² некоторых простых действий (создать/присвоить). Перемножение матриц потребует O(n³) действий, то есть 400³. Вот и считаем: в первом случае создаем две матрицы и перемножаем параллельно (пусть с ускорением в полтора раза – для двухъядерных процессоров сгодится), получаем: 2*400²+400³/1.5 = 4.28Е7. А последовательный алгоритм только перемножает, 400³ = 6.4Е7, то есть дольше. Разница может варьироваться в зависимости от кучи факторов, но параллельный + создание матриц всё равно быстрее последовательного.

Когда Вы перемножаете вектора, по сути, то и создание случайного вектора, и перемножение имеют сложность O(n). То есть в первом случае создаются два вектора и перемножаются – 2*400+400/1.5, а второе измерение – просто перемножение стоимостью 400. Сколько бы у вас не было ядер/потоков, тут обычное умножение всё равно быстрее создания двух векторов, и выигрыша не получите.