Тестовые прогоны на модели ОА-архитектуры dataflow-ВС задач бенчмарка GRAPH500 на основе алгоритмов решения теоретико-графовых задач - Преимущества применения dataflow-парадигмы в вычислительных системах

При прогонах тестовой программы, написанной на ПЯ, для алгоритма бенчмарка Graph500, изменялись значения входных параметров, таких как:

    - N - число ИУ суперкомпьютерной системы при моделировании; - 2M - число вершин графа - K - число вершин графа, которое обрабатывает одно функциональное устройство

На следующих графиках результаты тестовых прогонов задачи бенчмарка Graph500 при различных значениях параметров N, M и K. Графики показывают зависимость коэффициента параллелизма вычислительной системы от времени выполнения теста.

результаты моделирования теста graph500 при n = 100 (максимально 57 иу задействовано), t = 13102, d = 228,768176408621

Рисунок 26 - Результаты моделирования теста Graph500 при N = 100 (максимально 57 ИУ задействовано), T = 13102, D = 228,768176408621.

результаты моделирования теста graph500 при n = 50, t = 13110, d = 227,085797409818

Рисунок 27 - Результаты моделирования теста Graph500 при N = 50, T = 13110, D = 227,085797409818

По результатам моделирования могут быть построены графики зависимости времени выполнения теста и дисперсии от числа ядер в dataflow-ВС (см. Таблица 29 и Рисунок 86).

Таблица 4. Зависимость времени выполнения и дисперсии теста Graph500 от числа ядер

N

T

D

1

221747

0

2

111097

0,004007322

5

46383

0,592867836

10

25890

7,814802056

15

19586

27,15531038

20

16642

58,18736677

30

14162

135,1538952

40

13302

200,9084474

50

13110

227,0857974

100

13102

228,7681764

, 29 - время выполнения и дисперсия от числа задействованных в вп иу для теста graph500

Рисунок 28, 29 - Время выполнения и дисперсия от числа задействованных в ВП ИУ для теста Graph500

На рисунках ниже приведен расчет выходных характеристик моделируемой вычислительной системы:

    - зависимость модельного времени (T) выполнения теста от числа исполнительных ядер и от числа функциональных устройств - зависимость среднего коэффициента параллелизма (P) от числа исполнительных ядер и от числа функциональных устройств - зависимость дисперсии среднего коэффициента параллелизма (D) от числа исполнительных ядер и от числа функциональных устройств - зависимость коэффициента использования аппаратуры (A) от числа исполнительных ядер и от числа функциональных устройств
зависимость времени выполнения (t) от числа исполнительных (rd) и виртуальных устройств (fu)

Рисунок 30. Зависимость времени выполнения (T) от числа исполнительных (Rd) и виртуальных устройств (Fu).

зависимость коэффициента параллелизма p от числа исполнительных (rd) и виртуальных устройств (fu)

Рисунок 31. Зависимость коэффициента параллелизма P от числа исполнительных (Rd) и виртуальных устройств (Fu).

зависимость дисперсии (d) среднего коэффициента параллелизма p от числа исполнительных (rd) и виртуальных устройств (fu)

Рисунок 32. Зависимость дисперсии (D) среднего коэффициента параллелизма P от числа исполнительных (Rd) и виртуальных устройств (Fu).

зависимость коэффициента использования оборудования (a) от числа исполнительных (rd) и виртуальных устройств (fu)

Рисунок 33. Зависимость коэффициента использования оборудования (A) от числа исполнительных (Rd) и виртуальных устройств (Fu).

Наиболее оптимальное число ядер для данных параметров моделирования - 10-20 шт. По критерию "время исполнения (T)" оптимальное число - 15. По критерию "дисперсия (D)" - 20. После 20 ИУ время выполнения тестового набора Graph500 изменяется незначительно.

Похожие статьи




Тестовые прогоны на модели ОА-архитектуры dataflow-ВС задач бенчмарка GRAPH500 на основе алгоритмов решения теоретико-графовых задач - Преимущества применения dataflow-парадигмы в вычислительных системах

Предыдущая | Следующая