Примеры использования OpenMP

Содержание

1. Примеры использования OpenMP
2. Вычисление определенного интеграла
3. Метод прямоугольников
4. Последовательность выполненияПоследовательная версия. Базовая реализация алгоритма интегрирования
5. Базовый алгоритмДолжен содержать код, несколько раз запускающий
6. Распараллеливание базового алгоритмаГеометрическая декомпозиция данных (разделение данных
7. Геометрическая декомпозиция данныхПо столбцамПо строкамБлочно123
8. Оптимизация базового алгоритмаПредварительное вычисление сложных математических функций
9. Распараллеливание оптимизированного алгоритмаРаспараллеливание с учетом уже полученных
10. Пример выполнения вычислений
11. Структура программыmain()experiment()integral()
12. Пример выполнения вычисленийБазовый алгоритм
13. Основная программаint main () { int i;
14. Функция experimentdouble experiment(double *res) { double stime,
15. Функция integralvoid integral(const double a1, const double
16. Пример выполнения вычисленийБазовый алгоритм - распараллеливание
17. Распараллеливание по столбцам#pragma omp parallel for for(i
18. Распараллеливание по столбцам с учетом data race#pragma omp
19. Распараллеливание по строкамfor(i = 0; i <
20. Блочное разделение данных omp_set_nested(true);#pragma omp parallel forfor
21. Результаты вычислений
22. Влияние параметров распараллеливания циклов
23. Пример выполнения вычисленийОптимизированный алгоритм – распараллеливание
24. Использование предварительных вычислений сложных функций void integral(const
25. Результаты вычислений
26. Загрузка ядер процессораПоследовательный алгоритм Оптимизированный параллельный алгоритм Параллельный алгоритм
27. Пример выполнения вычисленийВычисление интеграла методом Монте-Карло
28. Метод Монте-Карло
29. Функция integralvoid integral(const double a1, const double
30. Вычисление значений функции#define nMax 1000000#define Mrand 10000#define
31. Скачать презентанцию

Вычисление определенного интеграла

Главная
Разное
Примеры использования OpenMP

Слайды и текст этой презентации

Слайд 1Примеры использования OpenMP

Слайд 2 Вычисление определенного интеграла

Слайд 3Метод прямоугольников

Слайд 4Последовательность выполнения
Последовательная версия.
Базовая реализация алгоритма интегрирования
Эффект применения компилятора

Использование предварительных вычислений сложных функций
Алгоритмическая оптимизация
Параллельная версия.
Варианты распараллеливание базового

алгоритма
Распараллеливание оптимизированного алгоритма

Последовательность выполненияПоследовательная версия. Базовая реализация алгоритма интегрирования Эффект применения компилятора Использование предварительных вычислений сложных функцийАлгоритмическая оптимизацияПараллельная версия.

Слайд 5Базовый алгоритм
Должен содержать код, несколько раз запускающий тестируемую реализацию алгоритма

вычислений.
Должен вычислять минимальное, максимальное и среднее времена ее работы.
Должен представлять

результаты вычислений.
Параметры вычислений задаются в программе.
Провести анализ использования разных режимов компиляции.

Базовый алгоритмДолжен содержать код, несколько раз запускающий тестируемую реализацию алгоритма вычислений.Должен вычислять минимальное, максимальное и среднее времена

Слайд 6Распараллеливание базового алгоритма
Геометрическая декомпозиция данных (разделение данных на части и

применение к ним одного и того же алгоритма).
Локализация данных.
Анализ результатов

(гонка данных).

Распараллеливание базового алгоритмаГеометрическая декомпозиция данных (разделение данных на части и применение к ним одного и того же

Слайд 7Геометрическая декомпозиция данных
По столбцам
По строкам
Блочно
1
2
3

Слайд 8Оптимизация базового алгоритма
Предварительное вычисление сложных математических функций (sin, cos, exp

и др.).
Алгоритмическая оптимизация (исключение многократного вычисления одних и тех же

данных, предварительные расчеты).
Буферизация.

Оптимизация базового алгоритмаПредварительное вычисление сложных математических функций (sin, cos, exp и др.).Алгоритмическая оптимизация (исключение многократного вычисления одних

Слайд 9Распараллеливание оптимизированного алгоритма
Распараллеливание с учетом уже полученных результатов:
В данной задаче

наилучшие результаты дает распараллеливание с разделением сетки интегрирования по столбцам

(внешний цикл).
Распараллелить основные вычислительные циклы.

Распараллеливание оптимизированного алгоритмаРаспараллеливание с учетом уже полученных результатов:В данной задаче наилучшие результаты дает распараллеливание с разделением сетки

Слайд 10 Пример выполнения вычислений

Слайд 11Структура программы
main()
experiment()
integral()

Слайд 12 Пример выполнения вычислений
Базовый алгоритм

Слайд 13Основная программа
int main () {
int i;
double time, res,

min_time, max_time, avg_time;
int numbExp = 10;
min_time = max_time = avg_time

= experiment(&res);
for(i = 0; i < numbExp - 1; i ++) {
time = experiment(&res);
avg_time += time;
if(max_time < time) max_time = time;
if(min_time > time) min_time = time; }
printf(“Интеграл равен: %lf; \n", res);
printf(«Время выполнения: %lf; %lf; %lf \n",
avg_time / numbExp, min_time, max_time);
return 0;
}

$Основная программаint main () { int i; double time, res, min_time, max_time, avg_time;int numbExp = 10;min_time =$

Слайд 14Функция experiment
double experiment(double *res)
{
double stime, ftime;
double a1

= 0.0 ;
double a1 = a2 = 0.0 ;

double b1 = 16.0;
double b2 = 16.0;
double h = 0.001;
stime = omp_get_wtime( );
integral(a1, b1, a2, b2, h, res);
ftime = omp_get_wtime( );
return (ftime - stime);
}

Функция experimentdouble experiment(double *res) { double stime, ftime; double a1 = 0.0 ; double a1 = a2

Слайд 15Функция integral
void integral(const double a1, const double b1,
const double a2,

const double b2, const double h,
double *res){
int i, j, n1,

n2; double sum, x, y;
n1 = (int)((b1 - a1) / h); n2 = (int)((b2 - a2) / h);
sum = 0.0;
for( i = 0; i < n1; i++) {
for(j = 0; j < n2; j++) {
x = a1 + i * h + h / 2;
y = a2 + j * h + h / 2;
sum += ((exp(sin(x * PI) * cos(y * PI)) + 1) / ((b1 - a1) * (b2 - a2))) * h * h; } }
*res = sum;
}

Функция integralvoid integral(const double a1, const double b1,const double a2, const double b2, const double h,double *res){int

Слайд 16 Пример выполнения вычислений
Базовый алгоритм - распараллеливание

Слайд 17Распараллеливание по столбцам
#pragma omp parallel for
for(i = 0; i

< n1; i++)
{
for(j

= 0; j < n2; j++)
{
x = a1 + i * h + h / 2;
y = a2 + j * h + h / 2;
sum += ((exp(sin(x * PI) * cos(y * PI)) + 1) / ((b1 - a1) *
(b2 - a2))) * h * h;
}
}

Распараллеливание по столбцам#pragma omp parallel for for(i = 0; i < n1; i++) {

Слайд 18Распараллеливание по столбцам с учетом data race
#pragma omp parallel for private

(x, y, j)

reduction(+: sum)
for(i = 0; i < n1; i++)
{
for(j = 0; j < n2; j++)
{
x = a1 + i * h + h / 2;
y = a2 + j * h + h / 2;
sum += ((exp(sin(x * PI) * cos(y * PI)) + 1) / ((b1 - a1) *
(b2 - a2))) * h * h;
}
}

Слайд 19Распараллеливание по строкам
for(i = 0; i < n1; i++)

{
#pragma omp parallel for private (x, y)

reduction(+: sum)
for(j = 0; j < n2; j++)
{
x = a1 + i * h + h / 2;
y = a2 + j * h + h / 2;
sum += ((exp(sin(x * PI) * cos(y * PI)) + 1) / ((b1 - a1) *
(b2 - a2))) * h * h;
}
}

Распараллеливание по строкамfor(i = 0; i < n1; i++) { #pragma omp parallel for private (x,

Слайд 20Блочное разделение данных
omp_set_nested(true);
#pragma omp parallel for
for (i = 0;

i < n1; i++)
{
#pragma omp parallel for private (x, y)

reduction(+: sum)
for(j = 0; j < n2; j++)
{
x = a1 + i * h + h / 2;
y = a2 + j * h + h / 2;
sum += ((exp(sin(x * PI) * cos(y * PI)) + 1) /
((b1 - a1) * (b2 - a2))) * h * h;
}
}

$Блочное разделение данных omp_set_nested(true);#pragma omp parallel forfor (i = 0; i < n1; i++){#pragma omp parallel for$

Слайд 21Результаты вычислений

Слайд 22Влияние параметров распараллеливания циклов

Слайд 23 Пример выполнения вычислений
Оптимизированный алгоритм –

распараллеливание

Слайд 24Использование предварительных вычислений сложных функций
void integral(const double a1, const

double b1,
const double a2, const double b2, const double h,

double *res) { int i, j, n1, n2; double sum, x, y, *sinx, *cosy; n1 = (int)((b1 - a1) / h);
n2 = (int)((b2 - a2) / h); sum = 0.0;
sinx = new double [n1]; cosy = new double [n2];
for(i = 0; i < n1; i++)
{ x = a1 + i * h + h / 2; sinx[i] = sin(x * PI); }
for(j = 0; j < n2; j++)
{ y = a2 + j * h + h / 2; cosy[j] = cos(y * PI); }
for(i = 0; i < n1; i++)
{ for(j = 0; j < n2; j++) {sum += ((exp(sinx[i] * cosy[j]) + 1) / ((b1 - a1) * (b2 - a2))) * h * h; } } *res = sum;
delete [] sinx; delete [] cosy; }

Использование предварительных вычислений сложных функций void integral(const double a1, const double b1,const double a2, const double b2,

Слайд 25Результаты вычислений

Слайд 26Загрузка ядер процессора
Последовательный алгоритм
Оптимизированный параллельный алгоритм
Параллельный

алгоритм

Слайд 27 Пример выполнения вычислений
Вычисление интеграла методом Монте-Карло

Слайд 28Метод Монте-Карло

Слайд 29Функция integral
void integral(const double a1, const double b1, const double

a2, const double b2, const double h, double *res)

{
int n=0; double sum, x, y, f;
for(long int i=1;i<= nMax;i++) { x=abs((double)(rand()%((int)(b1 - a1)*Mrand))) /Mrand;
y=abs((double)(rand()% ((int)(b2 - a2)*Mrand)))/Mrand;
f=abs((double)(rand()% ((int)(Fmax*Mrand))))/Mrand;
if(func(x+a1, y+a2, a1, b1, a2, b2) <= f) n++; }
sum=(b1 - a1)*(b2 - a2)*(Fmax)*n/nMax;
*res = sum;
}

Функция integralvoid integral(const double a1, const double b1, const double a2, const double b2, const double h,

Слайд 30Вычисление значений функции
#define nMax 1000000
#define Mrand 10000
#define Fmax 0.015
double func(double

x, double y, const double a1, const double b1, const

double a2, const double b2)
{
return (exp(sin(x * PI) * cos(y * PI)) + 1)/ ((b1 - a1) * (b2 - a2));
}

Вычисление значений функции#define nMax 1000000#define Mrand 10000#define Fmax 0.015double func(double x, double y, const double a1, const

Скачать презентацию

Разделы презентаций

Примеры использования OpenMP

Содержание

Слайды и текст этой презентации

Слайд 1Примеры использования OpenMP

Слайд 2 Вычисление определенного интеграла

Слайд 3Метод прямоугольников

Слайд 4Последовательность выполненияПоследовательная версия. Базовая реализация алгоритма интегрирования Эффект применения компилятора

Использование предварительных вычислений сложных функцийАлгоритмическая оптимизацияПараллельная версия. Варианты распараллеливание базового

Слайд 5Базовый алгоритмДолжен содержать код, несколько раз запускающий тестируемую реализацию алгоритма

вычислений.Должен вычислять минимальное, максимальное и среднее времена ее работы.Должен представлять

Слайд 6Распараллеливание базового алгоритмаГеометрическая декомпозиция данных (разделение данных на части и

применение к ним одного и того же алгоритма).Локализация данных.Анализ результатов

Слайд 7Геометрическая декомпозиция данныхПо столбцамПо строкамБлочно123

Слайд 8Оптимизация базового алгоритмаПредварительное вычисление сложных математических функций (sin, cos, exp

и др.).Алгоритмическая оптимизация (исключение многократного вычисления одних и тех же

Слайд 9Распараллеливание оптимизированного алгоритмаРаспараллеливание с учетом уже полученных результатов:В данной задаче

наилучшие результаты дает распараллеливание с разделением сетки интегрирования по столбцам

Слайд 10 Пример выполнения вычислений

Слайд 11Структура программыmain()experiment()integral()

Слайд 12 Пример выполнения вычисленийБазовый алгоритм

Слайд 13Основная программаint main () { int i; double time, res,

min_time, max_time, avg_time;int numbExp = 10;min_time = max_time = avg_time

Слайд 14Функция experimentdouble experiment(double *res) { double stime, ftime; double a1

= 0.0 ; double a1 = a2 = 0.0 ;

Слайд 15Функция integralvoid integral(const double a1, const double b1,const double a2,

const double b2, const double h,double *res){int i, j, n1,

Слайд 16 Пример выполнения вычисленийБазовый алгоритм - распараллеливание

Слайд 17Распараллеливание по столбцам#pragma omp parallel for for(i = 0; i

< n1; i++) { for(j

Слайд 18Распараллеливание по столбцам с учетом data race#pragma omp parallel for private