并行程序之OpenMP使用简析(1)
ps.再次声明:本文的示例代码来自于 Introduction to Parallel Programming (Peter Pacheco), 并在对原文翻译的基础上归纳了一些个人观点。
OpenMP是基于共享式内存的API,这里的MP不同于MPI中的MP,而是multiprocessing的意思。
而且,不像MPI和Pthread,你只要link一下它们的库文件就搞定了,使用OpenMP的程序能否编译,还要看编译器支不支持。
#include <stdio.h>
#include <stdlib.h>
#include <omp.h>
void Hello(void); /* Thread function */
int main(int argc, char argv[]){
/* Get number of threads from command line */
int thread_count = strtol(argv[1], NULL, 10);
# pragma omp parallel num_threads(thread_count)
Hello();
return 0;
}/* main */
void Hello(void){
int my_rank = omp_get_thread_num();
int thread count = omp_get_num_threads();
printf("Hello from thread %d of %dnn", my_rank, thread_count);
}/* Hello */
关键的一行在这里: # pragma omp parallel num_threads(thread_count)
有了这一行,OpenMP就会把下面一个block的代码看作是thread要并行执行的内容。
OpenMP用起来so easy,你不用像用Pthread的一样,一个一个地去join,但是用起来简单,它的灵活性就低了。
几个OpenMP里的问题
问:
OpenMP中的内存怎么避免数据竞争呢?怎么来规定临界区呢?
(这里稍微啰嗦地用一个例子解释一下数据竞争:
篮子里有11个苹果,小明想拿5个。就在小明掰开手指头发现手指头不够用的时候,小华拿走了11个苹果。10分钟后,小明用上脚趾头终于算出5<11, 苹果是够他拿的了,回头一看,咦,苹果呢???However, 小明执着地认为苹果没有消失,他在篮子里插了块牌子:此地有隐形的苹果6只。这个例子说明两线程同时进行写操作(都想修改苹果的个数)会导致数据上的竞争,产生错误)答:
用#pragma omp critical
定义临界区
问:
哪些变量是所有线程可见的呢?答:
谈到变量的可视范围(scope),OpenMP里非常简单,并行block前的变量是全局变量,如下列代码所示:
int a;
# pragma omp parallel
{
int c; //private variable
a++; //global variable
}
上一篇: 并行计算
下一篇: 《并行程序设计导论》03openmp