安装OpenMPI来配合C语言程序进行并行计算

安装OPENMPI
由于是实验,也不进行多机的配置了,只在虚拟机里安装吧。多个机器的配置可以参考此文
最简单的方法,apt安装

sudo apt-get install libcr-dev mpich2 mpich2-doc

测试
hello.c

/* C Example */
#include <mpi.h>
#include <stdio.h>

int main (int argc, char* argv[])
{
 int rank, size;

 MPI_Init (&argc, &argv);   /* starts MPI */
 MPI_Comm_rank (MPI_COMM_WORLD, &rank);    /* get current process id */
 MPI_Comm_size (MPI_COMM_WORLD, &size);    /* get number of processes */
 printf( "Hello world from process %d of %d\n", rank, size );
 MPI_Finalize();
 return 0;
}

编译运行及显示结果

mpicc mpi_hello.c -o hello
mpirun -np 2 ./hello
Hello world from process 0 of 2
Hello world from process 1 of 2

正常出现结果表明没有问题,
看下openmpi的版本

mpirun --version
mpirun (Open MPI) 1.6.5
Report bugs to http://www.open-mpi.org/community/help/

MPI计算矩阵乘法

通过opemMPI加速矩阵乘法运算。采用主从模式,0号是master,其他是child(或者叫worker,as you wish)。

基本思路
两个矩阵A,B进行乘法运算,则A的行 i 乘以B的列 j 得出的数是新矩阵(i,j)坐标的数值。A(MN) B(NK)最后矩阵是M*K的,实验中M=N=K=1000,我也就没有明确区分MNK,全部用MATRIX_SIZE定义的。
最简单的思路就是每个worker分配(MATRIX_SIZE/(numprocess-1))个,然后如果有余下的,就分给余数对应的worker。比如MATRIX_SIZE=10,numprocess=4 则实际的worker有3个,每个人分3行,最后的一行给id是1的。可以很简单的利用循环类分配。最后Master收集所有的结果,并按照顺序组装起来就行。
每个worker的工作就是接收来自master的一行,和B矩阵运算,得出新一行的结果,然后发送回master

代码
多加了很多注释来解释,函数的说明下一节解释下。

#include <mpi.h>
#include <stdio.h>
#define MATRIX_SIZE 10
#define FROM_MASTER 1 //这里的类型可以区分消息的种类,以便区分worker发送来的结果
#define FROM_CHILD 2
#define MASTER 0
MPI_Status status;
int myid,numprocess;
//最终保存的结果
int ans [MATRIX_SIZE*MATRIX_SIZE];
int A[MATRIX_SIZE*MATRIX_SIZE],B[MATRIX_SIZE*MATRIX_SIZE];
//读取文件,注意读取文件要放在master里,不然会读两遍,出现错误
void readFile(){
  FILE* fina,*finb;
  fina=fopen("a.txt","r");
  int i;
  for (i = 0; i < MATRIX_SIZE*MATRIX_SIZE ; ++i)
  {
    fscanf(fina,"%d ",&A[i]);
  }
  fclose(fina);
  finb=fopen("b.txt","r");
  for(i=0;i<MATRIX_SIZE*MATRIX_SIZE;i++)
    fscanf(finb,"%d ",&B[i]);
  fclose(finb);
  printf("read file ok\n");
}
int master(){
  int workid,dest,i,j;
  printf("numprocess %d\n",numprocess );
  //给每个worker发送B矩阵过去
  for(i=0;i<numprocess-1;i++){
    //send B matrix
    MPI_Send(&B,MATRIX_SIZE*MATRIX_SIZE,MPI_INT,i+1,FROM_MASTER,MPI_COMM_WORLD);
  }
  //开始给每个worker分配任务,取模即可
  for (i = 0; i < MATRIX_SIZE; i++)
  {
    //attention: num of workers is numprocess-1
    workid=i%(numprocess-1)+1;
    //send single line in A
    MPI_Send(&A[i*MATRIX_SIZE],MATRIX_SIZE,MPI_INT,workid,FROM_MASTER,MPI_COMM_WORLD);
  }

  //等待从worker发送来的数据
  int tempLine[MATRIX_SIZE];
  for (i = 0; i < MATRIX_SIZE*MATRIX_SIZE; i++)
  {
    ans[i]=0;
  }
  for (i = 0; i < MATRIX_SIZE; ++i)
  {
    int myprocess=i%(numprocess-1)+1;
    printf("Master is waiting %d\n",myprocess);
    //receive every line from every process
    MPI_Recv(&tempLine,MATRIX_SIZE,MPI_INT,myprocess,FROM_CHILD,MPI_COMM_WORLD,&status);
    //发送过来的都是计算好了的一行的数据,直接组装到ans里就行
    for(j=0;j<MATRIX_SIZE;j++){
      ans[MATRIX_SIZE*i+j]=tempLine[j];
    }
    printf("Master gets %d\n",i);
  }

  for(i=0;i<MATRIX_SIZE*MATRIX_SIZE;i++){
    printf("%d ",ans[i] );
    if(i%MATRIX_SIZE==(MATRIX_SIZE-1))printf("\n");
  }
  printf("The Master is out\n");

}
int worker(){
  int mA[MATRIX_SIZE],mB[MATRIX_SIZE*MATRIX_SIZE],mC[MATRIX_SIZE];
  int i,j,bi;
  MPI_Recv(&mB,MATRIX_SIZE*MATRIX_SIZE,MPI_INT,MASTER,FROM_MASTER,MPI_COMM_WORLD,&status);
  //接收来自master的A的行
  for(i=0;i<MATRIX_SIZE/(numprocess-1);i++){
    MPI_Recv(&mA,MATRIX_SIZE,MPI_INT,MASTER,FROM_MASTER,MPI_COMM_WORLD,&status);
    //矩阵乘法,A 的一行和B矩阵相乘
    for(bi=0;bi<MATRIX_SIZE;bi++){
      mC[bi]=0;
      for(j=0;j<MATRIX_SIZE;j++){
        mC[bi]+=mA[j]*mB[bi*MATRIX_SIZE+j];
      }
    }
    MPI_Send(&mC,MATRIX_SIZE,MPI_INT,MASTER,FROM_CHILD,MPI_COMM_WORLD);
  }
  //如果处于余数范围内,则需要多计算一行
  if(MATRIX_SIZE%(numprocess-1)!=0){
    if (myid<=(MATRIX_SIZE%(numprocess-1)))
    {
      MPI_Recv(&mA,MATRIX_SIZE,MPI_INT,MASTER,FROM_MASTER,MPI_COMM_WORLD,&status);
      for(bi=0;bi<MATRIX_SIZE;bi++){
        mC[bi]=0;
        for(j=0;j<MATRIX_SIZE;j++){
          mC[bi]+=mA[j]*mB[bi*MATRIX_SIZE+j];
        }
      }
      MPI_Send(&mC,MATRIX_SIZE,MPI_INT,MASTER,FROM_CHILD,MPI_COMM_WORLD);
    }
  }
  printf("The worker %d is out\n",myid);
}
int main(int argc, char **argv)
{
  MPI_Init (&argc, &argv);
  MPI_Comm_rank(MPI_COMM_WORLD,&myid);
  MPI_Comm_size(MPI_COMM_WORLD,&numprocess);

  if(myid==MASTER){
    readFile();
    master();
  }
  if(myid>MASTER){
    worker();
  }

  MPI_Finalize();
  return 0;
}

OPENMPI简单函数介绍
针对实验用到的几个函数进行说明。
MPI为程序员提供一个并行环境库,程序员通过调用MPI的库程序来达到程序员所要达到的并行目的,可以只使用其中的6个最基本的函数就能编写一个完整的MPI程序去求解很多问题。这6个基本函数,包括启动和结束MPI环境,识别进程以及发送和接收消息:
理论上说,MPI所有的通信功能可以用它的六个基本的调用来实现:

  • MPI_INIT 启动MPI环境
  • MPI_COMM_SIZE 确定进程数
  • MPI_COMM_RANK 确定自己的进程标识符
  • MPI_SEND 发送一条消息
  • MPI_RECV 接收一条消息
  • MPI_FINALIZE 结束MPI环境

初始化和结束

MPI初始化:通过MPI_Init函数进入MPI环境并完成所有的初始化工作。

int MPI_Init( int *argc, char * * * argv )

MPI结束:通过MPI_Finalize函数从MPI环境中退出。

int MPI_Finalize(void)

获取进程的编号
调用MPI_Comm_rank函数获得当前进程在指定通信域中的编号,将自身与其他程序区分。

int MPI_Comm_rank(MPI_Comm comm, int *rank)

获取指定通信域的进程数
调用MPI_Comm_size函数获取指定通信域的进程个数,确定自身完成任务比例。

int MPI_Comm_size(MPI_Comm comm, int *size)

MPI消息
一个消息好比一封信
消息的内容的内容即信的内容,在MPI中成为消息缓冲(Message Buffer)
消息的接收发送者即信的地址,在MPI中成为消息封装(Message Envelop)
MPI中,消息缓冲由三元组<起始地址,数据个数,数据类型>标识
消息信封由三元组<源/目标进程,消息标签,通信域>标识

消息发送

MPI_Send函数用于发送一个消息到目标进程。

int MPI_Send(void *buf, int count, MPI_Datatype dataytpe, int dest, int tag, MPI_Comm comm)

buf是要发送数据的指针,比如一个A数组,可以直接&A,count则是数据长度,datatype都要改成MPI的type。dest就是worker的id了。tag则可以通过不同的type来区分消息类型,比如是master发送的还是worker发送的。

消息接收

MPI_Recv函数用于从指定进程接收一个消息

 int MPI_Recv(void *buf, int count, MPI_Datatype datatyepe,int source, int tag, MPI_Comm comm, MPI_Status *status)

编译和执行
生成执行文件data

mpicc -o programname programname.c

一个MPI并行程序由若干个并发进程组成,这些进程可以相同也可以不同。MPI只支持静态进程创建,即:每个进程在执行前必须在MPI环境中登记,且它们必须一起启动。通常启动可执行的MPI程序是通过命令行来实现的。启动方法由具体实现确定。例如在MPICH实现中通过下列命令行可同时在独立的机器上启动相同的可执行程序:

 mpirun –np N programname

其中N是同时运行的进程的个数,programname是可执行的MPI程序的程序名。

(0)

相关推荐

  • C语言中计算二叉树的宽度的两种方式

    C语言中计算二叉树的宽度的两种方式 二叉树作为一种很特殊的数据结构,功能上有很大的作用!今天就来看看怎么计算一个二叉树的最大的宽度吧. 采用递归方式 下面是代码内容: int GetMaxWidth(BinaryTree pointer){ int width[10];//加入这棵树的最大高度不超过10 int maxWidth=0; int floor=1; if(pointer){ if(floor==1){//如果访问的是根节点的话,第一层节点++; width[floor]++; flo

  • C语言简单实现计算字符个数的方法

    本文实例讲述了C语言简单实现计算字符个数的方法.分享给大家供大家参考.具体如下: char_counting.c如下: #include<stdio.h> int main() { long nc; nc = 0; while(getchar() != '0') { ++nc; } printf("%ld\n", nc); } 编译和使用下: 复制代码 代码如下: gcc char_counting.c -o char_counting.o 一种通常的调用方式: 复制代码

  • C语言 坐标移动详解及实例代码

    题目描述 开发一个坐标计算工具, A表示向左移动,D表示向右移动,W表示向上移动,S表示向下移动.从(0,0)点开始移动,从输入字符串里面读取一些坐标,并将最终输入结果输出到输出文件里面. 输入: 合法坐标为A(或者D或者W或者S) + 数字(两位以内) 坐标之间以;分隔. 非法坐标点需要进行丢弃.如AA10;  A1A;  $%$;  YAD; 等. 下面是一个简单的例子 如: A10;S20;W10;D30;X;A1A;B10A11;;A10; 处理过程: 起点(0,0) + A10 = (

  • 北邮计算机考研复试题的C语言解答精选

    二进制数 题目 题目描述:      大家都知道,数据在计算机里中存储是以二进制的形式存储的.      有一天,小明学了C语言之后,他想知道一个类型为unsigned int 类型的数字,存储在计算机中的二进制串是什么样子的.      你能帮帮小明吗?并且,小明不想要二进制串中前面的没有意义的0串,即要去掉前导0.      输入:      第一行,一个数字T(T<=1000),表示下面要求的数字的个数.      接下来有T行,每行有一个数字n(0<=n<=10^8),表示要求的

  • c语言计算三角形面积代码

    复制代码 代码如下: //面积公式s = (a+b+c) / 2   area = sqrt(s * (s - a) * (s - b) * (s - c));//小作业 求三角形的面积 int check(double a);int check2(double a, double b, double c); #include <stdio.h>#include <math.h>int main(void){    double area = 0;    double s;   

  • C语言科学计算入门之矩阵乘法的相关计算

    1.矩阵相乘 矩阵相乘应满足的条件: (1) 矩阵A的列数必须等于矩阵B的行数,矩阵A与矩阵B才能相乘: (2) 矩阵C的行数等于矩阵A的行数,矩阵C的列数等于矩阵B的列数: (3) 矩阵C中第i行第j列的元素等于矩阵A的第i行元素与矩阵B的第j列元素对应乘积之和,即 如: 则: 2. 常用矩阵相乘算法     用A的第i行分别和B的第j列的各个元素相乘求和,求得C的第i行j列的元素,这种算法中,B的访问是按列进行访问的,代码如下: void arymul(int a[4][5], int b[

  • C语言中计算正弦的相关函数总结

    C语言sin()函数:正弦函数 头文件: #include <math.h> sin() 函数用来求给定值的正弦值,其原型为: double sin(double x); [参数]给定的值(弧度). [返回值]返回-1 至1 之间的计算结果. 弧度与角度的关系为: 弧度 = 180 / π 角度 角度 = π / 180 弧度 使用 rtod( ) 函数可以将弧度值转换为角度值. 注意,使用 GCC 编译时请加入-lm. 举例如下: #include <stdio.h> #incl

  • C语言实现直角坐标转换为极坐标的方法

    本文实例讲述了C语言实现直角坐标转换为极坐标的方法.分享给大家供大家参考,具体如下: #include<stdio.h> #include<math.h> struct complex_s{ double x,y; }; double real_part(struct complex_s z){ return z.x; } double img_part(struct complex_s z){ return z.y; } double magnitude(struct compl

  • C语言实现计算树的深度的方法

    本文实例讲述了C语言实现计算树的深度的方法.是算法设计中常用的技巧.分享给大家供大家参考.具体方法如下: /* * Copyright (c) 2011 alexingcool. All Rights Reserved. */ #include <iostream> using namespace std; struct Node { Node(int i = 0, Node *l = NULL, Node *r = NULL) : data(i), left(l), right(r) {}

  • C语言求幂计算的高效解法

    本文实例演示了C语言求幂计算的高效解法.很有实用价值.分享给大家供大家参考.具体方法如下: 题目如下: 给定base,求base的幂exp 只考虑基本功能,不做任何边界条件的判定,可以得到如下代码: #include <iostream> using namespace std; int cacExp(int base, int exp) { int result = 1; int theBase = 1; while (exp) { if (exp & 0x01) result =

  • C语言中字符的输入输出以及计算字符个数的方法详解

    C语言字符输入与输出 标准库提供的输入/输出模型非常简单.无论文本从何处输入,输出到何处,其输入/输出都是按照字符流的方式处理.文本流是由多行字符构成的字符序列,而每行字符则由 0 个或多个字符组成,行末是一个换行符.标准库负责使每个输入/输出流都能够遵守这一模型.使用标准库的 C 语言程序员不必关心在程序之外这些行是如何表示的. 标准库提供了一次读/写一个字符的函数,其中最简单的是 getchar 和 putchar 两个函数.每次调用时,getchar 函数从文本流中读入下一个输入字符,并将

随机推荐

其他