麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 學院 > 開發設計 > 正文

cuda《學習筆記三》——共享內存和同步

2019-11-14 08:47:14
字體:
來源:轉載
供稿:網友

一、前言

       本文介紹CUDA編程的共享內存和同步。共享內存中的變量(核函數中用__shared__聲明),在GPU上啟動的每個線程塊,編譯器都創建該變量的副本,若啟動N個線程塊,則有N個該變量副本,為每個線程塊私有;同步則是使線程塊中所有的線程能夠在執行完某些語句后,才執行后續語句。

二、線程塊、線程索引

以下為線程塊與線程的層次結構圖

      

       每個線程均獨自執行核函數,若在核函數中聲明共享變量,則每個線程塊均擁有該變量的一個副本,且該副本為該程序塊內的所有線程所共享。

三、共享變量和同步例子

(1)以下程序實現了點積運算,計算公式為 f(n) = 1+2*2+ 3*3+ … (n-1)*(n-1),使用共享變量計算各個程序塊內所有線程的求和運算結果。

#include <cuda_runtime.h>  #include <iostream>  //main1.cu#include "book.h"using namespace std;#define N 33*1024          //數組長度const int threadsPerBlock = 64;   //每個線程塊的線程數量const int blocksPerGrid = 64;     //第一維線程格內線程數量__global__ void add(float *a, float *b, float *c){	__shared__ float cache[threadsPerBlock];         //__shared__聲明共享變量,每個線程塊均有自己的副本,被其所有	                                                 //線程共享,這里用于存放每個線程塊內各個線程所計算得的點積和	int index =threadIdx.x + blockIdx.x *blockDim.x;    //將線程塊、線程索引轉換為數組的索引	int cacheIdx = threadIdx.x;	float temp = 0;	while (index < N){		temp += a[index] * b[index];		index += gridDim.x * blockDim.x;	}	cache[cacheIdx] = temp;      //存放每個線程塊內各個線程所計算得的點積和	__syncthreads();               //cuda內置函數,使所有線程均執行完該命令前代碼,才執行后面語句,也即保持同步	                               //目的為獲得各個cache副本,此時共有64個cache副本		//規約運算,將每個cache副本求和,結果保存于cache[0]	int i = blockDim.x / 2;	while (i != 0){		if (cacheIdx < i){			cache[cacheIdx] += cache[i + cacheIdx];		}		__syncthreads();    //所有線程完成一次規約運算,方可進行下一次		i /= 2;	}	if (cacheIdx == 2)     //一個操作只需一個線程完成即可		c[blockIdx.x] = cache[0]; //所有副本的cache[0] 存放于數組c}int main(){	float a[N], b[N];	float *c = new float[blocksPerGrid];	float *dev_a, *dev_b, *dev_c;	//gpu上分配內存	HANDLE_ERROR(cudaMalloc((void**)&dev_a, N*sizeof(float)));	HANDLE_ERROR(cudaMalloc((void**)&dev_b, N*sizeof(float)));	HANDLE_ERROR(cudaMalloc((void**)&dev_c, N*sizeof(float)));	//為數組a,b初始化	for (int i = 0; i < N; ++i){		a[i] = i;		b[i] = i;	}	//講數組a,b數據復制至gpu	(cudaMemcpy(dev_a, a, N*sizeof(float), cudaMemcpyHostToDevice));	(cudaMemcpy(dev_b, b, N*sizeof(float), cudaMemcpyHostToDevice));		add <<< blocksPerGrid, threadsPerBlock >> >(dev_a, dev_b, dev_c);	//將數組dev_c復制至cpu	HANDLE_ERROR(cudaMemcpy(c, dev_c, blocksPerGrid*sizeof(float), cudaMemcpyDeviceToHost));		//進一步求和	double sums = 0.0;	for (int i = 0; i < blocksPerGrid; ++i){		sums += c[i];	}	//顯示結果	cout << "gpu dot compute result:" << sums << "/n";	sums = 0.0;	for (int i = 0; i < N; ++i){		sums += i*i;	}	cout << "cpu dot compute result:" << sums << "/n";	//釋放在gpu分配的內存	cudaFree( dev_a);	cudaFree(dev_b);	cudaFree(dev_c);	delete c;	return 0;}

運行結果

(2)以下程序使用二維程序塊共享變量計算圖像數據,生成圖像

//main2.cu#include <cuda_runtime.h>  #include <iostream>  #include "book.h"#include <opencv2/opencv.hpp>using namespace cv;using namespace std;#define PI 3.1415926#define DIM 1024       //灰度圖像的長與寬__global__ void kernel(uchar * _ptr ){	int x = threadIdx.x + blockIdx.x * blockDim.x;	int y = threadIdx.y + blockIdx.y * blockDim.y;	int idx = x + y *gridDim.x *blockDim.x;	__shared__ float shared [16][16] ;   //每個線程塊中每個線程的共享內存緩沖區	const float period = 128.0f;	shared[threadIdx.x][threadIdx.y] = 255 * (sinf(x*2.0f*PI / period) + 1.0f)*(sinf(y*2.0f*PI / period) + 1.0f) / 4.0f;	__syncthreads();   //使所有shared副本均被計算完成	_ptr[idx] = shared[15 - threadIdx.x][15 - threadIdx.y];}int main(){	Mat src(DIM,DIM , CV_8UC1 , Scalar::all(0));	uchar *ptr_dev;	HANDLE_ERROR(cudaMalloc((void**)&ptr_dev, DIM * DIM*sizeof(uchar)));	dim3 blocks(DIM / 16, DIM / 16);	dim3 threads(16 ,16);	kernel << < blocks, threads >> >( ptr_dev );	HANDLE_ERROR(cudaMemcpy(src.data, ptr_dev, DIM * DIM*sizeof(uchar), cudaMemcpyDeviceToHost));	cudaFree(ptr_dev);	namedWindow("Demo",  0);	imshow("Demo" , src);	waitKey(0);	return 0;}運行結果:


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 激情夜色 | 成熟女人特级毛片www免费 | 色播视频在线播放 | 久久激情免费视频 | 久久超 | 国产91精品久久久 | 日韩视频一区二区三区在线观看 | 欧美精品久久久久久久多人混战 | 一级大黄毛片 | 情侣啪啪网站 | 福利在线影院 | 性少妇videosexfreexx| 亚洲第一成网站 | 成人黄色短视频在线观看 | 国产色视频免费 | 奶子吧naiziba.cc免费午夜片在线观看 | 国产精品久久久久久久久久免 | 成人情欲视频在线看免费 | 欧美精品一区二区性色 | 操碰在线视频 | 成人在线网站 | 亚洲成人涩涩 | 天堂成人国产精品一区 | 国产免费久久久久 | 成人午夜免费国产 | 爱逼av| 视频一区二区国产 | 成人免费观看毛片 | 久久99国产综合精品 | 黄污网站在线观看 | 线观看免费完整aaa 一二区成人影院电影网 | 黄色片免费看网站 | 久久精品国产99久久6动漫亮点 | 国内精品久久久久久久久久 | 国产www免费| 成人午夜高清 | 禁漫天堂久久久久久久久久 | 91av视频大全 | 欧美大片一级毛片 | 欧美日韩国产一区二区三区在线观看 | 青青草在线免费观看 |