pyopenCL，openCL，无法在GPU上构建程序

platform = cl.get_platforms()[0] device = platform.get_devices()[1] # Get the GPU ID ctx = cl.Context([device]) # Tell CL to use GPU queue = cl.CommandQueue(ctx) # Create a command queue for the target device. # program = cl.Program(ctx, kernelsource).build() print platform.get_devices()

kernelsource = """ __kernel void trajectories( // TODO: adjust argtypes above if this is changed const int N, const int dim, __constant float* data, const int nrParticles, __global float* pos, __global float* vel, const int nrSteps, __global float* trj, __global float* sigarr, const float sigma, const float mass, const float alpha, // alpha is resistance in reverse. const float dt ){ int i,k,step; float h, sigsum, hexp; int pidx = get_global_id(0); // global ID used as particle index int ofs = pidx * nrSteps * dim; int accofs = ofs + (nrSteps-1) * dim; // use last trj point to tmp store acc vector float v[dim]; float sigma2 = sigma*sigma; float m = mass / sigma2; float dt_over_m = dt /m; for(step=0; step<nrSteps; step++){ for(k=0; k<dim; k++) { trj[accofs+k]=0; } for(i=0; i<N; i++) { h=0; // to store ||data[i]-x||**2 for(k=0; k<dim; k++) { v[k] = pos[pidx*dim+k] - data[i*dim + k]; h += v[k]*v[k]; //h == force1p_sum }; hexp = exp(-h/sigma2)/sigma2; for(k=0; k<dim; k++) { trj[accofs+k] += -(hexp) * v[k]; }; }; sigsum = 0; for(k=0; k<dim; k++) { vel[pidx*dim+k] = alpha * vel[pidx*dim+k] + dt_over_m * trj[accofs+k]; // vel = alpha*vel + acc*dt pos[pidx*dim+k] += dt * vel[pidx*dim+k]; // pos = pos + vel*dt sigsum += vel[pidx*dim+k] * vel[pidx*dim+k]; // v^2 for kinetic energy trj[ofs+step*dim+k] = pos[pidx*dim+k]; // write to result vector }; sigarr[pidx*nrSteps+step] = sigsum; // sig = | vel | } for(step=0; step<nrSteps-2; step++) { sigarr[pidx*nrSteps+step] = sigarr[pidx*nrSteps+step+2] - sigarr[pidx*nrSteps+step+1]; }; sigarr[pidx*nrSteps+nrSteps-1] = sigarr[pidx*nrSteps+nrSteps-2] = 0; } """

1条回答

网友

1楼 · 发布于 2024-04-19 03:11:05

在这种情况下，您应该尝试查询生成的错误。对于类似的内核代码错误，您可以做的另一件事是可以使用脱机编译器。每个OpenCL实现者都有离线编译器。在

您可以在这里找到Intel的OpenCL脱机编译器：https://software.intel.com/en-us/articles/programming-with-the-intel-sdk-for-opencl-applications-development-tools

AMD有一个叫做CodeXL的工具，在这个工具中你也可以进行离线编译，看看你的内核代码是否可以编译。在

下面是ARM OpenCL脱机编译器：https://developer.arm.com/products/software-development-tools/graphics-development-tools/mali-offline-compiler/downloads

Intel支持OpenCL2.1，而ARM支持1.1。因此，您可以选择它们中的任何一个来编译内核代码，以便轻松地发现错误或错误。在

内核中的问题如下：

float v[dim];

OpenCL C规范不允许可变长度数组，脱机编译器给出以下错误：

^{pr2}$

您可以修复这行代码来克服错误，从现在开始，您可以检查您的内核是否可以用脱机编译器编译。在

编辑：在规范中，有一个脚注解释了不支持可变长度数组。你可以在这里看到：

https://www.khronos.org/registry/OpenCL/specs/opencl-2.0-openclc.pdf#page=31

相关问题更多 >

编程相关推荐

热门问题

热门文章