在C++中编写OpenCL主机程序时,使用以下API调用OpenCL内核:
cl_int clEnqueueNDRangeKernel ( cl_command_queue command_queue,
cl_kernel kernel,
cl_uint work_dim,
const size_t *global_work_offset,
const size_t *global_work_size,
const size_t *local_work_size,
cl_uint num_events_in_wait_list,
const cl_event *event_wait_list,
cl_event *event)
这里第三个参数设置工作维度。在python中使用pyopencl,我们将内核作为程序的一部分称为:
^{pr2}$例如:
event = program.square( queue, A.shape, None,
A_buf, B_buf, cl.LocalMemory( A.size), np.int32(COUNT) )
那么,如何使用pyopencl在python中显式地设置“work_dim”?在
相关问题 更多 >
编程相关推荐