Обнаружение краев с использованием PyOpenCL - PullRequest
0 голосов
/ 28 мая 2020

У меня возникла проблема при написании python скрипта для обнаружения края с помощью PyOpenCl. Я новичок в OpenCL, и при попытке я столкнулся с проблемой, которую после многих настроек я не могу решить. ниже приведен код python:

edge.py:

import numpy as np
import pyopencl as cl
from PIL import Image
from time import time


def getKernel(krnl):
    kernel = open(krnl).read()
    return kernel


def findedges(p,d,image):

    data = np.asarray(image).astype(np.uint8)

    platform = cl.get_platforms()[p]
    device = platform.get_devices()[d]
    cntx = cl.Context([device])
    queue = cl.CommandQueue(cntx)

    mf = cl.mem_flags
    im = cl.Buffer(cntx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=data)
    out = cl.Buffer(cntx,mf.WRITE_ONLY,data.nbytes)

    prgm = cl.Program(cntx,getKernel('edge.c')%(data.shape[1],data.shape[0])).build()

    prgm.detectedge(queue,data.shape,None,im,out)

    result = np.empty_like(data)

    cl.enqueue_copy(queue,result,out)
    result = result.astype(np.uint8)
    print(result)

    img = Image.fromarray(result)
    #img.show()
    img.save('coinsedge.png')


if __name__ == '__main__':

    image = Image.open('coins.png')
    #(1,0) is my platform 1, device 0 = "AMD gpu"  
    #(0,0) for intel processor 
    findedges(1,0,image)

и мой файл ядра: edge. c


__kernel void detectedge(__global int *im,__global int *out){
      int j = get_global_id(1);
      int i = get_global_id(0);
      int width = %d;
      int rown = %d;
      int value;


              value = -im[(i)*width + j] -  0* im[(i)*width + j+1] + im[(i)*width + j+2]
                      -2*im[(i+1)*width + j] +  0*im[(i+1)*width + j+1] + 2*im[(i+1)*width + j+2]
                      -im[(i+2)*width + j] -  0*im[(i+2)*width + j+1] + im[(i+2)*width + j+2];

              value = (value < 0   ? 0   : value);
              value = (value > 255 ? 255 : value);
              out[i*width + j] = value;

  }

Теперь нет предупреждения / ошибки во время выполнения, но результат - это то, чего я не ожидал. Вот вход и его выход: Это мое входное изображение:

input

А вот мой результат:

output

1 Ответ

0 голосов
/ 29 мая 2020

Я думаю, что проблема в размере буферов ввода и вывода, которые вы передаете ядру. Размер изображения составляет одно uint8 на пиксель, а размер буфера соответствует data.nbytes. Ядро читает и записывает 4-байтовые пиксели.

Мне нужно было только изменить эту строку, и она работает:

data = np.asarray(image).astype(np.int32)

enter image description here

...