Я пытаюсь написать код, который выполняет расшифровку AES.У меня есть работающий код, но я хотел иметь возможность добавить цепочку блоков шифрования, которая требует выполнения операции XOR после расшифровки.
Чтобы сделать код проще для написания и понимания, я написал код, используя два ядра.Тот, который выполняет дешифрование для одного блока, и тот, который выполняет XOR для части CBC.Затем я отправил их в очередь через clEnqueueTask для каждого 16-байтового блока данных с зависимостью, определенной событием между Decryption и XOR.
Это оказывается очень медленным, оно работает в том факте, что выполняет их в правильном порядке, но, похоже, не распараллеливает выполнение.улучшить производительность без потери гранулярности?