- Это зависит от ваших конечных требований.
Очевидные вещи, которые нужно сделать: заменить многомерные массивы [,] на зубчатые массивы [] [] и изменить порядок вложенных циклов:
for (int x = 0; ...; x++)
{
for (int y = 0; ...; y++)
{
...
}
}
вместо
for (int y = 0; ...; y++)
{
for (int x = 0; ...; x++)
{
...
}
}
В первом случае строки кэша ЦП используются гораздо более эффективно (поскольку левый индекс представляет непрерывные строки), а во втором - строка кэша недействительной на каждой итерации.
Таким образом, тесты кода с зубчатыми массивами и обращенными циклами показали в 2 раза лучшую производительность для свертки 1018x1280 3x3 по сравнению с исходной реализацией:
BenchmarkDotNet=v0.11.1, OS=Windows 10.0.17134.167 (1803/April2018Update/Redstone4)
Intel Core i7-7700 CPU 3.60GHz (Kaby Lake), 1 CPU, 8 logical and 4 physical cores
Frequency=3515624 Hz, Resolution=284.4445 ns, Timer=TSC
[Host] : .NET Framework 4.7.2 (CLR 4.0.30319.42000), 64bit RyuJIT-v4.7.3131.0
RyuJitX64 : .NET Framework 4.7.2 (CLR 4.0.30319.42000), 64bit RyuJIT-v4.7.3131.0
Job=RyuJitX64 Jit=RyuJit Platform=X64
Method | Mean | Error | StdDev |
------------- |---------:|----------:|----------:|
BenchmarkOld | 61.82 ms | 0.3979 ms | 0.3527 ms |
BenchmarkNew | 26.98 ms | 0.1050 ms | 0.0982 ms |
Вот код:
public static double[][] ConvolutionSpatial(double[][] paddedImage, double[][] mask, double offset)
{
double min = 0.0;
double max = 1.0;
double factor = GetFactor(mask);
int paddedImageWidth = paddedImage.Length;
int paddedImageHeight = paddedImage[0].Length;
int maskWidth = mask.Length;
int maskHeight = mask[0].Length;
int imageWidth = paddedImageWidth - maskWidth;
int imageHeight = paddedImageHeight - maskHeight;
double[][] convolve = new double[imageWidth][];
for (int x = 0; x < imageWidth; x++)
{
convolve[x] = new double[imageHeight];
for (int y = 0; y < imageHeight; y++)
{
double sum = Sum(paddedImage, mask, x, y);
convolve[x][y] = Math.Min(Math.Max((sum / factor) + offset, min), max);
string str = string.Empty;
}
}
return convolve;
}
public static double Sum(double[][] paddedImage1, double[][] mask1, int startX, int startY)
{
double sum = 0;
int maskWidth = mask1.Length;
for (int x = startX; x < (startX + maskWidth); x++)
{
var maskHeight = mask1[maskWidth - x + startX - 1].Length;
for (int y = startY; y < (startY + maskHeight); y++)
{
double img = paddedImage1[x][y];
double msk = mask1[maskWidth - x + startX - 1][maskHeight - y + startY - 1];
sum = sum + (img * msk);
}
}
return sum;
}
public static double GetFactor(double[][] kernel)
{
double sum = 0.0;
int width = kernel.Length;
for (int x = 0; x < width; x++)
{
var height = kernel[x].Length;
for (int y = 0; y < height; y++)
{
sum += kernel[x][y];
}
}
return (sum == 0) ? 1 : sum;
}
И я думаю, что это может улучшиться с применением операций SIMD.