Вы можете значительно ускорить большинство параллельных задач с FPGA.
Однако, помимо реализации ваших вычислений на ПЛИС, существует много работы по получению данных назад и вперед из ЦП / основной памяти. Это потребует реализации (например) конечной точки PCI Express в логике FPGA (мастеринг шины для максимальной скорости) и пользовательских драйверов на стороне программного обеспечения. Большинство операционных систем требуют, чтобы эти драйверы разрабатывались в режиме ядра.
И вы не можете просто использовать самый простой подход для программирования на ПЛИС. Вам нужно будет беспокоиться о конвейерной передаче и синхронизации часов, чтобы максимизировать пропускную способность.
Другими словами, это довольно сложная задача даже для инженеров с многолетним опытом работы с ПЛИС. Я настоятельно рекомендую вам найти кого-то, с кем можно поработать над этим. В зависимости от того, насколько запатентован ваш проект, вы можете найти опытных ученых, желающих работать с вами, если вы предоставите им все материалы и права на публикацию.
Если вы полны решимости сделать это самостоятельно, вам понадобится какое-то оборудование. Многие разные компании предлагают ПЛИС, подключенные в качестве ускорителей, например http://www.nallatech.com/pci-express-cards.html
В зависимости от того, выберете ли вы ПЛИС Xilinx или Altera, вы найдете много примеров кода и учебных пособий для работы PCI Express.