Библиотека шаблонов MTL4 Matrix может стать отличной отправной точкой. Прямо сейчас MTL4 имеет многоядерный DMM, и мы почти закончили с полной реализацией GPU. Питер и я говорили о алгоритмах распределенных графических процессоров, но поскольку в настоящее время мы фокусируемся на решателях PDE, алгоритмы распределенных графических процессоров трудно сделать конкурентоспособными по сравнению с надежным цифровым мультиметром.
Тем не менее, я работаю над новым набором решателей геофизики / медицинских изображений, который является более подходящим для распределенных вычислений на GPU, поскольку наборы данных более скромны, а видео возможности GPU полезны.
Чтобы начать, взгляните на учебник MTL4