Я пытался реализовать несколько потоков для пакетной обработки RPROP, но казалось, что это всегда медленнее, чем использование одного потока.Я попытался реализовать отдельно на уровне цикла «#pragma omp parallel» и вычисляя ошибки, градиенты и веса в отдельных потоках.В моей интерпретации кажется, что вычисления, выполняемые в каждом потоке, слишком малы, чтобы вычислить результат, выполненный при переключении потоков и синхронизации результатов (мьютекс). Мне интересно, сделал ли я что-то не так?Мой вывод заключается в том, что было бы разумнее запускать однопоточные RPROP, одновременно обрабатывая несколько нейронных сетей в отдельных потоках.В большинстве реализаций обычно подразумевается несколько взаимосвязанных NN, так что это имеет смысл.