Я работаю над архитектурой NUMA , где каждый вычислительный узел имеет 2 сокета и 4 ядра на сокет, всего 8 ядер на вычислительный узел и 24 ГБ ОЗУ на узел.Я должен доказать, что настройка привязка процессора может оказать существенное влияние на производительность.
У вас есть какая-либо программа, чтобы предложить, что я мог бы использовать в качестве эталона, чтобы показать разницу влияния между использованиемсродство процессора или нет?Я мог бы также написать простую C-тестовую программу, используя MPI, OpenMP или pthreads, но какая операция лучше всего подойдет для этого теста?Это должно быть то, что могло бы использовать преимущества локальности кэша, но также вызывало бы переключение контекста (операции блокировки), чтобы процесс мог потенциально мигрировать на другое ядро или, что еще хуже, на другой сокет.Он должен работать на нескольких ядрах.