Если вы делаете это, как указано в комментариях, для проведения теста масштабирования, то Оли Чарльзуорт совершенно прав;все, что вы делаете, это делает сравнение яблок с апельсинами, потому что вашему узлу не нужно использовать 76 ГБ.Что хорошо;Одна из главных причин использования MPI - решение проблем, которые не могут уместиться на одном узле.Но если попытаться поместить 76 ГБ данных на один процессор, то сравнение, которое вы делаете, не будет иметь никакого смысла.Как упоминали и Оли Чарльзуорт, и Кафе, с помощью различных методов вы можете использовать диск вместо ОЗУ, но тогда ваш 1-процессорный ответ не будет напрямую сопоставим с числами совпадений в ОЗУ, полученными от большего числа узлов,так что вам придется проделать большую работу, чтобы получить число, которое на самом деле ничего не будет значить.
Если вы хотите масштабировать результаты для такого рода проблем, вы должны либо начать с наименьшего числаузлы, к которым подходит проблема , и принимают данные с увеличением числа процессоров, или вы выполняете слабое масштабирование вместо тестов с сильным масштабированием - вы продолжаетепостоянная работа на процессор при увеличении числа процессоров, а не общая работа, являющаяся постоянной.
Кстати, как бы вы ни делали измерения, вы получите лучшие результаты, если, как полагает Оли Чарльзуорт, каждый процессор генерирует свои собственные данные, а не серийное узкое место, имея ранг 0 для генерацииматрицы и затем все процессоры получают свои части.