В идеальной ситуации: ничего не выгружается, весь код действительно хорошо написан и помещается в кэш, планировщик никогда не прерывает вас и т. Д .: может ли одно ядро в многоядерном процессоре генерировать достаточно трафика записи для насыщения IO автобус до модулей DIMM?
В более конкретной форме: если бы я запустил программу, которая делает 16 ГБ memset
в одном потоке, он работал бы медленнее, чем пара непересекающихся 8 ГБ memset
с? (Размер выбран достаточно большим, чтобы достичь устойчивого состояния.)