Не должно быть трафика когерентности сокета ЦП для описанного случая закрепленного процесса.Современные платформы Xeon реализуют фильтрацию с помощью snoop в чипсете.Фильтр snoop указывает, что на удаленном сокете не может быть рассматриваемой строки кэша, что позволяет избежать необходимости отправлять в этот сокет сообщения о недействительности кэша.
Вы можете измерить это для себя.Процессоры Xeon реализуют большое разнообразие счетчиков статистики кэша.Вы можете прочитать счетчики в своем собственном коде с помощью инструкции rdpmc или просто использовать такой продукт, как VTune.К вашему сведению, использование rdpmc очень точное, но немного сложное, поскольку вы должны изначально установить бит в CR4, чтобы разрешить использование этой инструкции в пользовательском режиме.
- EDIT -
Мой ответвыше устарел для процессоров серии 55xx, которые используют ссылки QPI.Эти ссылки напрямую соединяют сокеты ЦП без промежуточного набора микросхем, например: http://ark.intel.com/products/37111/Intel-Xeon-Processor-X5570-%288M-Cache-2_93-GHz-6_40-GTs-Intel-QPI%29
Однако, поскольку кэш L3 в каждом ЦП является включающим, отслеживание по каналам QPI происходит, только когда локальный кэш L3 указывает строкунигде в локальном сокете.Точно так же L3 удаленного сокета может быстро реагировать на перекрестное отслеживание, не мешая ядрам, при условии, что линии тоже нет.
Таким образом, включающие кэши L3 должны минимизировать издержки когерентности между сокетами.не из-за снуп-фильтра чипсета в вашем случае.