Машина NUMA - это система с общей памятью, поэтому доступ к памяти с любого процессора может достигать памяти без блокировки. Если модель памяти основана на сообщениях, то для доступа к удаленной памяти потребуется, чтобы исполняющий процессор запросил, чтобы локальный процессор выполнил требуемую операцию. Однако в системе NUMA удаленный процессор может по-прежнему влиять на производительность процессора закрытия из-за использования ссылок на память, хотя это может зависеть от конкретной архитектурной конфигурации.
Что касается 1, это полностью зависит от ОС и библиотеки malloc. ОС отвечает за представление памяти на ядро / процессор как единое пространство или как NUMA. Malloc может знать или не знать NUMA. Но, по сути, реализация malloc может или не может выполняться одновременно с другими запросами. И ответ Ала (и связанное с ним обсуждение) рассматривает этот вопрос более подробно.
Что касается 2, так как memcpy состоит из ряда загрузок и хранилищ, единственным воздействием снова будут потенциальные архитектурные эффекты использования контроллеров памяти других процессоров и т. Д.