По сути, это зависит от архитектуры чипа, с которым вы имеете дело. Для большинства процессоров невозможно обнулить целые объемы памяти на ходу, и поэтому каждое слово потребует отдельной операции с памятью, независимо от того, какие средства предоставляет ваш язык программирования.
Это очень помогает, если ваша память непрерывна для времени доступа к памяти, потому что память, смежная с памятью, к которой только что обращались, будет кэширована, и последующие обращения попадут в кеш, что приведет к высокой производительности.
Результатом этого является то, что если ваша матрица велика, может быть быстрее обнулить строку за раз или столбец за раз, а не наоборот, в зависимости от того, записаны ли ваши данные столбцом или строки.
РЕДАКТИРОВАТЬ: я предположил, что ваши матрицы не редкие, или треугольные, или иным образом особенные, так как вы говорите о "обнулении целой строки". Если вы знаете, что ваша матрица в основном пуста или каким-то другим образом соответствует специальному шаблону, вы сможете представить свою матрицу по-другому (не просто в массиве nxm), и история будет другой. Но если у вас есть матрица nxm прямо сейчас, то это так.