Нет общего ответа, который можно дать, поскольку существует много 64-битных архитектур.
Существуют различные версии x86, Itanium, старая Alpha, Sparc, а теперь и ARM.
В целом это верно, меньший тип данных означает, что вы можете разместить больше данных в своем кеше, что хорошо для скорости (и пространства).
То, будет ли операция с той же скоростью, очень сильно зависит от архитектуры. Как уже упоминалось, есть процессоры с векторными единицами, которые могут работать с 64-битными типами данных или в 4 раза больше 16-битных значений. Точкой, которая может замедлить 16-битную операцию, является выравнивание. Некоторые 64-битные процессоры требуют, чтобы их данные были выровнены на 8 байт (выравнивание возможно, но медленнее).