Двоичный код, вероятно, будет быстрее, так как для текста вы используете 8 бит (полный символ) для кодирования 4 бит данных. Но я сомневаюсь, что вы действительно заметите много различий.
Там, где я нахожусь, у нас очень похожий стол. Он содержит тексты диктовок от врачей для выставления счетов в текстовом столбце (все еще на сервере SQL 2000). Мы приближаемся к четырем миллионам записей, и мы должны иметь возможность проверить наличие дубликатов, когда врач дважды продиктовал одно и то же для целей проверки и соответствия. Диктовка может запускать несколько страниц, поэтому у нас также есть хеш-столбец, который заполняется при вставке через триггер. Столбец имеет тип char (32).