Поскольку я имел дело с очень большими файлами, я отсортировал файлы базы и кандидата, прежде чем сравнивать их, чтобы увидеть, какие строки отсутствовали в других. Я сделал это, чтобы не хранить записи в памяти. Сортировка была выполнена с помощью инструмента командной строки Linux, sort.
В моем скрипте на Perl я бы посмотрел, была ли строка в строке lt, gt или eq для строки в другом файле, при необходимости перемещая указатели в файле. Тем не менее, я столкнулся с проблемой, когда заметил, что при сравнении строк я считаю, что строки в базовом файле - это строка в файле-кандидате, содержащая специальные символы.
Есть ли надежный способ убедиться, что мои сравнения в Linux для сортировки строк и Perl используют один и тот же тип сравнения строк?