У меня есть двоичный файл с миллионами 64-битных целых чисел без знака. Что мне нужно, это удалить дубликаты номеров в файле. Моя идея состоит в том, чтобы создать хеш-таблицу для каждого элемента, которая будет состоять из одного числа и его позиции в файле. Таким образом, я могу искать дублированные числа, а затем удалять их в зависимости от их позиции.
Какой будет лучший способ реализовать это?
[EDIT]
Под удалением дублированных чисел не подразумевается замена их на 0, поскольку их размер по-прежнему составляет 64 бита. Поэтому я считаю, что есть два варианта: либо переписать весь файл, либо создать новый с уникальными номерами, то есть без дублирования.