Как проверить, что содержимое двух больших текстовых файлов одинаково? - PullRequest
0 голосов
/ 29 июня 2011

У меня есть два больших текстовых файла (около 1,8 ГБ каждый в кодировке UTF-8). И я хочу проверить, одинаково ли содержимое обоих файлов на 100%. Если есть разница в один символ, то она считается не одинаковой, то есть оба файла разные. Как мне это сделать?

Итак, мой вопрос: как проверить, совпадают ли два больших текстовых файла на 100%?

Dim TextFile1 as String = "C:\TextFile1.log"
Dim TextFile2 as String = "C:\TextFile2.log"

UPDATE:

Я забыл добавить, что решение должно использовать минимальное количество памяти, потому что конкретный ПК имеет только 256 Мб памяти

Ответы [ 2 ]

1 голос
/ 29 июня 2011

Я столкнулся с подобной проблемой, когда мне нужно было определить дубликаты pdf-файлов, имена которых были изменены. Лучший способ сделать это - использовать хэш md5. Я сделал быстрый поиск в Google, и, похоже, у vb.net есть встроенная поддержка. Проверять, выписываться http://www.vbknowledgebase.com/?Id=88&Desc=Find-Duplicate-files-using-Vb.Net-using-MD5-Hash

1 голос
/ 29 июня 2011

Ну, для начала вы можете сравнить их размер (если они не одинакового размера, они не могут иметь одинаковый контент).Посмотрите на это свойство FileInfo.Length .

Если они имеют одинаковый размер, вы можете сравнить их побайтно

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...