Я пока недостаточно знаю о VB.Net (2008, Express Edition), поэтому я хотел спросить, есть ли лучший способ найти файлы с разными именами, но с одинаковым содержимым, т.е. дубликаты.
В следующем коде я использую GetFiles () для извлечения всех файлов в данном каталоге, а для каждого файла используйте MD5 для хеширования его содержимого, проверяйте, присутствует ли это значение в словаре: продублируйте, и я удалю его; Если нет, я добавлю это имя файла / hashvalue в словарь на потом:
'Get all files from directory
Dim currfile As String
For Each currfile In Directory.GetFiles("C:\MyFiles\", "File.*")
'Check if hashing already found as value, ie. duplicate
If StoreItem.ContainsValue(ReadFileMD5(currfile)) Then
'Delete duplicate
'This hashing not yet found in dictionary -> add it
Else
StoreItem.Add(currfile, ReadFileMD5(currfile))
End If
Next
Это хороший способ решить проблему поиска дубликатов, или есть лучший способ, о котором я должен знать?
Спасибо.