У меня есть хранилище документов, скажем, в формате txt.
Когда я добавляю новый документ в хранилище, я хочу проверить, существует ли в хранилище существующий документ, который совпадает с тем, который я вставляю.
Если совпадение превышает X% (90%?), Я могу спросить пользователя, хотят ли они продолжить или обновить существующий документ.Есть способы получить процент различий, например: в этом вопросе
Но мне нужно сравнить новый документ со всеми документами в хранилище.
Кто-нибудь знает, как я могу очень быстро проверить весь репозиторий, чтобы пользователю не пришлось ждать?
Спасибо