сопоставьте два набора файлов, чтобы найти наиболее подходящую между ними - PullRequest
0 голосов
/ 25 апреля 2018

У меня есть два набора файлов, возьмите A и B, оба набора имеют около 10000 файлов. Я хочу найти файлы в наборе B, наиболее подходящие для каждого файла в наборе A.

На самом деле файлы в наборе A и B на самом деле являются каталогами, но для простоты я называю их файлами.

В настоящее время я написал несколько парсеров для извлечения важных атрибутов из обоих наборов и сохранения их в базе данных, говоря это как характеристики для каждого файла обоих типов.

Теперь я хотел бы найти наиболее близкое соответствие для файлов в наборе A с файлами в наборе B.

Дайте мне знать ваши предложения о наилучшем подходе к решению этой проблемы.

...