У меня есть входной файл со списком фильмов (обратите внимание, что могут быть некоторые повторяющиеся записи):
American_beauty__1h56mn38s_
As_Good_As_It_Gets
As_Good_As_It_Gets
_DivX-ITA__Casablanca_M_CURTIZ_1942_Bogart-bergman_
Capote_EN_DVDRiP_XViD-GeT-AW
_DivX-ITA__Casablanca_M_CURTIZ_1942_Bogart-bergman_
Я хотел бы найти соответствующее совпадение (номер строки) из другого эталонного файла для каждогоиз записей в первом файле:
American beauty.(1h56mn38s)
As Good As It Gets
Capote.EN.DVDRiP.XViD-GeT-AW
[DivX-ITA] Casablanca(M.CURTIZ 1942 Bogart-bergman)
Quills (2000)(7.4)
Желаемый результат будет выглядеть примерно так (Ссылочный фильм + номер строки из справочного файла):
American beauty.(1h56mn38s) 1
As Good As It Gets 2
As Good As It Gets 2
[DivX-ITA] Casablanca(M.CURTIZ 1942 Bogart-bergman) 4
Capote.EN.DVDRiP.XViD-GeT-AW 3
[DivX-ITA] Casablanca(M.CURTIZ 1942 Bogart-bergman) 4
По сути, разница междузаписи в обоих файлах состоят в том, что некоторые символы, такие как: пробелы, скобки, точки и т. д., были заменены символами подчеркивания.
Кто-нибудь может пролить на него свет?
С наилучшими пожеланиями
Хавьер