Я действительно сделал это в один момент ... вы в основном выполняете серию шагов
- Устранить что-либо в [], () или {} '
- Удалить расширение файла
- Теперь разделить на [\ s.-_]
В вашем случае вы получите:
Seven Pounds Multisub x264 bluray
The Birds 1963 HDTV XvidHD 720p NPW
1892 XVID AC3 HD 120 min
Теперь вы в основном сохраняете список слов, которые необходимо удалить из списка, прежде чем смотреть на него. Очевидные примеры из этого примера: x264, Multisub, bluray, HDTV, XvidHD, Xvid, HD, 720p, 1040p, AC3. Обратите внимание, что здесь вы хотите выполнить сравнение без учета регистра.
Обратите внимание, что этот список будет расширяться вручную при прохождении коллекции, и это оставляет вас с
Seven Pounds
The Birds 1963
1892 120 min
Это примерно столько же, сколько вы получите для полуавтоматической системы. Один из приведенных выше методов сказал бы вам очистить числа, которые не отображаются спереди, но я бы отметил, что вы испортите такие вещи, как «История игрушек 2».
В моем случае я выполнил описанную выше обработку, а затем попытался выяснить, какие шаблоны каталогов соответствуют архивации. Затем у меня был интерфейс на основе curses, который позволял мне прокручивать и вручную корректировать выводы сценария (включая переименование).
РЕДАКТИРОВАТЬ: После второго размышления, мой сценарий на самом деле сделал предположение, что набор секунд чисел (а также все, что впоследствии) может быть безопасно удален. Это все эвристики, и вы будете сталкиваться с исключениями. Добавление этого шага исправило бы заголовок последнего примера к 1892
.