У меня большой текстовый файл (более 70 МБ), и мне нужно подсчитать, сколько раз последовательность символов встречается в файле. Я могу найти множество сценариев для этого, но никто из них не принимает во внимание, что последовательность может начинаться и заканчиваться в разных строках. Ради эффективности (на самом деле у меня есть более 1 файла, который я обрабатываю), я не могу предварительно обработать файлы, чтобы удалить переводы строки.
Пример:
Если я ищу "thisIsTheSequence", следующий файл будет иметь 3 совпадения:
asdasdthisIsTheSequence
asdasdasthisIsT
heSequenceasdasdthisIsTheSequ
encesadasdasda
Спасибо за помощь.