Основываясь на предложениях, которые я получил на этом форуме, я использую следующий код (пример) для подсчета строк.
phrase_words = ['red car', 'no lake', 'newjersey turnpike']
lines = ['i have a red car which i drove on newjersey', 'turnpike. when i took exit 39 there was no', 'lake. i drove my car on muddy roads which turned my red', 'car into brown. driving on newjersey turnpike can be confusing.']
text = " ".join(lines)
dict = {phrase: text.count(phrase) for phrase in phrase_words}
Требуемый вывод и вывод примера кода:
{'newjersey turnpike': 2, 'red car': 2, 'no lake': 1}
Этот код прекрасно работал с текстовым файлом размером менее 300 МБ.Я использовал текстовый файл размером 500 МБ + и получил следующую ошибку памяти:
y=' '.join(lines)
MemoryError
Как мне преодолеть это?Спасибо за вашу помощь!