У меня большой текстовый файл для тестирования, содержащий около 130 миллионов слов. Для подсчета слов в файле я написал следующий код, который я называю «простым решением».
#!/usr/bin/python3.7
with open('v_i_m_utf8.txt') as infile:
words=0
for line in infile:
wordslist = line.split()
words += len(wordslist)
print(words)
Результаты, которые у меня сейчас есть:
tony@lenox:~$ time ./counting.py
134721552
real 0m29,391s
user 0m28,907s
sys 0m0,400s
tony@lenox:~$
Так что, пожалуйста, возможно ли использовать некоторые внутренние приемы и приемы Python, чтобы заставить его обрабатывать строки намного быстрее?
Мне нужно просто посчитать слова и сделать это так быстро, как может среда исполнения Python.