Я пишу программу на Python, которая должна делать то же самое, что и команда wc в Linux (вернуть количество строк, слов и байтов файла, переданных ей).Это должно работать, когда вы передаете ему двоичный файл, но я продолжаю получать намного меньше слов, чем вывод wc для того же файла.Что такое пробелы в двоичных файлах?split()
отлично работает для текстовых файлов, потому что разделяется на пробелы, \n
и \t
.
with open(file_name, "rb") as f:
content = f.read()
line_count = content.count(b'\n')
words = content.split()
word_count += len([x for x in words if x!=""])
open_file.close()