Как ограничить длину общего количества слов для чтения из текстового файла - PullRequest
1 голос
/ 07 августа 2020

Я пытался легко читать текстовые документы, используя приведенный ниже код, однако я не хочу читать все текстовые документы, скажем, общая длина слов в текстовых документах составляет 2845.

for line in open('foo.txt', "r"):
        print(line)

Я хочу прочитать первые 1674 слова из документов

Заранее спасибо

1 Ответ

2 голосов
/ 07 августа 2020

Прежде всего, вы всегда должны использовать with open() для открытия и чтения файла, поскольку файл закрывается автоматически. В целом он менее подвержен ошибкам и более удобочитаем.

Что касается вашей проблемы, вот короткий фрагмент, который sh вы должны переслать:

with open('foo.txt', 'r') as file:
    text = file.read().replace('\n', ' ')
    words = text.split(' ')
    char_limited_text = ' '.join(words[:1674]   

Приведенный выше код работает в три этапа :

  1. Он считывает весь текст файла в переменную text
  2. Он разбивает текст на отдельные пробелы
  3. Объединение слов обратно вместе, но только взятие первых 1674 слов

Если производительность имеет значение, может быть лучшее решение: читать файл построчно и отслеживать, сколько слов уже прочитано.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...