Question

Я пытаюсь прочитать файл в моей программе на Python и применить к нему токенизатор, чтобы разбить текст на несколько предложений. Однако в моем выводе я получаю символ '/ n', которого я хотел бы избежать в выводе, так как это может помешать моим дальнейшим процессам в предложениях. Я прочитал ввод с помощью команды read (). Также пробовал readline (). я все еще получаю символы новой строки на моем выходе. Любые предложения по предотвращению этого?

file_sent = open(path,'r')
all_sents = file_sent.read()
sent_all = print all_sents
tokenized_sents = sent_tokenize(sent_all)

kindall · Answer 1 · 29 октября 2011

Если вы хотите полностью удалить символы новой строки:

all_sents = file_sent.read().replace('\n', '')

Если вы хотите заменить их пробелами:

all_sents = file_sent.read().replace('\n', ' ')

Очевидно, вы можете заменить их чем-то другим, если хотите.

Форматированный ввод из файла в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Форматированный ввод из файла в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов