Question

При подготовке данных (текстового файла) к предварительной обработке.Я не могу разбить текстовый файл на слова.

import io
f = io.open("pg5200.txt", mode="r", encoding="utf-8")
text = f.read()
f.close()

import re
words = re.split(r'\W+', text)
print(words[:100])

После использования приведенного выше кода: Проблема в том, что я получаю дополнительный пробел ("") в начале.

Могу ли я узнать, почему возникает такое дополнительное пространство и как его удалить ??

Спасибо

bkupfer · Answer 1 · 23 мая 2018

Вы можете использовать функцию strip.

Проверить этот ответ Как мне обрезать пробелы?

Разбиение текста на слова в python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Разбиение текста на слова в python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов