Разделить на предложения - PullRequest
       0

Разделить на предложения

0 голосов
/ 06 апреля 2020

Я использовал readLines для импорта текстового файла и свернул все строки. Теперь я хочу написать функцию, которая будет циклически проходить по всему свернутому тексту и определять конец каждого предложения, начиная новую строку для каждого предложения. Он обнаружит (периоды, вопросительные знаки, периоды, за которыми следуют цитаты, или вопросительные знаки, за которыми следуют цитаты)

, например:

"I need help. How do I write this code?"

станет:

I need help.
How do I write this code?

Кто-нибудь знает, как я мог бы go сделать это?

Ответы [ 2 ]

1 голос
/ 06 апреля 2020

gsub может работать.

gsub('. ', '.\n', your_text)

заменяет шаблон '. ' на '\n ', который является символом разрыва строки.

your_text = 'lets. try'
aa = gsub('. ', '.\n', your_text)
print(aa)
cat(aa)
0 голосов
/ 06 апреля 2020

Мы можем использовать положительный взгляд за регулярным выражением, чтобы сопоставить "." или вопросительный знак "?" и заменить его новой строкой (\n).

str = "I need help. How do I write this code? "
cat(gsub('(?<=[.?])\\s', '\n', str, perl = TRUE))

#I need help.
#How do I write this code?
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...