Получение текста в диалоговом разговоре в R - PullRequest
0 голосов
/ 09 апреля 2020

Итак, у меня есть некоторые текстовые данные, которые выглядят примерно так:

ПОКУПАТЕЛЬ: [ТЕКСТ]

ПРОДАВЕЦ: [ТЕКСТ]

ПОКУПАТЕЛЬ: [ТЕКСТ]

При экспорте в CSV все по существу сводится к абзацу и будет выглядеть примерно так:

ПОКУПАТЕЛЬ: [ТЕКСТ]. ПРОДАВЕЦ: [ТЕКСТ]. ПОКУПАТЕЛЬ: [ТЕКСТ].

Я хотел бы знать, есть ли способ, которым я могу только отслеживать ответы Покупателя и не обращать внимания на то, что говорит продавец, я использую библиотеку текстов tidy и пробую команды регулярных выражений, но, кажется, ничего не берет меня в правильном направлении

1 Ответ

2 голосов
/ 10 апреля 2020

Испытательные данные
Поскольку данные пробы не предоставлены, ниже приведены испытательные данные. Допустим, что вывод из вашего кода

BUYER: [TEXT]. SELLER: [TEXT]. BUYER: [TEXT]

Потенциальное решение
Используя доступное решение здесь , измененная версия представлена ​​ниже.

library(stringr)
s <- "BUYER: [TEXT]. SELLER: [TEXT]. BUYER: [TEXT]"
buyerStrings <- str_extract_all(s, pattern = "(?=BUYER:).*?((?=SELLER)|$)")

Извлеченные данные:

print(buyerStrings)

[[1]]
[1] "BUYER: [TEXT]. " "BUYER: [TEXT]"

Примечание. Эти извлеченные данные могут быть преобразованы в ваши потребности для экспорта

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...