Как мне выделить слово перед другим определенным словом? - PullRequest
0 голосов
/ 17 июня 2020

У меня есть текстовое поле следующих форматов.

Blessed To Receive An Offer From West Virginia University ... #HailWV üíõüíô
----------
Blessed To Receive An Offer From Michigan State University ... #GoGreen üíö
----------
Blessed to receive an offer from Abilene Christian University!!! #GoWildcats
----------
Im very blessed to announce that I’ve receive an offer from Pacific University! Big thanks to @CoachPatterson_  for this opportunity!
---------
After A Great Talk With @CoachRT_Cisco I’m blessed to receive an offer from Cisco College

Я пытаюсь извлечь, как называется колледж.

Я пробовал следующий код


str_extract(df$text,'(?<=University)\\[A-Z]\\w')

Но все, что он возвращает, это поля NA?

1 Ответ

0 голосов
/ 17 июня 2020

Работает ли это для вас:

Данные:

data <- c("Blessed to receive an offer From Texas State University.", 
          "Blessed to receive an offer from Columbia University.",
          "Blessed to receive an offer from Abilene Christian University!!!",
          "Im very blessed to announce that I’ve receive an offer from University of Georgia! Big thanks to @CoachPatterson_  for this opportunity!")

Решение:

str_extract(data, "(?<=(f|F)rom\\s)[A-Z]\\w+\\b\\s(of\\s)?[A-Z]\\w+\\b(\\s[A-Z]\\w+\\b)?")

Результат:

[1] "Texas State University"       "Columbia University"          "Abilene Christian University"
[4] "University of Georgia"
...