Создание переменной на основе количества слов в переменной - PullRequest
0 голосов
/ 25 ноября 2018

У меня есть набор данных, содержащий страны и их конституции.Мне было интересно, есть ли способ создать переменную, чтобы показать, сколько раз слово «бог» отображается в переменной конституции.

Набор данных выглядит следующим образом:

Country Year Preamble
Afghanistan 2004 In the name of Allah...
Albania 1998 We, the people of Albania...
... .... .......

и так далее и тому подобное.Мне особенно интересно знать, существует ли функция, которая может подсчитать, сколько раз определенное слово используется в категориальной переменной или есть лучший способ выполнить то, что я пытаюсь сделать.

1 Ответ

0 голосов
/ 26 ноября 2018

Скажем, вы хотите посчитать, сколько раз 'Al' появляется в указанном наборе данных, вы можете использовать grep следующим образом:

Только для одного столбца:

 grep("Al", data$Preamble)

Для всехстолбцы:

 lapply(data, function(x) grep("Al", x))
  $`Country`
  [1] 2

  $Year
  integer(0)

  $Preamble
  [1] 1 2

Это скажет вам, в каких строках и столбцах найдено совпадение, то есть один в столбце «Страна» и два в столбце «Преамбула»

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...