Я пытаюсь выучить это в R, и у упражнения есть вопрос, где вам дается текстовый документ рассказа story.txt, я импортировал его под переменной story. Мне нужно сделать с ним две вещи: во-первых, мне нужно посчитать, сколько каждой буквы появляется в истории, а во-вторых, мне нужна вероятность появления каждой буквы и сгенерировать график, используя вероятности.
Моя идея сделать это состоит в том, чтобы взять историю и установить все в нижний регистр, убрать пробелы и лишние символы и оставить его как просто буквы, а затем считать каждую букву, единственная проблема, которую я имею, это то, что я не знаю Как это сделать, я пытался использовать str_count, но я получаю сообщение об ошибке.
Код пока:
story <- readLines("story.txt")
story <- tolower(story) # i sets to lower case
story <- gsub(" ","",story) # remove all spaces
story <- gsub("\\W","",story)
storydata <- str_count(story, "a")
Может ли кто-нибудь мне помочь? Любые идеи или функции или пример кода? Я застрял, не зная, как двигаться вперед.
Пример текста из истории:
"Я пытался дозвониться до вас прошлой ночью и прошлой ночью. Телефон здесь был ..."
«С тобой все в порядке, Мюриэль?»
После запуска функции:
[18] ""
[19] «Он был в состоянии достигнуть и того, и другого раньше»
[20] ""
[21] areyouallrightmuriel