Я кодирую переводчик Pig Latin с помощью R studio, как обрабатывать тот же текст и пунктуацию после перевода - PullRequest
0 голосов
/ 16 мая 2019

Я кодирую переводчик Pig Latin в Rstudio. Часть перевода завершена, но мне нужно знать, как скопировать формат и пунктуацию из исходного текста в переведенный.

например:

Привет, сегодня это: Красиво.

станет

Ellohay, oDatay isyay: Eautifulbay.

Я пытался прочитать текстовый файл. Мне нужно разобраться с пунктуацией и чувствительностью к регистру, прежде чем переводить ее. Я использовал приведенный ниже код для удаления знаков препинания, но он не работает после прочтения моего текстового файла. Однако, это работает, когда я проверяю это с нормальным текстом.

gsub('[[:punct:] ]+',' ',txt)

#this one for case sensitivity but it is not working
if (grep("^A-Z", ignore.case=TRUE, value=TRUE, word)

# here is the main function
apply <- function(words){
  word <- strsplit(words, split = " ")[[1]]
  paste(sapply(word,pigLatinizer), collapse = " ")
}
# I am reading the text using
fileName <- "football.txt"
conn <- file(fileName, open="r")
linn <- readLines(conn)
apply(linn)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...