Я кодирую переводчик Pig Latin в Rstudio. Часть перевода завершена, но мне нужно знать, как скопировать формат и пунктуацию из исходного текста в переведенный.
например:
Привет, сегодня это: Красиво.
станет
Ellohay, oDatay isyay: Eautifulbay.
Я пытался прочитать текстовый файл. Мне нужно разобраться с пунктуацией и чувствительностью к регистру, прежде чем переводить ее. Я использовал приведенный ниже код для удаления знаков препинания, но он не работает после прочтения моего текстового файла. Однако, это работает, когда я проверяю это с нормальным текстом.
gsub('[[:punct:] ]+',' ',txt)
#this one for case sensitivity but it is not working
if (grep("^A-Z", ignore.case=TRUE, value=TRUE, word)
# here is the main function
apply <- function(words){
word <- strsplit(words, split = " ")[[1]]
paste(sapply(word,pigLatinizer), collapse = " ")
}
# I am reading the text using
fileName <- "football.txt"
conn <- file(fileName, open="r")
linn <- readLines(conn)
apply(linn)