Преобразование текстовых данных в формат таблицы / CSV - PullRequest
0 голосов
/ 06 декабря 2018

Мне нужно преобразовать текстовые данные (например, абзац) в фрейм данных (чтобы сохранить в виде файла csv), используя R. Конкретная необходимость состоит в том, чтобы каждое слово в каждом абзаце находилось в отдельной ячейке в столбце.Следующий код преобразует текст в таблицу, но он помещает слова в каждой строке в одну ячейку.Можете ли вы помочь создать набор данных из одного столбца с каждым словом в отдельной ячейке?

    merchant <- read.delim("merchant.txt")
    write.table(merchant,file="merchant.csv",sep=",",col.names=FALSE,row.names=FALSE)

1 Ответ

0 голосов
/ 06 декабря 2018

Вот моя попытка, основанная на тидиверсе.Вместо чтения в виде таблицы, просто прочитайте в виде строки, а затем разделите на вектор отдельных слов:

library(tidyverse)

## Read in text file as string
merchant <- read_file("merchant.txt") %>% 
## Remove all punctuation
gsub('[[:punct:] ]+',' ',.) %>%
## Split individual words into list vector
strsplit(" ")
## Set column equal to the vector of individual words
para <- merchant[[1]]

Чтобы преобразовать это в кадр данных:

para <- as.data.frame(para)
...