Рекомендуемый способ создания гибких переменных данных? - PullRequest
0 голосов
/ 17 июня 2019

Для таблицы с различными значениями и длинами, каков наилучший способ создания фрейма данных для столбцового анализа?

Пример с учетом CSV без метки, который выглядит следующим образом:

A,B,A,C
A,B,C,D,E,F
B,C,A,B,F,F,F
A,B
B,C,D
A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,Y,X,Z,AA,AB,AC

Цель будет заключаться в том, чтобы в конечном итоге присвоить значение каждой букве в зависимости от того, в какой позиции оно появляется.

Учитывая переменную и неизвестную длину строк, как мне следует подойти к этой проблеме?Установить фрейм данных с абсурдно большим количеством столбцов в качестве заполнителя?

1 Ответ

1 голос
/ 17 июня 2019

Один из вариантов - прочитать каждую строку как элемент вектора, используя readLines() -

x <- readLines("test.csv") # add appropriate path to the file
x
[1] "A,B,A,C"              "A,B,C,D,E,F"                                                 
[3] "B,C,A,B,F,F,F"        "A,B"                                                         
[5] "B,C,D"                "A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,Y,X,Z,AA,AB,AC"

Теперь вы можете манипулировать каждым элементом этого вектора по своему усмотрению, а затем собирать результаты в желаемой структуре. Таким образом, вам не нужно «Установить фрейм данных с абсурдно большим количеством столбцов в качестве заполнителя» .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...