Есть ли способ использовать read.csv для чтения из строкового значения, а не из файла в R? - PullRequest
73 голосов
/ 14 октября 2010

Я пишу R-пакет, в котором R-код общается с Java-приложением. Приложение Java выводит строку в формате CSV, и я хочу, чтобы код R мог напрямую читать строку и преобразовывать ее в data.frame.

Ответы [ 5 ]

102 голосов
/ 14 октября 2010

Редактирование 7-летнего ответа: На данный момент это намного проще благодаря аргументу text=, который был добавлен к read.csv(), и так:

R> data <- read.csv(text="flim,flam
+ 1.2,2.2
+ 77.1,3.14")
R> data
  flim flam
1  1.2 2.20
2 77.1 3.14
R> 

Да, посмотрите на справку по textConnection() - очень мощное понятие в R заключается в том, что практически все читатели (например, read.table() и его варианты) имеют доступ к этим соединениям объект, который может быть файлом, или удаленным URL, или каналом, поступающим из другого приложения, или ... некоторый текст, как в вашем случае.

Тот же трюк используется для так называемых здесь документов:

> lines <- "
+ flim,flam
+ 1.2,2.2
+ 77.1,3.14
+ "
> con <- textConnection(lines)
> data <- read.csv(con)
> close(con)
> data
  flim flam
1  1.2 2.20
2 77.1 3.14
> 

Обратите внимание, что это простой способ создания чего-либо, но он также дорогой из-за многократного анализа всех данных. Существуют и другие способы перехода с Java на R, но это должно помочь вам быстрее. Далее идет эффективность ...

76 голосов
/ 03 мая 2013

Обратите внимание, что в текущих версиях R вам больше не нужен textConnection(), можно просто сделать это:

> states.str='"State","Abbreviation"
+ "Alabama","AL"
+ "Alaska","AK"
+ "Arizona","AZ"
+ "Arkansas","AR"
+ "California","CA"'
> read.csv(text=states.str)
       State Abbreviation
1    Alabama           AL
2     Alaska           AK
3    Arizona           AZ
4   Arkansas           AR
5 California           CA
4 голосов
/ 14 октября 2010

Да.Например:

string <- "this,will,be\na,data,frame"
x <- read.csv(con <- textConnection(string), header=FALSE)
close(con)
#> x
#    V1   V2    V3
#1 this will    be
#2    a data frame
1 голос
/ 14 октября 2010

Предположим, у вас есть файл с именем tommy.csv (да, образно, я знаю ...), который содержит

col1 col2 \ n 1 1 \ n 2 2 \ n 33

, где каждая строка отделена escape-символом "\ n".

Этот файл можно прочитать с помощью аргумента allowEscapes в read.table.

> read.table("tommy.csv", header = TRUE, allowEscapes = TRUE)

  col1 col2
1 col1 col2
2    1    1
3    2    2
4    3    3

Это не идеально (изменить имена столбцов ...), но это начало.

0 голосов
/ 15 октября 2010

Эта функция оборачивает ответ Дирка в удобную форму. Это замечательно для ответов на вопросы о SO, где спрашивающий только что вывел данные на экран.

text_to_table <- function(text, ...)
{
   dfr <- read.table(tc <- textConnection(text), ...)
   close(tc)
   dfr
}

Чтобы использовать его, сначала скопируйте данные на экране и вставьте в текстовый редактор.

Foo Bar Baz
1 2 a
3 4 б

Теперь заключите его в text_to_table, кавычки и любые другие аргументы для read.table.

text_to_table("foo bar baz
1 2 a
3 4 b", header = TRUE)
...