Отображение результата psycopg2 в фрейм данных для R с RPY2 - PullRequest
2 голосов
/ 20 сентября 2010

С помощью psycopg2 я получаю результат запроса в этой форме:

[(15002325, 24, 20, 1393, -67333094L, 38, 4, 493.48763257822799, 493.63348372593703), (15002339, 76, 20, 1393, -67333094L, 91, 3, 499.95845909922201, 499.970048093743), (15002431, 24, 20, 1394, -67333094L, 38, 4, 493.493464900383, 493.63348372593703), (15002483, 76, 20, 139491, 3, 499.959042442434, 499.97304310494502)]

Я пытаюсь преобразовать этот вложенный кортеж / список в R-кадр данных с RPY2: с девятью столбцами с именем и четырьмя рядами данных (номер элемента)в этом вложенном списке))

Но я не понимаю, как, я пытаюсь с taggedList (в библиотеку контейнеров RPY2), но безуспешно .. Кажется, тегированный список занимает один список только один список.

Спасибо за помощь!

1 Ответ

1 голос
/ 20 сентября 2010
import rpy2.robjects as ro
r=ro.r

data=[(15002325, 24, 20, 1393, -67333094L, 38, 4, 493.48763257822799, 493.63348372593703), (15002339, 76, 20, 1393, -67333094L, 91, 3, 499.95845909922201, 499.970048093743), (15002431, 24, 20, 1394, -67333094L, 38, 4, 493.493464900383, 493.63348372593703), (15002483, 76, 20, 1394, -67333094L, 91, 3, 499.959042442434, 499.97304310494502)]
columns=zip(*data)
columns=[ro.FloatVector(col) for col in columns]
names=['col{i}'.format(i=i) for i in range(9)]
dataf = r['data.frame'](**dict(zip(names,columns)))
print(dataf)

#       col8 col6     col7      col4 col5 col2 col3     col0 col1
# 1 493.6335    4 493.4876 -67333094   38   20 1393 15002325   24
# 2 499.9700    3 499.9585 -67333094   91   20 1393 15002339   76
# 3 493.6335    4 493.4935 -67333094   38   20 1394 15002431   24
# 4 499.9730    3 499.9590 -67333094   91   20 1394 15002483   76

Обратите внимание, что для postgresql существует интерфейс R, и это может обеспечить более чистый путь, чем прохождение через Python и rpy2.

Если вам нужен Python, другой возможностью является выяснение команд R, необходимых для загрузки данных из postgresql, а затем вызов их в Python с использованием ro.r.

...