Без каких-либо существовавших ранее знаний о R, Rpy2 и ggplot2 я, тем не менее, хотел бы создать диаграмму рассеяния из тривиальной таблицы из Python.
Чтобы установить это, я только что установил:
- Ubuntu 11.10 64 бит
R version 2.14.2
(от зеркала r-кран)
ggplot2
(через R> install.packages('ggplot2')
)
rpy2-2.2.5
(через easy_install
)
После этого я могу построить несколько примеров кадров данных из интерактивного сеанса R с использованием ggplot2.
Однако, когда я просто пытаюсь импортировать ggplot2
, как я видел в примере, который я нашел в Интернете, я получаю следующую ошибку:
from rpy2.robjects.lib import ggplot2
File ".../rpy2/robjects/lib/ggplot2.py", line 23, in <module>
class GGPlot(robjects.RObject):
File ".../rpy2/robjects/lib/ggplot2.py", line 26, in GGPlot
_rprint = ggplot2_env['print.ggplot']
File ".../rpy2/robjects/environments.py", line 14, in __getitem__
res = super(Environment, self).__getitem__(item)
LookupError: 'print.ggplot' not found
Может кто-нибудь сказать мне, что я делаю не так? Как я уже сказал, некорректный импорт происходит из онлайн-примера, поэтому вполне может быть, что есть другой способ использовать gplot2 через rpy2.
Для справки, не связанной с вышеуказанной проблемой, вот пример кадра данных, который я хотел бы построить, как только я получу импорт для работы (не должно быть проблем с просмотром примеров). Идея состоит в том, чтобы создать точечную диаграмму с длинами по оси x, процентами по оси Y и логическим значением, используемым для окрашивания точек, которые я затем хотел бы сохранить в файл (изображение или pdf). Учитывая, что эти требования очень ограничены, альтернативные решения также приветствуются.
original.length row.retained percentage.retained
1 1875 FALSE 11.00
2 1143 FALSE 23.00
3 960 FALSE 44.00
4 1302 FALSE 66.00
5 2016 TRUE 87.00