Как использовать sqldf в R для управления локальными фреймами данных? - PullRequest
1 голос
/ 07 февраля 2020

Я пытаюсь проанализировать некоторые данные в RStudio, которые поступают из базы данных MySQL, поэтому я использовал dbConnect для подключения к указанной базе данных и скопировал одну таблицу, необходимую для этого проекта. Затем я использовал R, чтобы немного очистить данные, избавившись от некоторых ненужных столбцов. Пока все хорошо.

Мои проблемы возникли, когда я понял, что в моих данных есть некоторые выбросы, и мне нужно было удалить строки, которые содержали очевидные данные выбросов. Это то, что я без проблем делаю в SQL, но мне не хватает опыта R, чтобы делать это эффективно. Поэтому я изучил его и обнаружил пакет sqldf, который объявляет себя как способ использования команд SQL для манипулирования данными. Отлично! Но у меня возникли некоторые проблемы с этим, поскольку sqldf, похоже, требует какого-то подключения к базе данных. Есть ли способ просто подключиться к data.frame, который у меня есть в моей глобальной среде в RStudio?

Q: Не могли бы вы просто манипулировать данными в MySQL перед их импортом в R?
A: Да, и это то, что я буду делать, если придется, но я бы хотел лучше понять sqldf.

1 Ответ

2 голосов
/ 07 февраля 2020

Попробуйте:

options(sqldf.driver = "SQLite")
sqldf("select * from book;", drv = 'SQLite')
...