Question

Я использую R для запуска моделирования с использованием данных временных рядов. Я использовал массивы для хранения данных, но мне нужно менее ресурсоемкое решение для хранения данных на промежуточных этапах, чтобы документировать процесс. Я не программист, поэтому я ищу что-то относительно простое для установки на нескольких платформах, если это возможно (Windows, Mac, Linux). Мне также нужно иметь возможность напрямую вызывать базу данных из R, поскольку изучение другого языка сейчас невозможно. В идеале я хотел бы иметь возможность часто читать и писать в базу данных способом, аналогичным массиву, хотя я не знаю, реалистично ли это. Я с удовольствием пожертвую скоростью для простоты использования, но я готов работать, чтобы изучить решения с открытым исходным кодом. Любые предложения будут оценены.

Dirk Eddelbuettel · Answer 1 · 18 июля 2010

Быстрые комментарии:

R хорош в этом, как язык для программирования с данными , имеется множество интерфейсов
Существует целый руководство посвящено импорту / экспорту данных, и в нем есть раздел о реляционных базах данных , поэтому начните с него.
R имеет широко используемый DBI *Пакет 1015 *, который предоставляет унифицированный интерфейс для многих бэкэндов, включая SQLite, MySQL, PostgreSQL, Oracle, ... Используйте это, возможно, с RSQLite , чтобы быстро что-то сделать.После этого вы все равно можете переключать серверы.
Существует также RODBC , но я считаю, что с ODBC утомительно работать.
R также имеет специализированный вариант в TSdbiПакет Пола Гилберта, который привносит абстракцию, подобную DBI, в базы данных временных рядов.Он также поддерживает несколько бэкэндов.
Пакет data.table был написан для этого и очень быстр при индексировании и агрегировании.

bakkal · Answer 2 · 18 июля 2010

Мне также нужно иметь возможность напрямую вызывать базу данных из R

Я предлагаю настроить MySQL с интерфейсом RMySQL.

Как только соединение с БД открыто,Вы можете запросить базу данных и получить данные в R, например:

# Run an SQL statement by creating first a resultSet object
rs <- dbSendQuery(con, statement = paste(
                      "SELECT w.laser_id, w.wavelength, p.cut_off",
                      "FROM WL w, PURGE P",
                      "WHERE w.laser_id = p.laser_id",
                      "SORT BY w.laser_id")
# we now fetch records from the resultSet into a data.frame
data <- fetch(rs, n = -1)   # extract all rows

RMySQL : интерфейс R к базе данных MySQL

Интерфейс базы данных и драйвер MySQL для R. Эта версия соответствует определению интерфейса базы данных, реализованному в пакете DBI 0.2-2.

База данных MySQL:

Доступно для всех платформ, которые вы указали в вопросе, и более того, скачайте здесь .

Amnon · Answer 3 · 18 июля 2010

Вам действительно нужно решение для базы данных для ваших целей? Вы говорите, что хотите «решение для хранения данных на промежуточных этапах» - как насчет простого сохранения массива данных на диск в нужные моменты времени?

Редактировать : чтобы получить информацию, вы можете встроить метаинформацию, например, пробный индекс и / или отметка времени в имени файла. Затем вы можете найти и загрузить файл, используя правильное имя файла.

Рекомендации для базы данных с R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Рекомендации для базы данных с R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов