Документация для RMySQL довольно хорошая, но она предполагает, что вы знаете основы SQL.Это:
- создание базы данных
- создание таблицы
- получение данных в таблицу
- получение данных из таблицы
Шаг 1 прост: в консоли MySQL просто «создайте базу данных DBNAME».Или из командной строки, используйте mysqladmin , или часто есть пользовательский графический интерфейс администратора MySQL.
Шаг 2 немного сложнее, так как вам нужно указать поля таблицы и их тип.Это будет зависеть от содержимого вашего CSV (или другого файла с разделителями).Простой пример будет выглядеть примерно так:
use DBNAME;
create table mydata(
id INT(11) NOT NULL AUTO_INCREMENT PRIMARY KEY,
height FLOAT(3,2)
);
, который говорит, что создайте таблицу с 2 полями: id , который будет первичным ключом (поэтому должен быть уникальным) и будет автоматически инкрементнымпо мере добавления новых записей;и высота , которая здесь указывается как число с плавающей запятой (числовой тип), всего 3 цифры и 2 после десятичной точки ( например 100.27).Важно, чтобы вы понимали типы данных .
Шаг 3 - существуют различные способы импорта данных в таблицу.Одним из самых простых является использование утилиты mysqlimport .В приведенном выше примере, при условии, что ваши данные находятся в файле с тем же именем, что и таблица (mydata), первый столбец - символ табуляции, а второй - переменная высоты (без строки заголовка), это будет работать:
mysqlimport -u DBUSERNAME -pDBPASSWORD DBNAME mydata
Шаг 4 - требует, чтобы вы знали, как выполнять запросы MySQL.Опять же, простой пример:
select * from mydata where height > 50;
означает «извлечь все строки (id + height) из таблицы mydata, где высота больше 50».
Как только вы освоите эти основы,Вы можете перейти к более сложным примерам, таким как создание 2 или более таблиц и выполнение запросов, объединяющих данные из каждой.
Затем - вы можете обратиться к руководству по RMySQL.В RMySQL вы устанавливаете соединение с базой данных, а затем используете синтаксис SQL-запроса для возврата строк из таблицы в качестве фрейма данных.Поэтому очень важно, чтобы вы получили SQL-часть - часть RMySQL проста.
В Интернете есть куча учебников по MySQL и SQL, включая "официальное" учебное пособие наСайт MySQL.Просто поищите в Google "mysql tutorial".
Лично я вообще не считаю 80 Мб большим набором данных;Я удивлен, что это вызывает проблемы с ОЗУ, и я уверен, что нативные функции R могут справиться с этим довольно легко.Но хорошо изучать новые навыки, такие как SQL, даже если они вам не нужны для этой проблемы.