У меня есть несколько больших (200 ГБ - нормальные) плоских файлов данных, которые я хотел бы сохранить в какой-либо базе данных, чтобы к ним можно было быстро и интуитивно понятным образом организовать логическую организацию данных.Думайте об этом как о больших наборах очень длинных аудиозаписей, где каждая запись имеет одинаковую длину (сэмплы) и может рассматриваться как ряд.Один из этих файлов обычно содержит около 100 000 записей по 2 000 000 сэмплов в длину.
Было бы достаточно легко сохранить эти записи в виде строк данных BLOB в реляционной базе данных, но во многих случаях я хочузагружать в память только определенные столбцы всего набора данных (скажем, выборки 1000-2000).Какой самый эффективный для этого способ памяти и времени?
Пожалуйста, не стесняйтесь спрашивать, нуждаетесь ли вы в дополнительных разъяснениях относительно моих данных, чтобы дать рекомендацию.
РЕДАКТИРОВАТЬ: Чтобы уточнить размеры данных ... Один файл состоит из: 100 000 строк (записей) на 2 000 000 столбцов (выборок).Большинство реляционных баз данных, которые я исследовал, допускают максимум от нескольких сотен до нескольких тысяч строк в таблице.Опять же, я не очень разбираюсь в объектно-ориентированных базах данных, поэтому мне интересно, может ли что-то подобное здесь помочь.Конечно, любое хорошее решение очень приветствуется.Спасибо.
РЕДАКТИРОВАТЬ: Чтобы уточнить использование данных ... Данные будут доступны только через пользовательское приложение для настольного компьютера / распределенного сервера, которое я напишу.Есть метаданные (дата сбора, фильтры, частота дискретизации, владелец и т. Д.) Для каждого «набора» данных (который я до сих пор называл файлом 200 ГБ).Есть также метаданные, связанные с каждой записью (я надеялся, что это будет строка в таблице, чтобы я мог просто добавить столбцы для каждого фрагмента метаданных записи).Все метаданные согласованы.Т.е., если для одной записи существует определенный фрагмент метаданных, он также существует для всех записей в этом файле.Сами образцы не имеют метаданных.Каждый образец представляет собой 8 битов простых двоичных данных.