Индексирование файла последовательности HDFS - PullRequest
3 голосов
/ 30 июня 2011

Какова лучшая библиотека / способ индексации очень большого файла последовательности (миллионы пар ключ / значение, где каждое значение может иметь разную длину, поэтому у вас не может быть схемы произвольного доступа)?

Спасибо за ваши предложения.

1 Ответ

0 голосов
/ 03 июля 2011

Задумывались ли вы о хранении данных в HBase? Он построен для такого рода вещей.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...