Мнения о Solr и структурах пространственных данных для очень больших наборов данных - PullRequest
2 голосов
/ 24 августа 2011

Хорошо, так что я постараюсь сохранить это простым.Технические аспекты проблемы, нет проблем ...

Я ищу некоторые мнения относительно индексатора базы данных Solr.У меня около 25 миллионов предметов, которые нужно хранить в какой-то пространственной структуре.Это все записи ГИС с координатами, хранящимися как широта / долгота.Один из моих коллег использовал Solr для этой задачи, но я собираюсь провести некоторые тесты производительности для нескольких типов пространственных деревьев.В настоящее время мы используем mySQL для хранения всех наших данных, Solr для индексации, и я изучаю Postgres с PostGIS.Я предполагаю, что Solr использует какой-то многомерный B-Tree, но я могу ошибаться и ищу подтверждение этому.

Я также собираюсь запускать тесты с использованием этого набора данных...- B-Tree
- B-Tree (с индексом Мортона Хэша)- B-Tree (с индексом Гильберта Хэша)- BSP-Tree- Quad-Tree- KD-дерево- R-Tree

Я собираюсь написать либо модуль Apache, либо расширение MySQL / PostgreSQL на C ++ для каждого из этих тестов, и после реализации, как только мы примем решение.

IЯ просто ищу мнения / предложения по указанной реализации.

Спасибо

...