Вопрос о мульти-зондовом локально-чувствительном хешировании - PullRequest
6 голосов
/ 04 апреля 2010

извините, что задаю такой добрый вопрос, но потому что мне действительно нужны некоторые рекомендации о том, как срочно использовать мульти-зондовый LSH, поэтому я сам не проводил много исследований. Я понимаю, что есть доступный вызов LSHKIT, который реализовал этот алгоритм, но у меня возникли проблемы, пытаясь понять, как его использовать. Прямо сейчас у меня есть несколько тысяч характерных векторов 296 измерений, каждое из которых представляет изображение. Вектор используется для запроса входного изображения пользователя, чтобы получить наиболее похожее изображение. Метод, который я использовал для определения расстояния между векторами, - это евклидово расстояние.

Я знаю, что это может быть довольно странный вопрос, но у вас, ребята, есть знания о том, как мне реализовать мультизондовый LSH? Я действительно очень благодарен за любой ответ или ответ.

- обновление -

Попытка создать модель для моих данных с помощью предоставленных инструментов fitdata, но, похоже, это не принимает мой файл. Формат, который я использовал для ввода, имеет следующий формат: размер с плавающей запятой: 4, количество данных: 20, размерность: 297, и мой массив из 297 массива измерения с плавающей точкой. Однако это дает мне эту ошибку

gsl: init_source.c:29: ERROR: matrix dimension n1 must be positive integer
Default GSL error handler invoked.
Aborted

Ребята, у вас есть идеи, как создать данные для фитданных?

- обновление -

Извините за позднее обновление, после попытки lsh. Вы можете использовать text2bin для форматирования данных для fitdata. Текстовый файл содержит вектор признаков изображения или аудиофайла, причем каждая строка представляет вектор. После этого используйте mplsh-tune для получения параметров M и W. Чтобы построить индекс, вы можете использовать инструмент сканирования для выборки набора требуемых запросов и использовать mplsh-run для получения индекса. Прямо сейчас я пытаюсь понять, как использовать индекс и как связать библиотеку с моим кодированием. У кого-нибудь есть идеи по этому поводу?

Ответы [ 2 ]

6 голосов
/ 04 апреля 2010

Позвольте мне вместо этого указать вам спектральное хеширование , которое пинает задницу LSH. Бонус: у них есть код matlab на их сайте , который вы можете использовать или проверить свою собственную реализацию. Кроме того, это гораздо проще реализовать.

0 голосов
/ 22 января 2016

Эта реализация Multi-probe LSH намного проще в использовании, чем библиотека C ++. Он также реализует LSH Forest.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...