Предложение по реализации Minhash с n перестановками - PullRequest
0 голосов
/ 10 ноября 2018

Я пытаюсь понять реализацию LSH. Я нашел это на stackoverflow

Можете ли вы предложить хорошую реализацию minhash?

и я пытаюсь следить за реализацией Duhaime.

В моем случае я хотел бы применить перестановку к minhash (как в инструменте datasketch), и я думаю, что эта реализация мне не подходит. Я уже начинаю с разреженной матрицы.

Кто-то может дать какое-нибудь предложение по поводу этой техники? не очень распространен, поэтому я не нахожу больше материала о реализации с Python.

Я надеюсь, что вы поможете.

1 Ответ

0 голосов
/ 30 ноября 2018

Не просто посмотрите на пример кода. Постарайтесь понять математику, стоящую за этим.

Очевидно, что maxhash должен работать аналогично. Или вы можете опустить 0 значений. Но тогда тебе стоит перепроверить математику.

...