Создать бинарную матрицу из черепицы для LSH - PullRequest
0 голосов
/ 17 марта 2019

У меня есть список документов, где я создал черепицу для всех документов.Сейчас я создаю двоичную матрицу для этих документов, которая выглядит так:

     Universal              a   b   c   d
0   [new, year, eve]        1   0   0   1
1   [host, comics, enjoy]   0   1   0   1
2   [share, story, http]    1   0   1   1
3   [what, weather, going]  1   1   1   0

a, b, c, d являются моими документами, и если гонт присутствует в универсальном наборе и в то же время в a itпомещает 1 в соответствующую строку и столбец.

Проблема в том, что у меня много документов и большой размер набора универсальных блоков, а использование 2 для цикла требует 20+ часов для создания этой матрицы.есть ли быстрый способ пройти по нему

...