У меня есть матрица пользовательских предметов (400000 пользователей и 2000 предметов), форма которых составляет 400000 * 2000. Я пытаюсь вычислить сходство между пользователями.
Проблема заключается в том, что если я вычислю сходство косинус, полученная матрица будет 400000 * 400000, что займет до 1000 гигабайт памяти.
Как мне работать с этой штукой, так как у меня 32 гигабайт памяти?