Склеарн скорректировал взаимные информационные баллы на большой сет - PullRequest
0 голосов
/ 21 марта 2019
from sklearn.metrics import adjusted_mutual_info_score
import numpy as np

a = np.random.randint(0,2,30000000)
b = np.random.randint(0,2,30000000)

print(a.shape)
print(b.shape)

c = adjusted_mutual_info_score(a,b)

print(c)

Если вы запустите следующий код, вы получите:

RuntimeWarning: invalid value encountered in log
  log_outer = -np.log(outer) + log(pi.sum()) + log(pj.sum())
nan

Я не понимаю, почему это так, но если вы сделаете меньшие наборы из 1000 значений, все будет отлично. Может ли кто-нибудь объяснить мне, что происходит и как это исправить? Буду признателен за это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...