Как рассчитать точность / отзыв по ключевым словам в sklearn / Python? - PullRequest
0 голосов
/ 17 апреля 2019

У меня есть следующий код, который вычисляет точность / отзыв и оценку F1 для моей модели, которая определяет ключевые слова в документе:

from sklearn.metrics import classification_report
y_true = ['apple', 'orange', 'kiwi', 'pineapple', 'watermelon']
y_predicted = ['apple', 'orange', 'pear', 'mango', 'watermelon']
print(classification_report(y_true, y_predicted))

Как и в этом случае, слова выровнены друг относительно друга, яМожно рассчитать оценку F1 для этого.

Однако, что если моя модель не знает, в каком порядке разместить слова?Например, если я размещу их следующим образом:

from sklearn.metrics import classification_report
y_true = ['apple', 'orange', 'kiwi', 'pineapple', 'watermelon']
y_predicted = ['orange', 'apple', 'pear', 'watermelon', 'mango']
print(classification_report(y_true, y_predicted))

Я получу оценку zero для всех ключевых слов, даже если модель правильно определила 3 ​​из 5.

знаете, есть ли настройка, которую я могу сделать для этой метрики в sklearn, чтобы ее не волновал порядок сопоставляемых элементов (и их количество в этом отношении)?

Или, может быть, я мог бы использовать другую метрику?

...