Как визуализировать ошибку в алгоритме кластеризации и создать отчет в python? - PullRequest
0 голосов
/ 12 февраля 2020

Я сгруппировал свои данные, скажем, в 3 кластера. Итак, у каждого кластера есть группа похожих пользователей, которые купили похожие товары. У каждого кластера есть образец. Теперь не каждый пользователь следует этому шаблону в точности так, как есть некоторые ошибки в модели, которые не могут быть на 100% точными.

Я должен создать отчет в python, который содержит информацию для каждого пользователя, такую ​​как

- userid
- How many items correctly matched the cluster pattern
- How many items did not match the cluster pattern due to error. 

. Я придерживался базового c подхода с использованием приведенного ниже псевдокода:

foreach cluster
  get cluster pattern
  foreach user under this cluster
     compare if the itemid of user and itemid in the cluster are same
     save such items in a list
     or
     save in another list  

Теперь, поскольку это огромный результат, мне нужно создать PDF-файл с результатами в python и сохранить его. Как я могу это сделать? Есть ли простые и альтернативные способы сделать это?

1 Ответ

0 голосов
/ 12 февраля 2020

В модуле sklearn имеется матрица путаницы, на самом деле я не знаю, можете ли вы получить из нее какой-либо отчет, но вы можете визуализировать ее. Здесь - это разговор по этой теме c, а здесь - официальная документация, надеюсь, он вам поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...