Я сгруппировал свои данные, скажем, в 3 кластера. Итак, у каждого кластера есть группа похожих пользователей, которые купили похожие товары. У каждого кластера есть образец. Теперь не каждый пользователь следует этому шаблону в точности так, как есть некоторые ошибки в модели, которые не могут быть на 100% точными.
Я должен создать отчет в python, который содержит информацию для каждого пользователя, такую как
- userid
- How many items correctly matched the cluster pattern
- How many items did not match the cluster pattern due to error.
. Я придерживался базового c подхода с использованием приведенного ниже псевдокода:
foreach cluster
get cluster pattern
foreach user under this cluster
compare if the itemid of user and itemid in the cluster are same
save such items in a list
or
save in another list
Теперь, поскольку это огромный результат, мне нужно создать PDF-файл с результатами в python и сохранить его. Как я могу это сделать? Есть ли простые и альтернативные способы сделать это?