У меня есть реальный вопрос.
У меня есть база данных со следующей схемой:
пункт
бирка
item2tag
- item_id
- tag_id
- Количество
По сути, каждый предмет помечен как до 10 вещей с различным количеством. Есть 50000 предметов и 50000 тегов и около 500000 записей в items2tag. Я хотел бы найти, по одному предмету, «наиболее похожий» предмет.
Под «наиболее похожим» я подразумеваю элемент, который имеет наиболее похожую комбинацию тегов ... если что-то «круто» вдвое больше, чем «смешно», я хочу найти все остальные, которые почти круто "вдвое больше, чем" смешно ". Конечно, это должно относиться к 10 тегам, а не только к 2.
Есть идеи?