Я могу получить отрицательный отзыв, задавая этот тип вопроса, но мне интересно, как смоделировать конкретный c тип отношения данных.
Я хочу решить следующие две проблемы: A, Как часто определенный элемент c заказывается в общей сложности. B, Как часто этот указанный c элемент заказывался вместе с другими элементами.
Возможно, существуют специальные c алгоритмы машинного обучения для ответа на второй вопрос. Пока я только стремлюсь понять исторические данные и визуализировать их.
Итак, я могу представить таблицу фактов FT
ID Count
1 10
2 8
3 12
4 57
...
Соответствующая информация для группировки будет храниться в соответствующих таблицах затемнения, и я мог бы ответить на первый вопрос. Но я не уверен, как получить ответ на второй вопрос. Единственное решение, которое мне пришло бы в голову, - это «связать» элементы вместе и создать новую таблицу фактов или добавить ее к существующей, в которой, например, ID == 1 and ID == 2
составляет новый идентификатор, затем ID == 1 and ID == 3
составил бы другой ID и т. д. c.
В конечном счете, я хочу знать, что предмет A был заказан, скажем, 10 раз, пять раз как отдельный, один раз в комплекте с элементом B и четыре раза в комплекте с элементами C и D.