Мне нужно установить sh, если есть связь между 2 столбцами из двух разных наборов данных с одним совпадающим столбцом, где;
Dataset1: bipartite: (M, DS)
M DS
m23 ds3
m23 ds67
m54 ds325
... ...
Dataset2: tripartite: (M, G, DG)
M G DG
m23 g6 dg32
m23 g8 dg1
m54 g32 dg65
... ... ...
Эти 2 набора данных имеют один общий столбец (т. Е. M ), а взаимосвязь между элементами показана ниже:
M ----affects----> G
M ----causes-----> DS
DG ----affects----> M
Основная цель: вычислить вероятность возможной связи / границы, которая может существовать между косвенно связанными столбцами (например, DG и DS ) через общий столбец ( M ).
Итак, для данного списка записей DS, как найти вероятность существования связи / фронта между выбранным DS и всеми другими DG
DS <---- ----> DG
If DS; (ds3, ds67), выходные данные должны быть такими:
element1 - element2 - вероятность / статистическое значение для обозначения существования прямой связи ИЛИ ссылка.
ds3 - dg32 - 100% (common M value)
ds3 - dg1 - 100% (common M value)
ds3 - dg65 - 43.66%
---
ds67 - dg32 - 100% (common M value)
ds67 - dg1 - 100% (common M value)
ds67 - dg65 - 55.12%
Я пытаясь закодировать это в Java, но решения на основе Python тоже могут работать.
Извините, я не слишком знаком с теорией графов, наглядные решения были бы очень полезны.
Спасибо.