Как рассчитать TP, TN, FP и FN с искрой и скалой, когда у меня есть прогнозы и файл достоверности (исходный график)? - PullRequest
0 голосов
/ 22 января 2019

У меня есть датафрейм, который представляет график.Он имеет следующую структуру:

a, b
b, c
b, d

Этот график представляет сеть соавторов.Я провел проверку грубой силы перед каждым узлом по отношению к каждому другому узлу, и если слияние (например, узлы a, b => являются бумагами) имеет сходство с jaccard> от заданного порога, я сохраняю это преимущество для своих результатов.Мои результаты - это та же структура данных, что и у первого.

Теперь я хочу получить количество TP, TN, FP и FN для моих прогнозов, чтобы вычислить точность, отзыв, точность и оценку F1.Как я могу получить эти значения?

Можно ли как-то рассчитать оценку F1 с помощью scala только с этими двумя фреймами данных (originalDF ивестииDD)?

Спасибо тебе!

...