У меня есть 3 категории слов, которые соответствуют разным типам психологических побуждений (потребность в силе, потребность в достижении и потребность в принадлежности). В настоящее время для каждого документа в моей выборке (n = 100000) я использую инструмент для подсчета количества слов в каждой категории и вычисляю оценку доли для каждой категории путем преобразования количества сырых слов в процентное соотношение на основе общего количества слов. используется в тексте.
n-power n-achieve n-affiliation
Document1 0.010 0.025 0.100
Document2 0.045 0.010 0.050
: : : :
: : : :
Document100000 0.100 0.020 0.010
Для каждого документа я хотел бы получить меру отличимости, которая указывает степень, в которой содержание документа по трем психологическим категориям отличается от среднего содержания всех документов (т. Е. прототип документа в моем образце). Есть ли способ сделать это?