Чтобы вычислить соотношения между функциями и характеристиками Пирсона, вы должны использовать:
textstat_simil(x, method = “correlation”, margin = “features”)
В документации это довольно ясно показано, и по умолчанию используется метод корреляции.
Корреляция Пирсона не будет наиболее подходящей для двоичных данных, и в настоящее время мы не применяем методы Спирмена или другие методы корреляции, более подходящие для категориальных или порядковых данных. Однако вы всегда можете привести dfm к обычной матрице (используйте as.matrix()
), а затем использовать методы stats::cor()
, в том числе методы Спирмена.
Что касается последнего вопроса, мы используем стандартную реализацию этих мер. Если вы хотите получить более четкое представление о том, что они означают, я предлагаю задать вопрос о перекрестной проверке.