Предположим, у меня есть такие данные:
import pandas as pd
import statsmodels.formula.api as smf
sample_data = pd.read_csv('sample_data.csv',index_col = 0,header = 0)
sample_data
Я хочу изучить влияние возраста на графы.Если я хочу убрать влияние секса из моих данных, я бы выполнил двухэтапную регрессию, используя остатки моего счета против пола и регрессию остатков в зависимости от возраста, например:
sex_corrl = smf.ols('Counts ~ Sex',data = sample_data).fit()
sample_data['Residuals of Sex'] = list(sex_corrl.resid)
sex_adj_corrl = smf.ols('Q("Residuals of Sex") ~ Age',data = sample_data).fit()
sex_adj_corrl.summary()
Мой вопрос: если я возьму квадратный корень из значения R2 (значение 0,013) в конце двухэтапного регрессионного анализа, это Пирсона?Коэффициент корреляции?Если нет, то как бы я рассчитал коэффициент корреляции Пирсона с поправкой на пол?