Я новичок в методе bootstrap для корреляционного анализа и доверительного интервала наборов данных. Когда я читаю всю теорию, мне всегда интересно, где найти практический пример или какой-нибудь код, который показывает, как его использовать.
На этом форуме я нашел интересный вопрос, уже тесно связанный с тем, что Я ищу (https://stats.stackexchange.com/questions/59748/understanding-bootstrap-method-for-confidence-interval-of-correlation-coefficien), который снова дает теоретическое объяснение. Однако хороший пример графика приводится там в ответе 'Glen_b -Reinstate Monica' через несколько лет go. Кто-нибудь знает, как будет выглядеть Python -код для создания этого графика (см. Ниже или в ссылке)?
An Пример коррелированного набора данных для работы с:
import pandas as pd
import matplotlib.pyplot as plt
df_2 = pd.DataFrame({"A": [18,28,29,32,35,36,37,37,39,40,42,42,46,48,54,56,57,61,61,62,63,65],
"B": [9,13,17,15,23,21,24,28,26,30,29,36,38,42,40,48,40,51,54,50,51,57]})
print(df_2)
plt.scatter(df_2.iloc[:,0],df_2.iloc[:,1])
plt.show()
Другой вопрос: всегда ли при начальной загрузке подразумевается, что у вас недостаточно данных и что вы создаете дополнительный набор данных на основе корреляции и данных в исходном наборе или также Означает ли это, что у вас есть огромный набор данных, из которого вы берете меньшие подвыборки, чтобы получить доверительный интервал для огромного набора данных, выполнив n корреляционных тестов для более мелких подвыборок?