Bootstrap пример доверительного интервала в анализе корреляционной диаграммы рассеяния Python - PullRequest
0 голосов
/ 15 апреля 2020

Я новичок в методе bootstrap для корреляционного анализа и доверительного интервала наборов данных. Когда я читаю всю теорию, мне всегда интересно, где найти практический пример или какой-нибудь код, который показывает, как его использовать.

На этом форуме я нашел интересный вопрос, уже тесно связанный с тем, что Я ищу (https://stats.stackexchange.com/questions/59748/understanding-bootstrap-method-for-confidence-interval-of-correlation-coefficien), который снова дает теоретическое объяснение. Однако хороший пример графика приводится там в ответе 'Glen_b -Reinstate Monica' через несколько лет go. Кто-нибудь знает, как будет выглядеть Python -код для создания этого графика (см. Ниже или в ссылке)?

bootstrap scatter plot

An Пример коррелированного набора данных для работы с:

    import pandas as pd
    import matplotlib.pyplot as plt

    df_2 = pd.DataFrame({"A": [18,28,29,32,35,36,37,37,39,40,42,42,46,48,54,56,57,61,61,62,63,65],
 "B":  [9,13,17,15,23,21,24,28,26,30,29,36,38,42,40,48,40,51,54,50,51,57]})
    print(df_2)
    plt.scatter(df_2.iloc[:,0],df_2.iloc[:,1])

    plt.show()

Другой вопрос: всегда ли при начальной загрузке подразумевается, что у вас недостаточно данных и что вы создаете дополнительный набор данных на основе корреляции и данных в исходном наборе или также Означает ли это, что у вас есть огромный набор данных, из которого вы берете меньшие подвыборки, чтобы получить доверительный интервал для огромного набора данных, выполнив n корреляционных тестов для более мелких подвыборок?

...