Как добавить результаты расчета корреляции в новый столбец данных PANDAS для каждого элемента? - PullRequest
0 голосов
/ 03 февраля 2020

В настоящее время я работаю над данными Всемирного банка (Индикаторы мирового развития). Он довольно большой и все.

Я пытаюсь найти корреляцию между двумя группами элементов (кадры данных в pandas - Python).

Группы основаны на разных показателях развития, выбросах CO2 и ВВП.

Числа данных о выбросах CO2 и ВВП различались по размерам для стран, и мне пришлось их урезать, чтобы они имели одинаковые размеры , Вот как работает корреляция.

Теперь я пытаюсь разделить страны на группы на основе корреляции между значениями ВВП и CO2. Нефтяные, умеренные и малозависимые группы и проведите на них тест на анову. Проблема заключается в том, что я не знаю, как получить все корреляционные числа для каждой страны в кадре данных. Код ниже присваивает только первое значение каждой из стран. Есть ли способ сделать это, используя векторизацию

enter image description here

testDataframeGeneralCO2['Corr'] = np.corrcoef(testDataframeGeneralCO2['Value'], testDataframeGeneralGDP['Value'])[0][1]

И мои значения корреляции выглядят как на следующем рисунке. У меня одинаковая ценность для каждой страны, а это не то, чем я хочу заниматься. Есть предложения?

...