Как суммировать столбец в python pandas с помощью функции .lo c - PullRequest
0 голосов
/ 28 мая 2020

Я пытаюсь переформатировать большой .csv файл для проекта. Я хочу суммировать значения столбца в кадре данных pandas, но только при соблюдении определенных условий. Я делаю это через функцию pandas .loc(). Это мой код:

countries = data['Country / territory of asylum/residence'].unique()
years = data['Year'].unique()


for country in countries:
  for year in years:
    temp_sum = data.loc[(data['Country / territory of asylum/residence'] == country) & (data['Year'] == year), 'decisions_recognized'].sum()
    print(temp_sum)

Я просмотрел другие примеры, где это, по-видимому, сработало, но я получаю ошибку типа: must be str, not int.

Это полная ошибка message

Я действительно не понимаю, в чем проблема, я был бы очень признателен за помощь.

1 Ответ

0 голосов
/ 28 мая 2020

Я действительно нашел обходной путь. В файле, с которым я работал, было несколько символов «*», которые я заменил на data.replace(), затем я преобразовал все в числовые данные через pd.to_numerical(). Так я не получал ошибок.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...