Математические проблемы с объектными данными в DataFrame - PullRequest
0 голосов
/ 06 мая 2019

Сначала я попытался прочитать какой-нибудь CSV-файл от Pandas. Однако я столкнулся с ошибкой:

DtypeWarning: столбцы (6) имеют смешанные типы. Укажите опцию dtype при импорте или установите low_memory = False.

Тогда я пытаюсь это: data=pd.read_csv('ALL.csv',dtype=object), который чудесно работает.

Мой следующий код:

data=pd.read_csv('ALL.csv',dtype=Object)
data['party'] = data.cand_nm.map(parties)
sort_by_occupation=data.pivot_table('contb_receipt_amt',index='contbr_occupation',columns='party',aggfunc='sum')

!! #parties на самом деле является dict, где data.cand_nm.unique_values это ключи, а значения должны быть Democrat or Republican

но Я пытался сделать математику, это не сработает

потому что тип значения Object не целое число:

Это мое испытание

z.Democrat[:5].values.astype(str).astype(int)

У меня ошибка:

OverflowError: Python int слишком велик для преобразования в C long

Кто-то рассказал мне о int64 bit, но лично мне все еще не очень ясно об этом. Буду признателен за любую помощь вместе с некоторыми объяснениями.

Для информации о наборе данных: https://raw.githubusercontent.com/benrolfs/pydata/master/ch09/P00000001-ALL.csv

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...