Сначала я попытался прочитать какой-нибудь CSV-файл от Pandas. Однако я столкнулся с ошибкой:
DtypeWarning: столбцы (6) имеют смешанные типы. Укажите опцию dtype при импорте или установите low_memory = False.
Тогда я пытаюсь это: data=pd.read_csv('ALL.csv',dtype=object)
, который чудесно работает.
Мой следующий код:
data=pd.read_csv('ALL.csv',dtype=Object)
data['party'] = data.cand_nm.map(parties)
sort_by_occupation=data.pivot_table('contb_receipt_amt',index='contbr_occupation',columns='party',aggfunc='sum')
!! #parties на самом деле является dict, где data.cand_nm.unique_values
это ключи, а значения должны быть Democrat or Republican
но
Я пытался сделать математику, это не сработает
потому что тип значения Object не целое число:
Это мое испытание
z.Democrat[:5].values.astype(str).astype(int)
У меня ошибка:
OverflowError: Python int слишком велик для преобразования в C long
Кто-то рассказал мне о int64 bit, но лично мне все еще не очень ясно об этом. Буду признателен за любую помощь вместе с некоторыми объяснениями.
Для информации о наборе данных: https://raw.githubusercontent.com/benrolfs/pydata/master/ch09/P00000001-ALL.csv