Python - Pandas Describe Throwing Error: неустранимый тип 'dict' - PullRequest
0 голосов
/ 25 октября 2018

Обновление: я использую пример кода из «Socrata Open Source API».Я отмечаю следующий комментарий в коде:

# First 2000 results, returned as JSON from API / converted to Python 
# list of dictionaries by sodapy.

Я не очень знаком с JSON.

Я скачал набор данных, создав DataFrame 'df' с большим количеством столбцов.

df = pd.DataFrame.from_records(results)

Когда я пытаюсь использовать метод description (), я получаю "TypeError:неприемлемый тип: 'dict' ":

df.describe()
...
TypeError: unhashable type: 'dict'

Как определить столбцы, которые генерируют эту ошибку?

ОБНОВЛЕНИЕ 2: По просьбе Юки я включаю выписку из df:

enter image description here

Ответы [ 2 ]

0 голосов
/ 31 июля 2019

Сегодня я столкнулся с той же проблемой и провел небольшое исследование о различных версиях pyarrow. здесь Я обнаружил, что в прошлом (<0,13) pyarrow записывал реальные столбцы данных для индекса с именами. В самой последней версии pyarrow не было бы данных столбцов, но диапазонИндекс метаданных вместо маркера.Это означает, что паркетные файлы, созданные с использованием более новой версии pyarrow, не могут быть прочитаны более старыми версиями.</p>

0 голосов
/ 26 октября 2018

Благодаря сообществу пользователей (h / t G Anderson) я собрал решение:

for i in df.columns:
if df[i].transform(type).any() == dict:
    df = df.drop(i, axis= 1)

transform (type) .any () проверяет все элементы в столбце i и удаляет столбецесли элемент имеет тип dict.

Спасибо всем!

...