Я пытаюсь проанализировать некоторые статистические данные о доходах из бюро переписей.Я загрузил данные из: Данные переписи США
Как только я загрузил данные, я перенес их в excel, превратил в файл csv, а затем загрузил в python с помощью csv reader.Я хотел сделать простую гистограмму для визуализации данных, прежде чем перейти к более сложному статистическому анализу.Я все еще застрял на простой сюжетной линии.
Данные просты, первый столбец - это налоговые скобки, и это тип данных 'str'.Например: «до 5000 долларов», «от 5000 до 9999 долларов», ...
Во втором столбце указано количество домохозяйств и тип данных int.
Я продолжаю получатьошибка "неподдерживаемые типы операндов для +: 'int' и 'str'"
Я подумал, что, сделав массив размером с мой список строк, я мог бы построить данные и просто поставить налогинформация в скобках в 'xticks'.Что я делаю не так?
Я буквально использую тот же формат, что и этот: гистограмма
Я действительно незнаком с пандами и не хочуиспользуйте это, потому что это собирается открыть другую банку червей для меня.У кого-нибудь есть обычное исправление Python?
Пожалуйста, не пропускайте шаги и не думайте, что я умный.
Вот мой код:
import csv
import numpy as np
import matplotlib.pyplot as plt
# Make empty lists to put data into
brackets = []
households = []
# import raw data into lists
with open("income_data_2017.csv") as csvfile:
reader = csv.reader(csvfile)
for row in reader:
brackets.append(row[0])
households.append(row[1])
# Check that data was imported correctly
print brackets
print households
# Make an array the correct length for bar plot
x = np.arange(len(brackets))
# Plot the data using the string of income brackets
plt.bar(x, households, align='center', alpha=0.5)
plt.xticks(x, brackets)
plt.title('Distribution of Income in United States, 2017')
plt.ylabel('Households')
plt.xlable('Income Brackets')