Question

У меня есть файл .CSV с несколькими столбцами.Мне нужно найти три самых высоких значения для Пасадены, Калифорния.Соответствующие столбцы - «Город поставщика», «Состояние поставщика» и «Средние выплаты по программе Medicare».Итак, мне нужно найти 3 самых высоких средних платежа по программе Medicare для Пасадены, штат Калифорния.

Код, который у меня есть, выглядит следующим образом:

print('The three largest numbers for Pasadena, CA are', nlargest(3, df['Average Medicare Payments']))

Я могу найти только три самых высоких значения из всех значений в столбце Средние выплаты по программе Medicare, а не фильтровать егопросто Пасадена, КалифорнияЕсть идеи?

PJW · Answer 1 · 19 ноября 2018

import pandas as pd

fpath = '/path/to/location.csv'

df = pd.read_csv(fpath, sep=',',
                 names=['Provider City',
                        'Provider State',
                        'Average Medicare Payments']
                 ) # you may need to specify 'skiprows' or 'header'

df['Average Medicare Payments'] = pd.to_numeric(df['Average Medicare Payments'])
df_Pasadena = df.loc[(df['Provider City']=='Pasadena') & (df['Provider State']=='CA')]
h3 = df_Pasadena.nlargest(3, 'Average Medicare Payments')
print('The three largest numbers for Pasadena, CA are', h3)

Использование Pandas для чтения определенных данных из файла CSV в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Использование Pandas для чтения определенных данных из файла CSV в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов