Использование Pandas для чтения определенных данных из файла CSV в Python - PullRequest
0 голосов
/ 19 ноября 2018

У меня есть файл .CSV с несколькими столбцами.Мне нужно найти три самых высоких значения для Пасадены, Калифорния.Соответствующие столбцы - «Город поставщика», «Состояние поставщика» и «Средние выплаты по программе Medicare».Итак, мне нужно найти 3 самых высоких средних платежа по программе Medicare для Пасадены, штат Калифорния.

Код, который у меня есть, выглядит следующим образом:

print('The three largest numbers for Pasadena, CA are', nlargest(3, df['Average Medicare Payments']))

Я могу найти только три самых высоких значения из всех значений в столбце Средние выплаты по программе Medicare, а не фильтровать егопросто Пасадена, КалифорнияЕсть идеи?

1 Ответ

0 голосов
/ 19 ноября 2018
import pandas as pd

fpath = '/path/to/location.csv'

df = pd.read_csv(fpath, sep=',',
                 names=['Provider City',
                        'Provider State',
                        'Average Medicare Payments']
                 ) # you may need to specify 'skiprows' or 'header'

df['Average Medicare Payments'] = pd.to_numeric(df['Average Medicare Payments'])
df_Pasadena = df.loc[(df['Provider City']=='Pasadena') & (df['Provider State']=='CA')]
h3 = df_Pasadena.nlargest(3, 'Average Medicare Payments')
print('The three largest numbers for Pasadena, CA are', h3)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...