Как преобразовать данные пандасфрейм в словарь - PullRequest
1 голос
/ 19 октября 2019

Я смотрю на Преобразование Фрейма данных Pandas в словарь , чтобы получить инструкции по преобразованию моего фрейма данных в словарь. Тем не менее, я не могу изменить свой код, чтобы преобразовать вывод в словарь.

Ниже приведены мои коды.

import pandas as pd
import collections


governmentcsv = pd.read_csv('government-procurement-via-gebiz.csv',parse_dates=True) #read csv and it contain dates (parse_dates = true)
extract = governmentcsv.loc[:, ['supplier_name','award_date']] #only getting these columns

extract.award_date= pd.to_datetime(extract.award_date)

def extract_supplier_not_na_2015():
    notNAFifteen = extract[(extract.supplier_name != 'na') & (extract.award_date.dt.year == 2015)] #extract only year 2015
    notNAFifteen.reset_index(drop = True,inplace=True) #reset index
    notNAFifteen.index += 1 #and index start from 1
    #SortednotNAFifteen = collections.orderedDictionary(notNAFifteen)

    return notNAFifteen

print extract_supplier_not_na_2015()

ВЫХОД:

                                          supplier_name award_date
1                               RMA CONTRACTS PTE. LTD. 2015-01-28
2     TESCOM (SINGAPORE) SOFTWARE SYSTEMS TESTING PT... 2015-07-01
3                                  MKS GLOBAL PTE. LTD. 2015-04-24
4               CERTIS TECHNOLOGY (SINGAPORE) PTE. LTD. 2015-06-26
5                    RHT COMPLIANCE SOLUTIONS PTE. LTD. 2015-08-14
6                                   CLEANMAGE PTE. LTD. 2015-07-30
7                             SOLUTIONSATWORK PTE. LTD. 2015-11-23
8                                       Ufinity Pte Ltd 2015-05-04
9                                         NCS PTE. LTD. 2015-01-28

1 Ответ

0 голосов
/ 19 октября 2019

Я думаю, что я нахожу этот набор данных: https://data.gov.sg/dataset/government-procurement

В любом случае, вот код

import pandas as pd


df = pd.read_csv('government-procurement-via-gebiz.csv', 
                  encoding='unicode_escape', 
                  parse_dates=['award_date'], 
                  infer_datetime_format=True,
                  usecols=['supplier_name', 'award_date'], 
)

df = df[(df['supplier_name'] != 'Unknown') & (df['award_date'].dt.year == 2015)].reset_index(drop=True)

#Faster way:
d1 = df.set_index('supplier_name').to_dict()['award_date']

#Alernatively:
d2 = dict(zip(df['supplier_name'], df['award_date']))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...