Эффективное чтение CSV с соответствующими типами NaN - PullRequest
0 голосов
/ 09 июля 2020
• 1000 1006 * Насколько я понимаю, NaN - это dtype с плавающей запятой.

В столбце A, как лучше всего представлять пустые значения, сохраняя тот же dtype в столбце? Я также хотел бы изменить '-' на пустые значения. Аналогичным образом в столбце B NaN (float) смешивается с JFK (строка). Какой лучший способ решить эту проблему?

В конце концов я хочу сделать pd.read_csv (, dtype = {'A': str, 'B': str, 'C': np.int32}) или что-то вроде того. Поправьте меня, если я тоже ошибаюсь.

Изменить:

test = pd.read_csv('test.csv', na_values='--', dtype = {'A':str, 'B': str, 'C':np.float64})

in: test
out:    
    A        B       C
0   alice   JFK     0.25
1   bob     NaN     0.50
2   NaN     JFK     NaN
3   NaN     JFK     4.00
4   jeff    JFK     12.20
5   NaN     JFK     14.40


type(test.iloc[2]['A'])    # float
type(test.iloc[1]['A'])    # string

Это нормально, что это разные типы? Есть ли способ сделать оба строки? Или это даже не рекомендуется?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...